JP4352214B2 - 3次元位置姿勢の画像推定方法 - Google Patents

3次元位置姿勢の画像推定方法 Download PDF

Info

Publication number
JP4352214B2
JP4352214B2 JP2003118447A JP2003118447A JP4352214B2 JP 4352214 B2 JP4352214 B2 JP 4352214B2 JP 2003118447 A JP2003118447 A JP 2003118447A JP 2003118447 A JP2003118447 A JP 2003118447A JP 4352214 B2 JP4352214 B2 JP 4352214B2
Authority
JP
Japan
Prior art keywords
contour
image
function
angle
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003118447A
Other languages
English (en)
Other versions
JP2004326314A (ja
Inventor
浩一 播磨
等 佐藤
哲二 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimizu Corp
Original Assignee
Shimizu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimizu Corp filed Critical Shimizu Corp
Priority to JP2003118447A priority Critical patent/JP4352214B2/ja
Publication of JP2004326314A publication Critical patent/JP2004326314A/ja
Application granted granted Critical
Publication of JP4352214B2 publication Critical patent/JP4352214B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Image Processing (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、実空間における対象物の3次元の位置姿勢を、カメラ画像上で推定する3次元位置姿勢の画像推定方法に関する。
【0002】
【従来の技術】
従来より、カメラを用いた3次元位置姿勢推定の画像推定手法には、エッジ検出から線分、面などを抽出し幾何学計算により算出する方法、CAD画像データベースと画像照合することにより推定する方法、輪郭関数データベースと輪郭照合することにより推定する方法等が、一般に知られている。
エッジ検出から線分、面などを抽出し幾何学計算により算出する方法では、線分、面といった対象物のパーツのみで推定するため、推定精度を改善する必要がある。また、最終的に3次元位置を推定するには、対象物体の寸法が必要となるため、モデル照合手法と何ら変わりない。
また、CAD画像データベースと画像照合することにより推定する方法では、画像データベースとの相関を取る際に、非現実的なデータ量、計算時間が必要となるため、一般的には特徴点部分のみの照合が行われ、かつ逐次推定手法が用いられる。しかし、カメラ画像からの特徴点抽出は抽出精度に問題があり、逐次推定手法には推定の収束性が保証されないという問題がある。
さらに、輪郭関数データベースと輪郭照合することにより推定する方法では、CAD画像データベースと画像照合する方法と比較すると、大幅にデータ量、計算時間が削減されるが、その殆どが2次元平面のみでの扱いであり、3次元を扱う手法でも、3軸回転分の姿勢データを用意して3軸回転分の相関計算を必要とし冗長である。また、輪郭が凸型形状を前提としており、凹型形状への対処に改善の必要がある。
【0003】
上述する代表的な3つの手法の中でも、例えば、輪郭関数データベースと輪郭照合することにより推定する方法には、特許文献1から特許文献3に示すような手法が考案されている。
【0004】
【特許文献1】
特開平09−167234号公報
【特許文献2】
特開平10−63318号公報
【特許文献3】
特開平08−63604号公報
【0005】
【発明が解決しようとする課題】
特許文献1は、工場でのロボットによるピックアップ動作を対象としているため、対象は平面1軸回転だが、ロボット側は3軸回転を許しているため、相対的には3次元の姿勢推定となる。しかし、相対3次元の姿勢推定を行うのに、合計4次元の輪郭データを要するのでデータが冗長となるだけでなく、ロボット側の3軸分のデータには、2軸分で済むのでデータおよび相関計算も冗長となる。
特許文献2は、相関による角度検出で、マッチングにおいて位相を用いていないので計算が冗長で、そのために、用意するデータも2周期分必要とするためデータサイズも冗長となっている。
特許文献3は、2次元でのみ適用可能であるが、平面回転に関しては、輪郭関数の周期性を考慮し、輪郭関数の位相が推定回転角度に相当することを示している。これら輪郭関数の位相に着目する点は、データ量削減、計算速度の向上の点から大きなメリットを得られるが、特許文献3では、計算速度の向上を導くような構成が示されていない。
【0006】
上記事情に鑑み、本発明は、適切なデータベース化により最小限のデータ量で対象物体に関する輪郭関数データベースを作成するとともに、姿勢推定速度の高速化、姿勢推定精度の高精度化を実現することのできる、輪郭関数を用いた3次元位置姿勢の画像推定方法を提供することを目的としている。
【0007】
【課題を解決するための手段】
請求項1記載の3次元位置姿勢の画像推定方法は、対象物体の実空間における位置および姿勢を、カメラ画像上で推定する3次元位置姿勢の画像推定方法であって、前記対象物体の姿勢の推定には、3次元の数値データが与えられた対象物体を、カメラ光軸と一致させた所定の1軸の回転を最初のオイラー角として、他の2軸を回転して複数の姿勢から捉え、これら各々の姿勢からレンダリング画像を取得する第1の工程と、複数の該レンダリング画像各々から、対象物体の輪郭点を算出した後、輪郭関数を算定し、輪郭関数データベースを作成する第2の工程と、該第2の工程と同様の作業により、実空間の対象物体をカメラにより撮像した2次元のカメラ画像から該対象物体の輪郭関数を抽出した後、カメラ画像の輪郭関数と輪郭関数データベースに蓄積されたすべての輪郭関数との相関係数を高速フーリエ変換を用いて算定する第3の工程と、該第3の工程による算定結果から、対象物体の姿勢を推定する第4の工程により構成されることを特徴としている。
【0008】
請求項2記載の3次元位置姿勢の画像推定方法は、第1の工程では、カメラ光軸と一致させた所定の1軸の回転角を、1通りとすることを特徴としている。
【0009】
請求項3記載の3次元位置姿勢の画像推定方法は、第2の工程及び第3の工程で、前記輪郭関数が、輪郭距離を輪郭角度の関数で表されており、輪郭距離が、前記輪郭点と極座標の極からの距離として算定されるとともに、輪郭角度が、輪郭距離を、極を回転中心として極座標の原線からの回転角として算定され、前記輪郭点に、所定量の輪郭角度の変動域を含む同一輪郭角度上に存在する複数の輪郭点の中で、最外郭に位置する輪郭点のみを用いることを特徴としている。
【0010】
【発明の実施の形態】
以下、本発明に係る3次元位置姿勢の画像推定方法について、図1から図11に示す図を参照して、以下に詳述する。
本実施の形態では、カメラによる画像計測対象を衛星としたが、対象物体は衛星に特定するものではない。また、カメラは2次元画像用カメラのみではなく、3Dのレーザレンジファインダに対しても適用可能である。また、本実施の形態では、実空間における対象物体及びカメラを、対象物体及びカメラと称し、CAD空間における対象物体及びカメラを、CADモデル1、CADカメラと称する。
【0011】
図1に、CADモデル座標系Σの説明を示す。ΣはCADモデル1に固定された直交右手系座標系であり、幾何学重心Oを原点とし、図1のようなX、Y、Z軸の方向をとる。また、後の図4に示すような輪郭関数データベース作成のために、図1のような回転角θx、θy、θzを定義しておく。各軸右ねじの進む方向に対応する回転を正の回転方向とする。OはCADモデル1の幾何学重心あるいは質量重心である必要はなく任意性があるが、本実施の形態では幾何学重心として説明する。
【0012】
カメラ座標系は、透視変換の原理に基づき(実空間での)カメラの画面描画をモデル化した座標系であり、 カメラモデルはカメラと焦点距離、画角、画像サイズ(ピクセル数)を一致させておく。図2にカメラ座標系Σcの説明を示す。Σcはカメラに固定された直交座標系であり、カメラ視点Ocを原点とし、図2のようにカメラ画像2右方向を+Xc、カメラ画像2上方向を+Yc、カメラ画像2手前方向を+Zc軸の方向とする。また、oはカメラ画像2中心で、fは焦点距離を表す。従って、カメラ画像2はZc=−fの平面となる。
【0013】
(CADモデルのレンダリング画像の取得)
CADモデル1のレンダリング画像作成フローチャートを図3に示す。以下に手順を説明する。
【0014】
(幾何学重心のセット)
まず、図1に示すCADモデル1の幾何学重心Oを、図2に示すカメラ座標のZc軸上で、oより−Zc軸側の位置にセットする。
【0015】
(軸方向のセット)
次に、図1に示すCADモデル座標系の3つの座標軸方向+X、+Y、+Zを、図2に示すカメラ座標系の3つの座標軸方向+Xc、+Yc、+Zcに一致させる。+X、+Y、+Z軸方向はCADモデル1に固定の座標軸方向であるため、CADモデル1の回転により+Xc、+Yc、+Zc軸方向と異なるが、初期状態として一致させておく方が簡単である。
本実施の形態では、対応を解り易くするために+Xc→+X、+Yc→+Y、+Zc→+Zとしてだけであり、重要なのは、CADモデル1の最初の回転軸をカメラ光軸Zc軸方向にすることであり、CADモデル1の座標系の取り方によっては、+X軸でも+Y軸でも最初のオイラー角とすることが可能である。
【0016】
(X軸、Y軸回転ループ)
次に、種々のCADモデル1姿勢のレンダリング画像を取得するため、CADモデル1姿勢を変化させ、それぞれの姿勢についてのレンダリング画像を取得する。本実施の形態での姿勢表現はオイラー角を用いて行い、カメラ座標系から見て、図1に示すθz→θy→θxの順番での回転を採用するが、最初の回転がθzであることのみ必須であり、θz→θx→θy、θz→θx→θz、θz→θy→θzの順番でも構わない。ただし、レンダリング画像取得においては、最初のθzは回転させる必要は無く、一般的にはθzは初期状態(例えばゼロ)固定で良い。本実施の形態では簡単のためθzはゼロとして説明するが、任意に設定した所定の角度何れに設定しても良く、これにより本手法の一般性を損なうことは無い。
これより、図3に示すようにθx、θyのみ独立に変化させればよく、これが本手法におけるデータ量削減の特徴の1つである。θx、θyの姿勢変化量は、要求される画像処理での姿勢分解能により定まる。
【0017】
(輪郭関数のフーリエ変換の取得)
CADモデル1の輪郭関数のフーリエ変換の作成フローチャートを図4に示す。図4におけるFFTは高速フーリエ変換を意味する。以下に手順を説明する。
【0018】
(入力画像)
入力画像は、レンダリング画像、カメラ画像2のいずれかである。図4ではレンダリング画像として示してある。
【0019】
(輪郭点の取得)
まず、図3に示すレンダリング画像作成フローにより出力されたレンダリング画像から輪郭点Pを取得する。輪郭点Pの取得方法として、本実施の形態では例として、2値化→塗り潰し→輪郭点抽出、というシーケンスを示したが、この手法に限定されるものではない。
なお、本実施の形態では、2値化画像における背景は黒ピクセル、対象物体領域あるいはCADモデル1領域は白ピクセルとして扱う。また、塗り潰し画像とは、2値化された取得画像において、対象物体あるいはCADモデル1領域内における黒ピクセルの穴を白ピクセルに変更した(塗り潰した)画像を意味する。
【0020】
(塗りつぶし点の白ピクセル個数、重心座標取得)
塗り潰し画像取得時に、塗り潰し点の白ピクセル個数、重心座標を出力する。これらの出力は、輪郭関数の作成には直接は関係ないが、後の位置推定に用いるため、一連のフローの中で出力しておく。
なお、カメラ画像2を入力画像とし、カメラ画像2の取得に用いるカメラにレーザレンジファインダを適用する場合、レーザレンジファインダの奥行きデータのみを同一位置と見なしたデータに置き換えると、これはCCDカメラ画像に対応するデータとなる。従って、このレーザレンジファインダデータから上述する塗り潰し画像と同様の画像を得ることが可能である。
【0021】
(輪郭点の重心の取得)
次に、輪郭点の重心を取得する。本実施の形態では、重心は輪郭点の幾何学重心を意味するが、本手法で必要とする条件は、仮定した重心を原点とする輪郭関数が仮定した重心の位置変動に不感であること、輪郭関数の画面内回転が輪郭関数の位相差となることのみである。従って、塗り潰し点の幾何学重心、輪郭外接円中心などでも本手法に適用可能である。
【0022】
(輪郭点の極座標変換)
次に、図5に示すように、カメラ座標系の輪郭点を、重心Gを原点、つまり重心Gを極とする極座標に変換する。変換されたパラメータは、輪郭点と重心Gとの距離GP、GP、GP、Zc軸周りの+Xc軸からの角度θzである。本手法では、この輪郭点と重心との距離GP、GP、GPを輪郭距離、極座標の原線である輪郭点の+Xc軸からの角度θzを輪郭角度と呼ぶことにする。また、輪郭距離は輪郭角度の関数として表されるので、この関数を輪郭点関数と呼ぶことにする。
輪郭距離は図5に示すように同一輪郭角度に複数存在する場合があるが、P、Pのような窪んだ輪郭線上の輪郭点は、奥行き距離が遠くなると量子化誤差により内部の点に吸収されてしまう。そこで、本実施の形態では、輪郭距離は最外郭輪郭点PのGPのみを用いることとする。しかし、奥行きの変動範囲が少ない場合を扱う場合には、内郭輪郭点P、Pを扱うことにより精度向上が期待できる。本実施の形態では、奥行き距離範囲が大きい場合を想定し最外郭の輪郭距離のみ扱うが、奥行きの変動範囲が少ない場合などにおいて内郭輪郭点を扱いたい場合には、輪郭点関数を複素数化、あるいはベクトル化するなどの手段により、多変数として扱うことが可能である。
【0023】
(輪郭点の最外郭フィルター処理)
次に、輪郭点関数が最外郭輪郭点Pのみの関数になるようフィルタリンングする。輪郭点関数は、輪郭点を量子化したために、一般には微小輪郭角度範囲、つまり極微小な所定量の輪郭角度の変動域を含む同一輪郭角度で、大きく輪郭距離の異なる複数の輪郭点が存在することが有り得る。図5の輪郭点関数を図6に示す。横軸は輪郭角度θz(deg)、縦軸は輪郭距離GP(pixel)で、△は輪郭点を表し、図では輪郭点を直線補間している。図6から解るように、内郭輪郭点P、Pを有する輪郭点関数はノコギリ状になる。輪郭点関数のノコギリの下の刃の部分は、内郭輪郭点P、Pであり、フィルタリングにより削除する必要がある。別の考え方としては、最外郭輪郭点Pを削除し内郭輪郭点P、Pを残すことも考えられるが、内郭輪郭点P、Pは奥行きが遠くなると消滅し易いことから、内郭輪郭点P、Pを重視した輪郭点関数を選択することは得策ではない。
そこで、内郭輪郭点P、Pを削除する最外郭フィルターの一例を図8に示す。最外郭フィルターでは、まず実数レベルで同一輪郭角度の輪郭点があるかをチェックし、ある場合には最外郭輪郭点Pを採用する。次に、図6の輪郭点関数の折れ線の角度が急俊、かつ注目する輪郭点が凹点(すなわち極小点)の場合に内郭輪郭点P、Pと判定し、それ以外は最外郭輪郭点Pとする。そして、このフィルター処理1回で内郭輪郭点P、Pを全て削除できないことが多いため、何回かフィルタリングする。
図6の輪郭点関数を最外郭フィルター処理した輪郭点関数を図7に示す。内郭輪郭点P、Pが削除されていることが解る。
【0024】
(輪郭点の補間)
次に、輪郭点関数が一定間隔角度が刻みの関数になるよう補間する。これにより、輪郭点関数の輪郭角度刻みを統一することができる。
「0022」で取得した輪郭点関数は、一般に、一定間隔の輪郭角度の関数にはならない。輪郭関数のデータ数(輪郭角度の個数)は、後の「0026」で示すように、FFT(高速フーリエ変換)を使うことを考慮して、2の累乗で割り切れる数、あるいは素因数分解した場合に小さな素数のみに分解できる数に設定する方が有利である。従って、輪郭点の補間も、2の累乗で割り切れる数、あるいは素因数分解した場合に小さな素数のみに分解できる数に設定する方が有利である。
【0025】
(輪郭点の正規化)
次に、輪郭点関数を正規化して輪郭関数を取得する。輪郭点関数の輪郭距離は、奥行き距離に依存しているため、正規化することにより奥行き距離に不感にする効果がある。
【0026】
(輪郭関数のフーリエ変換)
最後に、輪郭関数をFFT(高速フーリエ変換)を用いてフーリエ変換する。フーリエ変換した理由は、輪郭関数の周波数スペクトルを輪郭の特徴量として用いることを目的としたものではなく、「0032」以降の姿勢推定における相関演算での演算量削減を目的としたものである。
【0027】
(輪郭関数のまとめ)
輪郭関数は次のような特徴を持つ。輪郭距離はZc軸の奥行き距離に反比例するが、正規化したことにより、Zc軸の奥行き距離に関して不感になる。また、Zc軸回転量θzは輪郭角度の位相差として表される。
図 4の輪郭関数のフーリエ変換の作成フローは、図 3のレンダリング画像作成フローにおける繰り返しループ内の処理である。すなわち、図 3のレンダリング画像作成フローで、θx,θyを変化させてレンダリング画像を1枚作成するごとに、θx,θyに対応する輪郭関数を作成する。従って、レンダリング画像は図 3のループ回数分作成するが,レンダリング画像用のデータ領域としては1枚分しか必要としない。
本手法では、2次元データであるレンダリング画像ではなく、1次元データの輪郭関数のフーリエ変換をデータベースとして用いるので、データ量は大幅に削減されている。
また,輪郭関数の特性よりZc軸回転量は輪郭角度の位相差として表されるので、θzを種々変化させた輪郭関数を作成する必要は無く1通りでよいので、姿勢3次元分の輪郭関数を用意する必要は無く、θx,θyの姿勢2次元分の組み合わせの輪郭関数を用意するだけでよいので、データ量は更に削減されている。これは,CADモデルデータベースの姿勢を,最初の回転がθzとするオイラー角で表すことにより得られるものである。
【0028】
(姿勢推定)
姿勢推定フローチャートを図9に示す。以下に手順を説明する。
【0029】
(畳み込み積、逆FFT(高速フーリエ変換)を用いた相関の骨子)
姿勢推定は、カメラ画像2の輪郭関数のフーリエ変換とデータベースの輪郭関数のフーリエ変換の畳み込み積、逆FFTにより推定する。
図9において、実質的な姿勢推定手法は、カメラ画像2の輪郭関数とデータベースの輪郭関数のFFTを用いた相関である。輪郭関数は正規化され単位ベクトルなので正規相関となり、相関値は最大で1となる。しかし、データベースにおける輪郭関数のフーリエ変換は、予め、データベース作成時に計算しておくことが可能である。従って、姿勢推定時には、輪郭関数のフーリエ変換のデータベースを利用することにより、姿勢推定時の演算量を削減している。
なお、データベース量をより削減することを主目的とするなら、カメラ画像2の輪郭関数とデータベースの輪郭関数をFFTを用いて相関演算する方が望ましい。しかし、本実施の形態では高速計算を優先させているため、データベース作成時に予め輪郭関数をフーリエ変換しておき、姿勢推定では輪郭関数のフーリエ変換のデータベースを利用することにより演算量の削減を図っている。
【0030】
(畳み込み積、逆FFT(高速フーリエ変換)を用いた相関演算手法)
θzcをカメラ画像2の輪郭角度ベクトル、f(θzc)をカメラ画像2の輪郭関数、θx、θyをデータベースのオイラー角、θzdをデータベースの輪郭角度ベクトル、f(θx,θy,θzd)をデータベースの輪郭関数とする。相関計算はデータベースの全てのθx、θyの組み合わせに対して行う。従って、1回の相関演算時にはf(θx,θy,θzd)は実質θzdのみの関数である。そして、f(θzc) 、f(θx,θy,θzd)は共に輪郭角度の周期関数であるため、FFT(高速フーリエ変換)の周期性をフルに生かした相関計算が可能である。FFTを用いた相関演算は以下のように行う。
Corr( )を相関演算子、θzpをθzcとθzdの位相差ベクトル、FFT( )をFFT演算子、Conj( )を共役複素数演算子、*を畳み込み積演算子、FFT−1( )を逆FFT演算子とすると、(1)式となり、カメラ画像2とデータベースの輪郭関数の相関は、輪郭角度の位相差θzpの関数となる。ただし、図9に示す姿勢推定では、データベースのFFT(f(θx,θy,θzd))を利用している。
なお、FFTは一般に2の累乗のデータ数の場合に非常に高速計算が可能であるが、データ数の素因数分解した素数が小さな値の場合にも同様に高速計算できる。従って、輪郭関数のデータ数(輪郭角度のデータ数)はそのように設定するほうが有利である。
【0031】
【数1】
Figure 0004352214
【0032】
(相関最大値の位相)
(1) 式の相関Corr(θzp )が、θx=θxmax、θy=θymax、位相差ベクトルθzpの成分θzmaxの時に最大になるとする。これはf(θzc)がf(θxmax,θymax,θzd)と比べ、輪郭角度の位相がθzmaxずれていることを表す。すなわち、 X、Y軸回転がθx=θxmax、θy=θymax、θz = 0の輪郭関数データベースをθzmaxシフトした輪郭関数が、カメラ画像2の輪郭関数に最もフィットすること表す。
一方、輪郭角度は図5のようにZc軸回転角度に相当し、「0015」よりデータベース作成時にZc軸はZ軸方向に一致させていること、θzをCADモデル1の最初のオイラー回転角としていることから、輪郭角度はCADモデル1のオイラー角θzに相当する。
以上より、θx=θxmax、θy=θymax、θz = 0のCADモデル1を、Zc軸周りにθzmax回転させた場合のレンダリング画像が、対象物体のカメラ画像2に最もフィットすることになる。
【0033】
(θx、θy、θzの推定値)
以上より、データベースの全てのθx、θyの組み合わせに対して相関を調べ、相関値が最大となるときのθx=θxmax、θy=θymax、θz =θzmaxを、カメラ画像2に最もフィットするCADモデル1のオイラー角として推定できる。
【0034】
(姿勢推定のまとめ)
輪郭関数の特性よりZc軸回転量は輪郭角度の位相差として表されるので,θzを種々変化させた相関計算する必要は無く,θx,θyの姿勢2次元分の輪郭関数データベースと相関計算するだけでよく,θzは相関値が最大となる位相として推定できる.これは,CADモデルデータベースの姿勢を,最初の回転がθzとするオイラー角で表すことにより得られるものである。
輪郭角度が位相として表現できるメリットは、データ量の削減、FFTを用いることによる高速計算の2つである。
なお、白ピクセル個数、重心座標は位置推定で用いるため、姿勢推定フローではスルーさせる。
【0035】
(姿勢の計算回数例)
以下に、1次元のデータ数NをFFT(高速フーリエ変換)計算効率の最良である2の累乗として、相関計算において、特に関心のある(複素数の)乗算回数について比較する。FFTを用いない相関での乗算回数(すなわちDFTの乗算回数)はNである。一方、データ数Nの場合のFFTの乗算回数が(1/2)NlogNであることを用いると、FFTを用いた相関での乗算回数は、(1)式においてCADモデル画像の輪郭関数のフーリエ変換はデータベースを利用することを考慮すると、
▲1▼FFTを1回行うので、(1/2)NlogN回。
▲2▼畳み込み積を1回行うので、N回。
▲3▼逆FFTを1回行うので、(1/2)NlogN回。
▲4▼合計で、N( logN + 1 )回。
▲5▼乗算回数の比率は、( logN + 1 ) / Nに減る。
【0036】
(位置推定)
位置推定フローチャートを図10に示す。本実施の形態では、位置とは対象物体あるいはCADモデル1の幾何学重心を意味するものとして説明する。以下に手順を説明する。
【0037】
(奥行き推定)
奥行き推定のフローチャートを図11に示す。奥行き推定は、透視変換の原理に基づき、対象物体の奥行き距離が1/r倍になった場合に、画像上の寸法がr倍になることを用いる。
寸法比率rは、塗り潰し画像の白ピクセル個数(塗り潰し領域のピクセル個数)が面積に対応することを用い、白ピクセル個数の比の平方根を用いて算出する。
【0038】
(推定姿勢での重心座標)
輪郭関数データベースでのCADモデル1のレンダリング画像の塗り潰し画像の画像重心位置は、θz =0に対応した重心位置である。従って、推定したθz =θzmaxに対応する重心位置を、θz =0に対応する重心をZc軸周りにθz回転させて算出する。
【0039】
(レンダリング画像のオフセット)
「0014」よりCADモデル1の幾何学重心Gの画像上座標は、データベースでは画像中心に位置する。一方、CADモデル1のレンダリング画像の塗り潰し画像から得た画像重心は、一般には画像中心にはない。従って、CADモデル1の幾何学重心の画像上座標に対するレンダリング画像重心のオフセットを求めておく。
【0040】
(カメラ画像重心のオフセット)
レンダリング画像と同様に、一般にカメラ画像2の塗り潰し画像から得た画像重心は、一般には対象物体の幾何学重心の画像上座標とは一致しない。従って、レンダリング画像重心のオフセットに寸法比率rをかけて、対象物体の幾何学重心の画像上座標に対応するカメラ画像2の画像重心のオフセットを推定する。
【0041】
(カメラ画像の推定重心座標)
カメラ画像2上での推定重心座標は、カメラ画像2の塗り潰し画像から得た画像重心から、カメラ画像重心のオフセットを差し引きいて推定する。そして、実空間での推定重心座標は、透視変換の原理に基づき、推定奥行き距離zと焦点距離fの比をかけて推定する。
【0042】
(本発明のまとめ)
本手法のデータベース量削減、姿勢推定の高速化などの効果は、CADモデル1の姿勢表現を、Z軸方向をZc軸方向と一致させ、かつθzを最初のオイラー角としたこと、による派生効果である。
ただし、本実施の形態では、対応を解り易くするために+Xc→+X、+Yc→+Y、+Zc→+Zとしてだけであり、重要なのは、CADモデル1の最初の回転軸をカメラ光軸Zc軸方向にすることであり、CADモデル1の座標系の取り方によっては、+X軸でも+Y軸でも最初のオイラー角とすることが可能である。
【0043】
本手法では、輪郭関数を扱う上での基本となる輪郭点は、対象とする奥行き距離範囲に応じてフィルター処理を行う必要があることを指摘し、その一手法を示した。
【0044】
本発明は、輪郭関数という1次元データベースを用いるためデータ量が非常に少なくて済む。さらに、本発明の特徴として、CADモデル1の姿勢表現を、Z軸方向をZc軸方向と一致させ、かつθzを最初のオイラー角としたことにより、θzは位相として表現できるので、θzの組み合わせを考慮した輪郭関数のフーリエ変換データべースを用意する必要が無く大幅にデータ量が削減される。
【0045】
CADモデル1の姿勢表現を、Z軸方向をZc軸方向と一致させ、かつθzを最初のオイラー角としたことにより、Xc,Yc軸回転した輪郭関数のフーリエ変換データベースとの相関計算のみでよく、Zc軸回転は位相として推定可能である。このように、Zc軸回転が位相として表現されるため、周期性のあるデータの高速計算に有利なFFT(高速フーリエ変換)を用いることができる。従って、姿勢推定を高速計算することが可能である。
【0046】
姿勢推定の高速化により、回転角度分解能を小さく設定した姿勢推定が可能になり、この結果、姿勢推定精度の高精度化が可能になる。また、一般に、位置推定精度は姿勢推定精度に依存するため、姿勢精度の高精度化は位置推定精度の精度向上に直結すると考えられ、その意義は大きい。
【0047】
重心オフセットを用いることにより、対象物体の幾何学重心位置の面内方向x、yの精度向上が期待できる。これは姿勢推定の高精度化により、対象物体の幾何学重心の画像上位置に対する対象物体の画像重心のオフセットの推定精度が向上することによる。
なお、幾何学重心位置のzはオーソドックスな手法を用いており、本手法における重心位置のx、yの推定は、幾何学重心位置のzの推定精度にも依存する。
【0048】
本発明では、奥行き距離の変動が余り大きくない場合において、内郭輪郭点が存在する場合に、輪郭関数を複素数化、あるいはベクトル化することにより、複雑な凹型輪郭形状に対しても対応できる。
【0049】
また、本発明では、奥行き距離の変動範囲を広く取りたい場合において、対象物体の奥行き距離が遠くなった場合に内郭輪郭点が消滅しやすいことに着目し、最外郭輪郭点のみ残す最外郭フィルターを提案した.
【0050】
【発明の効果】
輪郭関数という1次元データベースを用いるためデータ量が非常に少なくて済む。さらに、本手法の特徴として、CADモデルの姿勢表現を、所定の一軸をカメラ光軸と一致させ、かつ所定の一軸の回転を最初のオイラー角としたことにより、所定の一軸の回転は位相として表現できるので、所定の一軸の回転の組み合わせを考慮した輪郭関数のフーリエ変換データべースを用意する必要が無く大幅にデータ量が削減される。
【0051】
CADモデルの姿勢表現を、所定の一軸をカメラ光軸と一致させ、かつ所定の一軸の回転を最初のオイラー角としたことにより、他の2軸により回転した輪郭関数のフーリエ変換データベースとの相関計算のみでよく、所定の一軸の回転は位相として推定可能である。
所定の一軸の回転が位相として表現されるため、周期性のあるデータの高速計算に有利なFFT(高速フーリエ変換)を用いることができる。従って、姿勢推定を高速計算することが可能である。
【0052】
姿勢推定の高速化により、回転角度分解能を小さく設定した姿勢推定が可能になり、この結果、姿勢推定精度の高精度化が可能になる。一般に、位置推定精度は姿勢推定精度に依存するため、姿勢精度の高精度化は位置推定精度の精度向上に直結すると考えられ、その意義は大きい。
【0053】
重心オフセットを用いることにより、対象物体の幾何学重心位置の面内方向x、yの精度向上が期待できる。これは姿勢推定の高精度化により、対象物体の幾何学重心の画像上位置に対する対象物体の画像重心のオフセットの推定精度が向上することによる。
なお、幾何学重心位置のzはオーソドックスな手法を用いており、本手法における重心位置のx、yの推定は、幾何学重心位置のzの推定精度にも依存する。
【図面の簡単な説明】
【図1】 本発明に係るCADモデル座標系の説明図である。
【図2】 本発明に係るカメラ座標系の説明図である。
【図3】 本発明に係るレンダリング画像作成フローチャートである。
【図4】 本発明に係る輪郭関数のフーリエ変換の作成フローチャートである。
【図5】 本発明に係る輪郭点の極座標変換の説明図である。
【図6】 本発明に係る最外郭フィルター無しの場合の輪郭点関数を示す図である。
【図7】 本発明に係る最外郭フィルター有りの場合の輪郭点関数を示す図である。
【図8】 本発明に係る最外郭フィルターのフローチャートの一例を示す図である。
【図9】 本発明に係る姿勢推定のフローチャートを示す図である。
【図10】 本発明に係る位置推定のフローチャートを示す図である。
【図11】 本発明に係る奥行き推定のフローチャートを示す図である。
【符号の説明】
1 CADモデル
2 カメラ画像
3 輪郭画像

Claims (3)

  1. 対象物体の実空間における位置および姿勢を、カメラ画像上で推定する3次元位置姿勢の画像推定方法であって、
    前記対象物体の姿勢の推定には、
    3次元の数値データが与えられた対象物体を、カメラ光軸と一致させた所定の1軸の回転を最初のオイラー角として、他の2軸を回転して複数の姿勢から捉え、これら各々の姿勢からレンダリング画像を取得する第1の工程と、
    複数の該レンダリング画像各々から、対象物体の輪郭点を算出した後、輪郭関数を算定し、輪郭関数データベースを作成する第2の工程と、
    該第2の工程と同様の作業により、実空間の対象物体をカメラにより撮像した2次元のカメラ画像から該対象物体の輪郭関数を抽出した後、カメラ画像の輪郭関数と輪郭関数データベースに蓄積されたすべての輪郭関数との相関係数を高速フーリエ変換を用いて算定する第3の工程と、
    該第3の工程による算定結果から、対象物体の姿勢を推定する第4の工程により構成されることを特徴とする3次元位置姿勢の画像推定方法。
  2. 請求項1に記載の3次元位置姿勢の画像推定方法において、
    第1の工程では、カメラ光軸と一致させた所定の1軸の回転角を、1通りとすることを特徴とする3次元位置姿勢の画像推定方法。
  3. 請求項1または2に記載の3次元位置姿勢の画像推定方法において、
    第2の工程及び第3の工程で、前記輪郭関数が、輪郭距離を輪郭角度の関数で表されており、輪郭距離が、前記輪郭点と極座標の極からの距離として算定されるとともに、輪郭角度が、輪郭距離を、極を回転中心として極座標の原線からの回転角として算定され、
    前記輪郭点に、所定量の輪郭角度の変動域を含む同一輪郭角度上に存在する複数の輪郭点の中で、最外郭に位置する輪郭点のみを用いることを特徴とする3次元位置姿勢の画像推定方法。
JP2003118447A 2003-04-23 2003-04-23 3次元位置姿勢の画像推定方法 Expired - Fee Related JP4352214B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003118447A JP4352214B2 (ja) 2003-04-23 2003-04-23 3次元位置姿勢の画像推定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003118447A JP4352214B2 (ja) 2003-04-23 2003-04-23 3次元位置姿勢の画像推定方法

Publications (2)

Publication Number Publication Date
JP2004326314A JP2004326314A (ja) 2004-11-18
JP4352214B2 true JP4352214B2 (ja) 2009-10-28

Family

ID=33497984

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003118447A Expired - Fee Related JP4352214B2 (ja) 2003-04-23 2003-04-23 3次元位置姿勢の画像推定方法

Country Status (1)

Country Link
JP (1) JP4352214B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4687948B2 (ja) * 2004-10-29 2011-05-25 ソニー株式会社 ディジタル信号処理装置、ディジタル信号処理方法及びプログラム並びに認証装置
US8335666B2 (en) * 2006-09-01 2012-12-18 Intelligent Manufacturing Systems International Three-dimensional model data generating method, and three dimensional model data generating apparatus
KR100966875B1 (ko) * 2006-09-26 2010-06-29 삼성전자주식회사 전방위 영상을 이용한 로봇의 위치 결정방법
JP5013961B2 (ja) * 2007-05-21 2012-08-29 キヤノン株式会社 位置姿勢計測装置及びその制御方法
KR101370288B1 (ko) 2007-10-24 2014-03-05 삼성전자주식회사 이미지 신호의 압축 방법 및 장치
JP5462662B2 (ja) * 2010-02-25 2014-04-02 キヤノン株式会社 位置姿勢計測装置、物体識別装置、位置姿勢計測方法及びプログラム
JP5554654B2 (ja) * 2010-07-13 2014-07-23 キヤノン電子株式会社 画像処理方法、携帯情報端末及びプログラム
JP2013158845A (ja) * 2012-02-01 2013-08-19 Seiko Epson Corp ロボット装置、画像生成装置、画像生成方法、および画像生成プログラム
CN110108202B (zh) * 2019-03-01 2021-07-06 太原理工大学 一种液压支架位姿检测装置和方法
CN110544279B (zh) * 2019-08-26 2023-06-23 华南理工大学 一种结合图像识别和遗传算法精配准的位姿估计方法
CN112991526A (zh) * 2021-05-18 2021-06-18 创新奇智(北京)科技有限公司 一种图像的三维姿态标注的方法、装置、电子设备及介质

Also Published As

Publication number Publication date
JP2004326314A (ja) 2004-11-18

Similar Documents

Publication Publication Date Title
EP3201881B1 (en) 3-dimensional model generation using edges
CN107705333B (zh) 基于双目相机的空间定位方法及装置
US6819318B1 (en) Method and apparatus for modeling via a three-dimensional image mosaic system
Dorai et al. Registration and integration of multiple object views for 3D model construction
JP4352214B2 (ja) 3次元位置姿勢の画像推定方法
CN107507277B (zh) 三维点云重构方法和装置、服务器及可读存储介质
CN109215118B (zh) 一种基于图像序列的增量式运动结构恢复优化方法
WO2015006224A1 (en) Real-time 3d computer vision processing engine for object recognition, reconstruction, and analysis
CN102289803A (zh) 图像处理设备、图像处理方法及程序
CN116921932A (zh) 焊接轨迹识别方法、装置、设备及存储介质
KR100922273B1 (ko) 영상 시퀀스로부터 선택된 중요 영상을 이용한 3차원모델의 재구성 방법
KR100944293B1 (ko) 단일 축 회전 영상들로부터의 효율적인 전 방향 3차원모델의 재구성 방법
JP2006195790A (ja) レンズ歪推定装置、レンズ歪推定方法、及びレンズ歪推定プログラム
CN115053260A (zh) 数据集生成方法、神经网络生成方法和场景模型构建方法
CN115937002B (zh) 用于估算视频旋转的方法、装置、电子设备和存储介质
Rosenbush et al. Super-resolution enhancement of flash LADAR range data
JP2007034964A (ja) カメラ視点運動並びに3次元情報の復元及びレンズ歪パラメータの推定方法、装置、カメラ視点運動並びに3次元情報の復元及びレンズ歪パラメータの推定プログラム
US20230007962A1 (en) Determining camera rotations based on known translations
Bülow et al. Using robust spectral registration for scan matching of sonar range data
CN108230377B (zh) 点云数据的拟合方法和系统
CN113140031A (zh) 三维影像建模系统、方法及应用其的口腔扫描设备
Murino et al. 3D mosaicing for environment reconstruction
CN117649409B (zh) 基于机器视觉的滑台自主限位系统、方法、装置及介质
CN116580074B (zh) 一种基于多传感器融合的三维重建方法
JP6548789B2 (ja) 位置姿勢計測装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090616

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090714

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120807

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120807

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130807

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140807

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees