JP2014149582A - 変換行列推定装置、変換行列推定方法、及びプログラム - Google Patents

変換行列推定装置、変換行列推定方法、及びプログラム Download PDF

Info

Publication number
JP2014149582A
JP2014149582A JP2013016631A JP2013016631A JP2014149582A JP 2014149582 A JP2014149582 A JP 2014149582A JP 2013016631 A JP2013016631 A JP 2013016631A JP 2013016631 A JP2013016631 A JP 2013016631A JP 2014149582 A JP2014149582 A JP 2014149582A
Authority
JP
Japan
Prior art keywords
transformation matrix
template
unit
estimation
camera pose
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013016631A
Other languages
English (en)
Other versions
JP5937977B2 (ja
Inventor
Tatsuya Osawa
達哉 大澤
Jun Shimamura
潤 島村
Yukinobu Taniguchi
行信 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013016631A priority Critical patent/JP5937977B2/ja
Publication of JP2014149582A publication Critical patent/JP2014149582A/ja
Application granted granted Critical
Publication of JP5937977B2 publication Critical patent/JP5937977B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】被写体に対するカメラポーズの精度を向上させる。
【解決手段】被写体が撮影された一連の画像データを入力する画像入力部と、画像データにおける特徴点を追跡しワールド座標系における特徴点の三次元座標とカメラのカメラポーズとを取得する三次元座標・カメラポーズ取得部と、被写体の少なくとも一部分を含む複数のテンプレート画像と類似する領域を画像データにおいて検出するテンプレート検出部と、テンプレート検出部が検出した領域と三次元座標・カメラポーズ取得部が取得した特徴点の三次元座標とに基づいてテンプレート画像の三次元座標を推定するテンプレート三次元位置推定部と、テンプレート画像の三次元座標に基づいてワールド座標系から被写体座標系に変換する変換行列を推定する変換行列推定部と、変換行列が推定された後に取得された特徴点の三次元座標及びカメラポーズに基づいて変換行列を更新する変換行列更新部とを備える。
【選択図】図1

Description

本発明は、変換行列推定装置、変換行列推定方法、及びプログラムに関する。
コンピュータビジョン分野では、現実環境を仮想情報で補強する拡張現実感に関する研究が多く行われている。例えば、次のような研究成果が実現されている。
カメラで撮影された動画像から各フレームにおいて特徴的な点(以下、特徴点という)を追跡することで、カメラの三次元空間中の位置及び姿勢と、特徴点の三次元座標とを同時に獲得するvSLAM(visual Simultaneous Localization and Mapping)という方法が提案されている(例えば、非特許文献1)。
また、被写体の一部分を示したテンプレート画像を事前に用意しておき、動画像においてテンプレート画像の検出を行うとともに、検出したテンプレート画像の三次元座標をvSLAMで出力された特徴点の三次元座標を利用して求めることにより、被写体に対するカメラの位置及び姿勢を推定し、これを利用して動画像に仮想情報を重畳する方法も提案されている(例えば、非特許文献2)。
vSLAMにより得られる特徴点の三次元座標とテンプレート画像の検出とを組み合わせた方法において、仮想情報を動画像に重畳する際の精度は、vSLAMにより得られるカメラの位置及び姿勢を被写体に対するカメラの位置及び姿勢に変換する際に用いる変換行列の精度に依存する。この変換行列の推定に用いるテンプレート画像の三次元座標には誤差が含まれているため、変換行列を安定的に推定することが難しい。
そこで、非特許文献2に記載されている方法では、vSLAMにより得られるカメラの位置及び姿勢の変換行列を推定し、推定した変換行列の変化(原点位置と回転角との変化)が所定の閾値より小さくなった場合に変換行列が収束したと判定している。判定後は、推定した変換行列を用いて、vSLAMにより得られるカメラの位置及び姿勢を変換することにより、被写体に対するカメラの位置及び姿勢の推定を行っている。以下、カメラの位置及び姿勢をカメラポーズという。
Jun SHIMAMURA, Masashi MORIMOTO, and Hideki KOIKE, "Robust vSLAM for dynamic scenes", Proc.12th IAPR Conference on Machine Vision Applications, June 2011, p.344-347 島村潤、森本正志、小池秀樹、「設備保守支援向けARのための部分テンプレート検出とvSLAMの併用によるオブジェクト座標系へのレジストレーション」、画像の認識・理解シンポジウム(MIRU2011)、2011年7月、p.1370−1376
ところで、vSLAMから出力される特徴点の三次元座標は、バンドル調整や特徴点の信頼度などの指標を利用することにより、時間の経過とともに誤差が小さくなり安定してくるという特徴がある。換言すると、特徴点の三次元座標の取得を開始してから直ぐに得られた三次元座標は安定していない。そのため、不安定な三次元座標に基づいて変換行列を推定した場合には、局所解に収束して正確な変換行列が得られないことがある。局所解に収束した変換行列を用いると、カメラポーズが誤って推定され、動画像に重畳する仮想情報の位置がずれて現実環境を仮想情報で補強できないという問題がある。
本発明は、上記問題を解決すべくなされたもので、その目的は、被写体に対するカメラポーズの精度を向上させることができる変換行列推定装置、変換行列推定方法、及びプログラムを提供することにある。
上記問題を解決するために、本発明は、ワールド座標系から被写体を基準とした被写体座標系への変換行列を推定する変換行列推定装置において、前記被写体が撮影された一連の画像データを入力する画像入力部と、前記一連の画像データにおける特徴点を追跡し、前記ワールド座標系における特徴点の三次元座標と該画像データを撮影したカメラのカメラポーズとを取得する三次元座標・カメラポーズ取得部と、予め用意された複数のテンプレート画像であって前記被写体の少なくとも一部分を含む複数のテンプレート画像と類似する領域を前記画像データにおいて検出するテンプレート検出部と、前記テンプレート検出部が検出した領域と、前記三次元座標・カメラポーズ取得部が取得した特徴点の三次元座標とに基づいて、前記テンプレート画像の三次元座標を推定するテンプレート三次元位置推定部と、前記テンプレート三次元位置推定部が推定した前記テンプレート画像の三次元座標に基づいて、前記ワールド座標系から前記被写体座標系に座標を変換する変換行列を推定する変換行列推定部と、前記変換行列推定部が変換行列を推定した後に前記三次元座標・カメラポーズ取得部が取得した特徴点の三次元座標及びカメラポーズに基づいて、前記変換行列を更新する変換行列更新部と、を備えることを特徴とする変換行列推定装置である。
また、本発明は、上記発明の変換行列推定装置において、前記変換行列更新部は、変換行列に対応する前記テンプレート画像の領域及びカメラポーズと、該変換行列が推定された後に前記三次元座標・カメラポーズ取得部が取得した特徴点の三次元座標に基づいて、変換行列を再度推定する変換行列再推定部を有し、前記変換行列再推定部が推定した変換行列を更新後の変換行列にすることを特徴とする。
また、本発明は、上記発明の変換行列推定装置において、前記変換行列更新部は、前記変換行列再推定部が再度推定した変換行列と、前記変換行列推定部が変換行列を推定した後に前記テンプレート三次元位置推定部が推定した前記テンプレート画像の三次元座標に基づいて前記変換行列推定部が新たに推定した新たな変換行列とを評価し、評価結果に基づいて、いずれかの変換行列を更新後の変換行列にする変換行列評価部を更に有することを特徴とする。
また、本発明は、ワールド座標系から被写体を基準とした被写体座標系への変換行列を推定する変換行列推定装置が行う変換行列推定方法において、前記被写体が撮影された一連の画像データを入力する画像入力ステップと、前記一連の画像データにおける特徴点を追跡し、前記ワールド座標系における特徴点の三次元座標と前記画像データを撮影したカメラのカメラポーズとを取得する第1の三次元座標・カメラポーズ取得ステップと、予め用意された複数のテンプレート画像であって前記被写体の少なくとも一部分を含む複数のテンプレート画像と類似する領域を前記画像データにおいて検出するテンプレート検出ステップと、前記テンプレート検出ステップにおいて検出した領域と、前記第1の三次元座標・カメラポーズ取得ステップにおいて取得した特徴点の三次元座標とに基づいて、前記テンプレート画像の三次元座標を推定するテンプレート三次元位置推定ステップと、前記テンプレート三次元位置推定ステップにおいて推定した前記テンプレート画像の三次元座標に基づいて、前記ワールド座標系から前記被写体座標系に座標を変換する変換行列を推定する変換行列推定ステップと、前記変換行列推定ステップにおいて推定した変換行列に対応する画像データの後に続く画像データにおける前記特徴点を追跡し、前記ワールド座標系における特徴点の三次元座標と該画像データを撮影したカメラのカメラポーズとを取得する第2の三次元座標・カメラポーズ取得ステップと、前記第2の三次元座標・カメラポーズ取得ステップにおいて取得した特徴点の三次元座標及びカメラポーズに基づいて、前記変換行列を更新する変換行列更新ステップと、を有することを特徴とする変換行列推定方法である。
また、本発明は、上記発明の変換行列推定装置としてコンピュータを機能させるためのプログラムである。
この発明によれば、変換行列を推定した後に取得された特徴点の三次元座標及びカメラポーズに基づいて変換行列を更新する。一旦取得した変換行列を、取得後の特徴点の三次元座標及びカメラポーズに基づいて更新することにより、逐次得られる画像データとのずれを抑えることができ、変換行列の精度を向上させることができる。これにより、この変換行列に基づいて推定した、被写体に対するカメラポーズの精度を向上させることができる。
本発明に係る実施形態における変換行列推定装置10の構成を示すブロック図である。 同実施形態における変換行列更新部16の構成を示すブロック図である。 同実施形態において用いるワールド座標系(Wx,Wy,Wz)と被写体座標系(Ox,Oy,Oz)との一例を示す図である。 同実施形態における変換行列推定装置10が行う変換行列推定処理を示すフローチャートである。 同実施形態における変換行列更新部16が行う変換行列更新処理を示すフローチャートである。 図4のステップS102において取得された特徴点の一例を示す図である。 テンプレート画像の一例と、テンプレート画像に類似するテンプレート領域の検出結果を示す図である。 図7(A)のテンプレート画像bのテンプレート領域に含まれる特徴点の分布を示す図である。 被写体としての通信機器に作業位置を示す仮想情報を重畳して表示している画像例を示す図である。
以下、図面を参照して、本発明の実施形態における換行列推定装置、変換行列推定方法、及びプログラムを説明する。
図1は、本発明に係る実施形態における変換行列推定装置10の構成を示すブロック図である。変換行列推定装置10は、取得した動画像又は予め取得した動画像に基づいて、当該動画像に撮影されている被写体に対するカメラポーズを推定するための変換行列を出力する装置である。変換行列推定装置10は、画像入力部11、三次元座標・カメラポーズ取得部12、テンプレート検出部13、テンプレート三次元位置推定部14、変換行列推定部15、変換行列更新部16、特徴点三次元座標記憶部21、及び、テンプレート領域・カメラポーズ記憶部22を備えている。
画像入力部11は、各時刻に撮影された一連の画像データを含む動画像を取得する。例えば、画像入力部11には、デジタルカメラやビデオカメラ等の画像センサを有する撮像装置が用いられる。なお、画像入力部11は、動画像を構成する一連の画像データを取得できればよく、予め撮影された動画像を取得する装置などであってもよい。なお、以下の説明において、動画像を撮影したカメラの内部パラメータ(焦点距離や投影中心)は事前にキャリブレーション済みであり、変換行列推定装置10に記憶されているものとする。
三次元座標・カメラポーズ取得部12は、画像入力部11により取得された各画像データから特徴点を抽出し、一連の画像データにおける特徴点の位置を追跡することにより、カメラポーズと特徴点の三次元座標とを取得する。三次元座標・カメラポーズ取得部12は、バンドル調整を行い三次元点とカメラポーズとを再投影誤差が最小となるように最適化を行う。三次元座標・カメラポーズ取得部12は、各画像データにおいて取得した特徴点の三次元座標を画像データごとに特徴点三次元座標記憶部21に記憶させる。三次元座標・カメラポーズ取得部12は、取得したカメラポーズをテンプレート三次元位置推定部14に出力する。
テンプレート検出部13は、予め定められた複数のテンプレート画像を記憶している。テンプレート画像には、被写体の少なくとも一部分が含まれている。テンプレート検出部13は、画像入力部11により取得される画像データにおいて、テンプレート画像と類似している領域であるテンプレート領域を検出する。テンプレート検出部13には、少なくとも3つのテンプレート画像が記憶されている。テンプレート領域は、画像上における座標の組み合わせ、あるいは、代表点の座標と当該座標を基準にした領域の範囲を示す情報との組み合わせからなる。
テンプレート三次元位置推定部14は、三次元座標・カメラポーズ取得部12が取得したカメラポーズと、特徴点三次元座標記憶部21に記憶されている特徴点の三次元座標とに基づいて、テンプレート検出部13が検出したテンプレート領域の三次元座標を推定する。具体的には、テンプレート三次元位置推定部14は、現時刻において取得されたカメラポーズを用いて、画像データが示す画像上に特徴点を投影する投影演算を行い、画像上に再投影された特徴点のうち、テンプレート領域ごとにテンプレート領域に含まれる特徴点の三次元座標からテンプレート領域の三次元座標を推定する。テンプレート三次元位置推定部14は、推定したテンプレート領域の三次元座標と、当該三次元座標の推定に用いたカメラポーズ及びテンプレート領域とを含むテンプレート情報を変換行列推定部15に出力する。
変換行列推定部15は、テンプレート三次元位置推定部14から出力されるテンプレート情報に含まれるテンプレート領域の三次元座標に基づいて、ワールド座標系から被写体を基準にした被写体座標系に座標を変換する変換行列OTCを推定する。変換行列推定部15は、推定した変換行列OTCと、当該変換行列OTCの推定に用いたテンプレート情報とを含む変換行列情報を変換行列更新部16に出力する。
変換行列更新部16は、現時刻に推定された変換行列、すなわち変換行列情報に含まれる変換行列OTCの推定精度の評価を行う。変換行列更新部16は、現時刻において外部に出力している変換行列OTAの再推定と推定精度の評価とを行う。変換行列更新部16は、変換行列OTCと変換行列OTAとそれぞれの評価結果に基づいて、変換行列OTAの更新を行う。変換行列OTAの再推定は、変換行列OTAに対応するテンプレート領域及びカメラポーズと、特徴点三次元座標記憶部21に記憶されている現時刻における特徴点の三次元座標とに基づいて行われる。変換行列更新部16は、更新後の変換行列OTAの推定に用いたテンプレート領域及びカメラポーズをテンプレート領域・カメラポーズ記憶部22に記憶させる。
特徴点三次元座標記憶部21には、三次元座標・カメラポーズ取得部12が取得する特徴点の三次元座標が画像データごとに記憶される。テンプレート領域・カメラポーズ記憶部22には、変換行列更新部16により更新された変換行列OTAに対応するテンプレート領域及びカメラポーズが記憶される。
図2は、本実施形態における変換行列更新部16の構成を示すブロック図である。変換行列更新部16は、変換行列再推定部161、及び、変換行列評価部162を有している。変換行列再推定部161は、テンプレート領域・カメラポーズ記憶部22に記憶されているテンプレート領域及びカメラポーズと、特徴点三次元座標記憶部21に記憶されている現時刻における特徴点の三次元座標とに基づいて、変換行列OTAを再度推定する。変換行列評価部162は、変換行列推定部15から入力される変換行列OTCと、再度推定された変換行列OTAとそれぞれの推定精度を評価し、推定精度が良い変換行列を新たな変換行列OTAにする更新処理を行う。変換行列評価部162は、新たな変換行列OTAを推定する際に用いたテンプレート領域及びカメラポーズを、テンプレート領域・カメラポーズ記憶部22に記憶させる。
ここで、本実施形態の変換行列推定装置10における処理において用いるワールド座標系と被写体座標系とについて説明する。図3は、本実施形態において用いるワールド座標系(Wx,Wy,Wz)と被写体座標系(Ox,Oy,Oz)との一例を示す図である。ワールド座標系は、任意の位置、予め定めた位置、又は特徴点のいずれかを基準として定められる座標である。被写体座標系は、被写体の任意の位置を基準として定められる座標系である。図3においては、直方体の被写体の角を基準(原点)として、各辺の方向にX軸、Y軸、及びZ軸を有する座標系を被写体座標系としている。なお、三次元座標・カメラポーズ取得部12が取得する特徴点の三次元座標及びカメラポーズは、ワールド座標系における座標及び方向である。
以下、本実施形態の変換行列推定装置10が行う変換行列推定処理について説明する。ここでは、テンプレート検出部13には3つのテンプレート画像が予め記憶されており、変換行列推定部15は、3つのテンプレート画像に対応するテンプレート領域の三次元座標から変換行列を推定する場合について説明する。
図4は、本実施形態における変換行列推定装置10が行う変換行列推定処理を示すフローチャートである。
変換行列推定装置10において変換行列推定処理が開始されると、カメラにより撮影された画像データImを画像入力部11が入力する(ステップS101)。
三次元座標・カメラポーズ取得部12は、画像入力部11が入力した画像データImから特徴点を追跡し、特徴点の三次元座標(X,Y,Z)及びカメラポーズ(Tx,Ty,Tz,φ,θ,ψ)をワールド座標系で取得し、バンドル調整を行って特徴点の三次元座標(X,Y,Z)及びカメラポーズ(Tx,Ty,Tz,φ,θ,ψ)の最適化を行う(ステップS102)。このような特徴点の三次元座標(X,Y,Z)やカメラポーズ(Tx、Ty,Tz,φ、θ、ψ)を取得する処理は、vSLAMと呼ばれる公知の技術(例えば、非特許文献1)により行うことができる。
テンプレート検出部13は、画像入力部11が入力した画像データImから3つのテンプレート画像それぞれに類似するテンプレート領域を検出する(ステップS103)。画像データImからテンプレート画像と類似している領域の検出は、例えば、2画像の輝度値の差分の絶対値を表すSAD関数などの評価関数を用いて一番類似度の高い部分を検出することにより行う。テンプレート検出部13は、3つのテンプレート画像それぞれに類似する各テンプレート領域をTm1、Tm2、Tm3として出力する。
テンプレート三次元位置推定部14は、ステップS102において取得されたカメラポーズに基づいて、特徴点三次元座標記憶部21に記憶されている特徴点を画像データIm上に投影する。テンプレート三次元位置推定部14は、ステップS103において検出されたテンプレート領域Tm1、Tm2、Tm3ごとに画像データIm上に投影した各特徴点のうちテンプレート領域に含まれる特徴点を検出する。テンプレート三次元位置推定部14は、各テンプレート領域Tm1、Tm2、Tm3に含まれる特徴点の集合を集合FP1、FP2、FP3とする。テンプレート三次元位置推定部14は、各集合FP1、FP2、FP3に含まれる特徴点の三次元座標に基づいて、3つのテンプレート画像それぞれの三次元座標を推定する(ステップS104)
ステップS104における処理は、例えば、以下のようにして行われる。特徴点の画像データIm上へ投影する投影計算は、次式(1)により行うことができる。
m=A(R|T)X …(1)
式(1)において、行列Aはカメラの内部パラメータからなる3×3のカメラ内部行列である。行列(R|T)はカメラの位置及び姿勢で構成される3×4のカメラ外部行列である。行列Rはカメラポーズの回転行列であり、行列Tはカメラポーズの並進行列である。行列Xは特徴点の三次元座標(X,Y,Z)に成分「1」を追加して得られる4×1の行列(X,Y,Z,1)である。行列mは画像データIm上の投影点を示す3×1の行列m=(x,y,z)である。
式(1)を用いて算出した画像データIm上の投影点の三次元座標を示す行列mにおいて、第三成分zで第一成分xと第二成分yとを除算して得られる(u,v)=(x/z,y/z)が画像データIm上の投影座標である。各特徴点の投影座標に基づいて、テンプレート領域Tm1、Tm2、Tm3に含まれる特徴点の集合FP1、FP2、FP3を取得する。集合FP1、FP2、FP3ごとに、集合に含まれる特徴点の三次元座標の平均値を算出し、算出した三次元座標の平均値をテンプレート画像の三次元座標とする。これにより、各テンプレート画像の三次元座標を推定することができる。
変換行列推定部15は、ステップS104において推定された3つのテンプレート画像の三次元座標に基づいて、ワールド座標系から被写体座標系への変換行列OTCを算出し、被写体に対するカメラポーズを推定する(ステップS105)。変換行列OTCの算出は、公知の技術を用いて行うことができる。例えば、非特許文献2に記載されているように、被写体座標系の原点を1つ目のテンプレート画像の三次元座標として定義し、変換行列の並進成分を求める。また、3つのテンプレート画像の各三次元座標で張られる平面の法線ベクトルと、1つ目のテンプレート画像と2つ目のテンプレート画像との三次元座標で構成される直線ベクトルとを利用して回転成分を求める。これにより、変換行列OTCを算出することができる。
変換行列更新部16は、ステップS105において算出された変換行列OTCの推定精度と、前回推定された変換行列OTAの推定精度とに基づいて、外部に出力する変換行列を更新する。変換行列更新部16は、更新後の変換行列に対応するテンプレート領域及びカメラポーズをテンプレート領域・カメラポーズ記憶部22に記憶させる(ステップS106)。
変換行列更新部16は、推定処理を継続するか否かを判定し(ステップS107)、継続する場合(ステップS107:YES)には処理をステップS101に戻し、ステップS101からステップS107までの処理が繰り返される。一方、継続しない場合(ステップS107:NO)には処理を終了させる。なお、推定処理を継続するか否かの判定には、例えば、変換行列推定装置10に対するユーザの入力操作に基づいて行うようにしてもよい。
以下、ステップS106における変換行列を更新する処理について詳しく説明する。図5は、本実施形態における変換行列更新部16が行う変換行列更新処理を示すフローチャートである。
変換行列更新部16において更新処理が開始されると、変換行列評価部162は、変換行列推定部15が推定した変換行列OTCの推定精度を評価する(ステップS201)。推定精度の評価は、例えば、予め既知である被写体座標系におけるテンプレート領域Tm1、Tm2それぞれの三次元座標に対して、変換行列OTCの逆行列をかけてワールド座標系の三次元座標P1、P2に変換する。式(1)を用いて画像データIm上に三次元座標P1、P2を投影し、画像データIm上における投影点とテンプレート領域の所定の点との距離、すなわち再投影誤差を算出する。この再投影誤差により変換行列OTCの推定精度を評価することができる。なお、変換行列OTCを評価する際に用いるカメラポーズは、変換行列OTCを推定する際に利用したカメラポーズである。
変換行列評価部162は、現在外部に出力している変換行列OTAが存在するか否かを判定する(ステップS202)。換言すると、ステップS202では、変換行列推定処理における1回目のステップS106(変換行列更新処理)であるか否かを判定する。1回目の変換行列更新処理では、変換行列OTAが存在しないので後述する変換行列OTAに対する評価を行わない。
変換行列OTAが存在しない場合(ステップS202:無)、変換行列評価部162は処理をステップS206に進める。
変換行列OTAが存在する場合(ステップS202:有)、変換行列再推定部161は、変換行列OTAを推定した際に用いたテンプレート領域及びカメラポーズをテンプレート領域・カメラポーズ記憶部22から読み出す。変換行列再推定部161は、読み出したテンプレート領域及びカメラポーズと、特徴点三次元座標記憶部21に記憶されている現時刻の特徴点の三次元座標とに基づいて、3つのテンプレート画像の三次元座標を推定する(ステップS203)。テンプレート画像の三次元座標を推定する処理は、ステップS104における処理と同じである。しかし、特徴点は毎時刻(毎画像データ)において増減することがあり、特徴点の三次元座標もバンドル調整などによって最適化される。そのため、ステップS203において得られるテンプレート画像の三次元座標は、以前に変換行列OTAを推定したときと異なる。
変換行列再推定部161は、ステップS203において推定された3つテンプレート画像の三次元座標に基づいて、変換行列OTAを再度推定する(ステップS204)。変換行列再推定部161による変換行列OTAを推定する処理は、ステップS105における変換行列OTCを算出する処理と同じである。
変換行列評価部162は、ステップS204において推定された変換行列OTAの推定精度を評価する(ステップS205)。変換行列OTAの推定誤差を評価する処理は、ステップS201における処理と同じであり、変換行列OTAの逆行列を用いて再投影誤差を算出することにより行われる。
変換行列評価部162は、変換行列OTCの推定精度と変換行列OTAの推定精度とを比較し、推定精度の良い変換行列を新たな変換行列OTAとすることにより変換行列OTAを更新し、新たな変換行列OTAを外部に出力する(ステップS206)。推定精度の良い変換行列は、例えば、再投影誤差の絶対値が小さい変換行列とする。また、変換行列評価部162は、新たな変換行列OTAに対応するテンプレート領域及びカメラポーズをテンプレート領域・カメラポーズ記憶部22に記憶させる。なお、変換行列OTAが存在しない場合(ステップS202からステップS206に処理が進められた場合)、変換行列評価部162は、変換行列OTCを新たな変換行列OTAとすることにより変換行列OTAを更新する。
このように、変換行列推定処理では、変換行列推定装置10が、逐次取得される画像データに基づいて変換行列OTCを算出する(ステップS102〜ステップS105)とともに、現在の変換行列として採用している変換行列OTAを現在の画像データに基づいて再推定する(ステップS203〜ステップS204)。また、変換行列OTCと変換行列OTAとの2つの変換行列それぞれの推定精度を評価し、推定精度の高い変換行列を新たな変換行列として更新する。これらの処理を変換行列推定装置10が繰り返して行う。これにより、変換行列推定装置10は、推定精度の良い変換行列を得ることができる。この変換行列に基づいて被写体に対するカメラポーズを推定することにより、カメラポーズの精度を向上させることができる。
また、一連の画像データから得られる特徴点の三次元座標が安定せずに変換行列が一時的に局所解に収束したとしても、逐次得られる特徴点の三次元座標に基づいて、変換行列を更新することにより局所解に陥ることなく、変換行列のずれを低減して推定精度を向上させることができる。そして、変換行列推定装置10が出力する変換行列に基づいたカメラポーズを用いることにより、一連の画像データからなる動画像の被写体に仮想情報を精度良く重畳することができ、仮想情報による現実環境の補強を安定して行うことができる。
なお、本実施形態における変換行列推定処理では、3つのテンプレート画像を用いる構成について説明したが、4つ以上のテンプレート画像を用いて行うようにしても良い。また、変換行列推定装置10内に各機能部が備えられる構成について説明したが、ネットワーク等を介して通信可能に接続された装置に各機能部が分散して備えられていても良い。
ここで、図6から図9を参照して、本実施形態における変換行列推定装置10が出力する変換行列を用いた画像処理の一例を示す。以下に示す例では、1台のカメラから得られた動画像を処理して、被写体に対するカメラポーズを推定し、画像データ上に仮想情報を重畳表示する。また、図4に示した変換行列推定処理に沿って説明する。
画像処理が開始されると変換行列推定装置10はカメラから画像データを入力する(ステップS101)。
入力された画像データからカメラポーズと特徴点の三次元座標を取得する(ステップS102)。図6は、図4のステップS102において取得された特徴点の一例を示す図である。図6(A)には、入力された画像データに検出した特徴点を示す点を重畳した画像が示されている。図6(B)には、取得した特徴点とカメラポーズとを三次元座標上に示した画像が示されている。
変換行列推定装置10は、入力された画像データに対してテンプレート検出を行う(ステップS103)。図7は、テンプレート画像の一例と、テンプレート画像に類似するテンプレート領域の検出結果を示す図である。図7(A)には、3つのテンプレート画像a、b、cが示されている。ここでは、ネジを含む2つの画像と、数字を含む画像との3つのテンプレート画像を予め用意している。図7(B)にはカメラで入力した画像データにおいて図7(A)に示した3つのテンプレート画像に類似するテンプレート領域を示す矩形が示されており、テンプレート画像に対応する領域が検出されていることが分かる。
変換行列推定装置10は、特徴点を画像データ上に再投影し、領域内に含まれる特徴点の集合FP1、FP2、FP3を取得し、テンプレート画像の三次元座標を取得する(ステップS104)。図8は、図7(A)のテンプレート画像bのテンプレート領域に含まれる特徴点の分布を示す図である。これらの特徴点の座標の平均値を算出することにより、テンプレート画像bの三次元座標を取得する。
変換行列推定装置10は、テンプレート画像の三次元座標を用いて、ワールド座標系から被写体座標系に座標を変換する変換行列を算出する(ステップS105)。算出された変換行列を用いて、被写体に対するカメラポーズを精度良く推定することができる。
以上の処理を繰り返す変換行列推定装置10が出力する変換行列を用いて被写体座標系におけるカメラポーズを推定し、このカメラポーズを用いることにより、図9に示すように被写体に仮想情報をずれなく重畳させることが可能となる。図9は、被写体としての通信機器に作業位置を示す仮想情報を重畳して表示している画像例を示す図である。
このように、本実施形態の変換行列推定装置10が出力する変換行列を用いることにより、画像データ上の被写体に応じて仮想情報を精度良く重畳させることができ、違和感やぶれの少ない拡張現実感を実現することができる。
なお、図1に示した変換行列推定装置10が備える各機能部の一部もしくは全部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより変換行列推定処理及び変換行列更新処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。更に「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。更に、前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
カメラ等により得られた画像データに仮想情報を重畳表示する装置やシステム等に適用することができる。
10…変換行列推定装置
11…画像入力部
12…三次元座標・カメラポーズ取得部
13…テンプレート検出部
14…テンプレート三次元位置推定部
15…変換行列推定部
16…変換行列更新部
21…特徴点三次元座標記憶部
22…テンプレート領域・カメラポーズ記憶部
161…変換行列再推定部
162…変換行列評価部

Claims (5)

  1. ワールド座標系から被写体を基準とした被写体座標系への変換行列を推定する変換行列推定装置において、
    前記被写体が撮影された一連の画像データを入力する画像入力部と、
    前記一連の画像データにおける特徴点を追跡し、前記ワールド座標系における特徴点の三次元座標と該画像データを撮影したカメラのカメラポーズとを取得する三次元座標・カメラポーズ取得部と、
    予め用意された複数のテンプレート画像であって前記被写体の少なくとも一部分を含む複数のテンプレート画像と類似する領域を前記画像データにおいて検出するテンプレート検出部と、
    前記テンプレート検出部が検出した領域と、前記三次元座標・カメラポーズ取得部が取得した特徴点の三次元座標とに基づいて、前記テンプレート画像の三次元座標を推定するテンプレート三次元位置推定部と、
    前記テンプレート三次元位置推定部が推定した前記テンプレート画像の三次元座標に基づいて、前記ワールド座標系から前記被写体座標系に座標を変換する変換行列を推定する変換行列推定部と、
    前記変換行列推定部が変換行列を推定した後に前記三次元座標・カメラポーズ取得部が取得した特徴点の三次元座標及びカメラポーズに基づいて、前記変換行列を更新する変換行列更新部と、
    を備えることを特徴とする変換行列推定装置。
  2. 請求項1に記載の変換行列推定装置において、
    前記変換行列更新部は、
    変換行列に対応する前記テンプレート画像の領域及びカメラポーズと、該変換行列が推定された後に前記三次元座標・カメラポーズ取得部が取得した特徴点の三次元座標に基づいて、変換行列を再度推定する変換行列再推定部を有し、
    前記変換行列再推定部が推定した変換行列を更新後の変換行列にする
    ことを特徴とする変換行列推定装置。
  3. 請求項2に記載の変換行列推定装置において、
    前記変換行列更新部は、
    前記変換行列再推定部が再度推定した変換行列と、前記変換行列推定部が変換行列を推定した後に前記テンプレート三次元位置推定部が推定した前記テンプレート画像の三次元座標に基づいて前記変換行列推定部が新たに推定した新たな変換行列とを評価し、評価結果に基づいて、いずれかの変換行列を更新後の変換行列にする変換行列評価部
    を更に有することを特徴とする変換行列推定装置。
  4. ワールド座標系から被写体を基準とした被写体座標系への変換行列を推定する変換行列推定装置が行う変換行列推定方法において、
    前記被写体が撮影された一連の画像データを入力する画像入力ステップと、
    前記一連の画像データにおける特徴点を追跡し、前記ワールド座標系における特徴点の三次元座標と前記画像データを撮影したカメラのカメラポーズとを取得する第1の三次元座標・カメラポーズ取得ステップと、
    予め用意された複数のテンプレート画像であって前記被写体の少なくとも一部分を含む複数のテンプレート画像と類似する領域を前記画像データにおいて検出するテンプレート検出ステップと、
    前記テンプレート検出ステップにおいて検出した領域と、前記第1の三次元座標・カメラポーズ取得ステップにおいて取得した特徴点の三次元座標とに基づいて、前記テンプレート画像の三次元座標を推定するテンプレート三次元位置推定ステップと、
    前記テンプレート三次元位置推定ステップにおいて推定した前記テンプレート画像の三次元座標に基づいて、前記ワールド座標系から前記被写体座標系に座標を変換する変換行列を推定する変換行列推定ステップと、
    前記変換行列推定ステップにおいて推定した変換行列に対応する画像データの後に続く画像データにおける前記特徴点を追跡し、前記ワールド座標系における特徴点の三次元座標と該画像データを撮影したカメラのカメラポーズとを取得する第2の三次元座標・カメラポーズ取得ステップと、
    前記第2の三次元座標・カメラポーズ取得ステップにおいて取得した特徴点の三次元座標及びカメラポーズに基づいて、前記変換行列を更新する変換行列更新ステップと、
    を有することを特徴とする変換行列推定方法。
  5. 請求項1から請求項3のいずれか一項に記載の変換行列推定装置としてコンピュータを機能させるためのプログラム。
JP2013016631A 2013-01-31 2013-01-31 変換行列推定装置、変換行列推定方法、及びプログラム Expired - Fee Related JP5937977B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013016631A JP5937977B2 (ja) 2013-01-31 2013-01-31 変換行列推定装置、変換行列推定方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013016631A JP5937977B2 (ja) 2013-01-31 2013-01-31 変換行列推定装置、変換行列推定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014149582A true JP2014149582A (ja) 2014-08-21
JP5937977B2 JP5937977B2 (ja) 2016-06-22

Family

ID=51572543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013016631A Expired - Fee Related JP5937977B2 (ja) 2013-01-31 2013-01-31 変換行列推定装置、変換行列推定方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5937977B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785376A (zh) * 2017-11-15 2019-05-21 富士通株式会社 深度估计装置的训练方法、深度估计设备及存储介质
CN112581421A (zh) * 2019-09-27 2021-03-30 广东博智林机器人有限公司 三维点云处理方法、建筑物检测方法、装置、设备及介质
CN113781561A (zh) * 2021-09-09 2021-12-10 诺力智能装备股份有限公司 基于自适应高斯权快速点特征直方图的目标位姿估计方法
CN114140536A (zh) * 2021-11-30 2022-03-04 清华大学 位姿数据处理方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010532465A (ja) * 2007-05-22 2010-10-07 メタイオ ゲゼルシャフト ミット ベシュレンクテル ハフツング 拡張リアリティイメージのためのカメラポーズ推定装置および方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010532465A (ja) * 2007-05-22 2010-10-07 メタイオ ゲゼルシャフト ミット ベシュレンクテル ハフツング 拡張リアリティイメージのためのカメラポーズ推定装置および方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
島村 潤: "設備保守支援向けARのための部分テンプレート検出とvSLAMの併用によるオブジェクト座標系へのレジス", 情報処理学会 シンポジウム 画像の認識・理解シンポジウム(MIRU) 2011, vol. IS4-13, JPN6015049660, 20 July 2011 (2011-07-20), JP, pages 1370 - 1376, ISSN: 0003212720 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785376A (zh) * 2017-11-15 2019-05-21 富士通株式会社 深度估计装置的训练方法、深度估计设备及存储介质
CN109785376B (zh) * 2017-11-15 2023-02-28 富士通株式会社 深度估计装置的训练方法、深度估计设备及存储介质
CN112581421A (zh) * 2019-09-27 2021-03-30 广东博智林机器人有限公司 三维点云处理方法、建筑物检测方法、装置、设备及介质
CN113781561A (zh) * 2021-09-09 2021-12-10 诺力智能装备股份有限公司 基于自适应高斯权快速点特征直方图的目标位姿估计方法
CN113781561B (zh) * 2021-09-09 2023-10-27 诺力智能装备股份有限公司 基于自适应高斯权快速点特征直方图的目标位姿估计方法
CN114140536A (zh) * 2021-11-30 2022-03-04 清华大学 位姿数据处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
JP5937977B2 (ja) 2016-06-22

Similar Documents

Publication Publication Date Title
US11270460B2 (en) Method and apparatus for determining pose of image capturing device, and storage medium
JP6768156B2 (ja) 仮想的に拡張された視覚的同時位置特定及びマッピングのシステム及び方法
US9495761B2 (en) Environment mapping with automatic motion model selection
WO2018072630A1 (zh) 一种三维场景模型构建方法及装置
US10628949B2 (en) Image processing with iterative closest point (ICP) technique
US10789765B2 (en) Three-dimensional reconstruction method
JP5955406B2 (ja) データを位置合わせする方法
WO2017054589A1 (zh) 一种多深度图融合方法及装置
JP5965293B2 (ja) カメラポーズ推定装置、及びカメラポーズ推定プログラム
JP5620343B2 (ja) 物体座標系変換装置、物体座標系変換方法、及び物体座標系変換プログラム
KR20080029080A (ko) 단안 줌 카메라를 이용한 이동로봇의 자기위치 추정 시스템및 방법
Lao et al. Rolling shutter homography and its applications
JP4938748B2 (ja) 画像認識装置及びプログラム
GB2567245A (en) Methods and apparatuses for depth rectification processing
WO2014093906A1 (en) Model based video projection
JP2017092756A (ja) 画像処理装置、画像処理方法、画像投影システムおよびプログラム
JP5937977B2 (ja) 変換行列推定装置、変換行列推定方法、及びプログラム
JP2016015037A (ja) 情報処理装置及びその制御方法、並びに、ビデオカメラ
JP6196562B2 (ja) 被写体情報重畳装置、被写体情報重畳方法及びプログラム
JP6306996B2 (ja) 映像データ処理方法、映像データ処理装置及び映像データ処理プログラム
JP6086491B2 (ja) 画像処理装置およびそのデータベース構築装置
WO2019058487A1 (ja) 3次元復元画像処理装置、3次元復元画像処理方法及び3次元復元画像処理プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2011170174A (ja) 光学投影安定化装置、光学投影安定化方法およびプログラム
JP5478533B2 (ja) 全方位画像生成方法、画像生成装置およびプログラム
CN115435790A (zh) 一种视觉定位与视觉里程计位姿融合的方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160513

R150 Certificate of patent or registration of utility model

Ref document number: 5937977

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees