JP2022011818A

JP2022011818A - 情報処理装置およびその制御方法

Info

Publication number: JP2022011818A
Application number: JP2020113194A
Authority: JP
Inventors: 誠冨岡; Makoto Tomioka
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2022-01-17
Anticipated expiration: 2040-06-30
Also published as: US11715218B2; JP7474137B2; US20210407113A1

Abstract

【課題】地図情報を効率的に共有する。【解決手段】情報処理装置は、三次元空間を第１のカメラにより撮影して得られる第１の画像を取得する画像取得手段と、三次元空間を第２のカメラにより撮影して得られる第２の画像を第２の変換情報により幾何変換して得られる第２の変換画像に基づいて生成された地図情報を取得する地図情報取得手段と、第１の画像を第１の変換情報により幾何変換して第１の変換画像を生成する画像変換手段と、地図情報と第１の変換画像とを照合する照合手段と、を有する。第１の変換情報および第２の変換情報は、三次元空間と第１の変換画像との幾何対応関係と三次元空間と第２の変換画像との幾何対応関係とが共通の幾何対応関係となるように設定される。【選択図】図１

Description

本発明は、センサにより得られた情報に基づき生成される地図情報を効率的に共有する技術に関するものである。

画像情報に基づくカメラの位置及び姿勢の計測は、複合現実感／拡張現実感における現実空間と仮想物体の位置合わせや、ロボットや自動車の自己位置推定、物体や空間の三次元モデリングなど様々な目的で利用される。位置姿勢推定には、画像情報から検出した２次元の位置情報を持つ特徴群と、それらから復元した３次元位置情報を含む地図を用いる。

特許文献１では、複数のユーザが活動するグローバル地図と、１人のユーザが保持するカメラを含む端末装置で生成したローカル地図との相対位置を算出し、グローバル地図を更新する方法が開示されている。この方法では、グローバル地図とローカル地図に共通して含まれる物体の特徴量に基づいて、ローカル地図とグローバル地図とに含まれる共通の特徴群の三次元位置情報が一致するように、相対位置を算出している。

特許第５４７１６２６号

しかしながら、特許文献１に記載の技術では、地図の作成に使用するカメラと作成した地図を利用するカメラとが異なる場合、カメラで撮影した画像と地図との照合や位置姿勢算出の精度や安定性が低下するという課題がある。また、安定した精度で地図を作成するためにはカメラ毎に地図を作成しなければならず、地図作成に手間がかかるという課題がある。

本発明は、このような問題に鑑みてなされたものであり、センサにより得られた情報に基づき生成される地図情報を効率的に共有する技術を提供することを目的としている。

上述の問題点を解決するため、本発明に係る情報処理装置は以下の構成を備える。すなわち、情報処理装置は、
三次元空間を第１のカメラにより撮影して得られる第１の画像を取得する画像取得手段と、
前記三次元空間を前記第１のカメラとは異なる第２のカメラにより撮影して得られる第２の画像を第２の変換情報により幾何変換して得られる第２の変換画像に基づいて生成された地図情報を取得する地図情報取得手段と、
前記第１の画像を第１の変換情報により幾何変換して第１の変換画像を生成する画像変換手段と、
前記地図情報と前記第１の変換画像とを照合する照合手段と、
を有し、
前記第１の変換情報および前記第２の変換情報は、前記三次元空間と前記第１の変換画像との幾何対応関係と前記三次元空間と前記第２の変換画像との幾何対応関係とが共通の幾何対応関係となるように設定される。

本発明によれば、センサにより得られた情報に基づき生成される地図情報を効率的に共有する技術を提供することができる。

システムにおける処理の概念を説明する図である。情報処理装置の機能構成を示す図である。情報処理装置のハードウェア構成を示す図である。情報処理装置の動作を説明するフローチャートである。共通パラメータを生成するためのＧＵＩの一例を示す図である。共通パラメータ自動生成の概念を示す図である。情報処理装置の動作を説明するフローチャートである（第３実施形態）。情報処理装置の機能構成を示す図である（第５実施形態）。情報処理装置の動作を説明するフローチャートである（第５実施形態）。

以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。

（第１実施形態）
本発明に係る情報処理装置の第１実施形態として、カメラから入力される画像と地図情報とをマッチングし、カメラの位置姿勢を算出する情報処理装置について述べる。例えば、算出した位置姿勢は移動体の制御に用いられることになる。なお、位置姿勢を入力し移動体を制御する方法については公知であるため説明は省略する。

＜システムの動作概要＞
第１実施形態においては、カメラ２で撮像した画像を用いて作成した地図情報を用いて、カメラ２とは異なるカメラ１の位置姿勢を算出する。特に、カメラ毎に地図を作成する手間を削減し、高い精度で、安定して位置姿勢を算出する。

図１は、システムにおける処理の概念を説明する図である。上述したように、カメラ２で撮像した画像を用いて作成した地図情報を、カメラ１の位置姿勢算出に用いる。ここで、地図情報は、カメラ２で撮影された画像を幾何変換して得られる変換画像に基づきあらかじめ作成されている。カメラの位置姿勢推定は、地図に含まれる特徴点の三次元位置を、カメラパラメータに基づいて画像上に投影し、投影した点と、画像から検出した特徴点の二次元位置との距離を最小化するように算出する。ここでは、投影時のカメラパラメータと画像の関係を「カメラパラメータで表される画像」と呼ぶ。ここで、カメラ１、カメラ２は、特性の差異により、撮像する画像の歪みや焦点距離を含むカメラパラメータがそれぞれ異なる。

画像からの位置姿勢を高精度に行うためには、一般に、カメラ毎に異なる歪み補正済みカメラパラメータで表される画像を生成する。例えば、文献１（Z. Zhang, "A flexible new technique for camera calibration", TPAMI, 2000）（以降ではＺｈａｎｇと呼ぶ）のようなカメラキャリブレーションを事前に行う。しかし、カメラ毎に異なる歪み補正済みパラメータで画像を補正するために、地図情報に含まれる三次元位置情報を投影処理すると、カメラ１とカメラ２で異なる２次元位置に投影されることになる。このため、特徴点マッチングや位置姿勢算出の精度が低下する（地図情報や投影処理については後述する）。

そこで、第１実施形態では、各々のカメラ毎に歪みを取り除いた画像を生成する代わりに、共通するカメラパラメータとなるように画像を生成（変換）し、地図情報を共通したカメラパラメータで投影処理する。これにより精度高く特徴点マッチングや位置姿勢算出ができる。

ここでは、地図情報とは、画像から検出した画像特徴情報、画像特徴が検出された画像を撮影したカメラの位置姿勢情報（以降では画像の位置姿勢と呼ぶ）、および画像特徴の三次元位置情報を保持するデータのことである。画像特徴情報とは、画像特徴の特徴量および画像上での二次元座標（ｕ，ｖ）のことである。画像特徴とは、画像中の角など幾何学的な構造を指し示す特徴点として検出する。位置姿勢情報とは、現実空間中に規定された世界座標における、カメラの位置を表す３個のパラメータ及びカメラの姿勢（向き）を表す３個のパラメータを合わせた６個のパラメータのことである。なお、６個のパラメータを、回転行列として３×３行列で表すこともある。回転表現については相互変換方法が公知であるため説明を省略する。また、画像特徴（特徴点）の三次元位置情報とは、世界座標上の三次元座標（Ｘ，Ｙ，Ｚ）のことである。

カメラの位置姿勢算出では、まずカメラ１が撮像したモノクロ画像から検出した特徴点と、地図情報に含まれる特徴点とをマッチングする。次に、マッチングした特徴点の３次元座標と、検出した特徴点の画像上での二次元位置の対応関係から、ＰＮＰ問題（Perspective-n-Point Problem）を解くことでカメラ１の位置姿勢を算出する。ＰＮＰ問題を解くとは、数式（１）に示す誤差関数を最小化するカメラの位置姿勢を求めることである。

ｄｉｓｔ（）は、二つの２次元座標の距離の二乗距離を求める関数である。u₁ ^―＝（u₁ ^―，v₁ ^―）はカメラ１の歪み補正後の画像の特徴点の二次元座標である。歪み補正とは、レンズ光学系特有の撮像画像における幾何学的歪みを取り除くことである。具体的には、カメラ１で撮影した画像からレンズ歪み補正済み画像を生成し、当該歪み補正済み画像上で検出した、特徴点の検出二次元座標(u₁)^―を算出する。画像の歪みに用いるカメラの歪みパラメータは、例えばｒａｄｉａｌ－ｔａｎｇｅｎｔｉａｌモデルの歪みパラメータを事前のカメラキャリブレーションによって求める。

カメラキャリブレーションでは、Ｚｈａｎｇの方法を用いて、カメラ１のカメラパラメータc₁と、カメラ１の歪み補正済みカメラパラメータc₁ ^＾を生成する。c₁は、焦点距離f_x1，f_y1、画像中心座標c_x1，c_y1、歪みパラメータk₁₁，k₂₁，k₃₁，p₁₁，p₂₁を含む。c₁ ^＾は、焦点距離f_x1 ^＾，f_y1 ^＾、画像中心座標c_x1 ^＾，c_y1 ^＾を含み、歪みパラメータは０（ゼロ）である。ここでは、カメラモデルはピンホールカメラモデルを用いる方法について説明する。

u＝(u，v)^Ｔは、特徴点の三次元座標を投影した点である。カメラ１の位置Ｔ＝(t_x，t_y，t_z)^Ｔ、姿勢である３×３の回転行列Ｒ、歪み補正済みカメラパラメータc₁ ^＾を用いて数式（２）のように表される。

Ｍ（）は世界座標系上の三次元座標を、カメラ座標系の座標Ｘc＝(Xc，Yc，Zc)^Ｔに変換する関数であり、数式（３）のように定義する。

τ（）は三次元座標を２次元の正規化座標x＝(x，y)^Ｔへ投影する投影処理関数であり、数式（４）のように定義する。

π（）は、正規化座標から画像座標への変換を表す関数であり、数式（５）のように定義する。

また、さらに複数の時刻で観測した画像に対して各時刻のカメラ位置姿勢と特徴点の三次元座標を数式（２）を最小化する地図最適化（バンドル調整）も合わせて行うことで、より精度よく位置姿勢を算出することができる。

上述のように、Ｚｈａｎｇの方法では、カメラの仕様や個体差によるカメラパラメータの差異により歪み補正済みカメラパラメータがカメラ毎に異なる。このため、同じ空間を撮影したとしても、歪み補正済み画像がカメラ毎に異なる。言い換えれば、カメラ２の歪み補正済みカメラパラメータc₂ ^＾を用いて作成した地図を、カメラ１の歪み補正済みカメラパラメータc₁ ^＾を用いて位置姿勢算出すると、位置姿勢精度が低下する。

そこで、第１実施形態では、カメラの仕様や個体差があったとしても、カメラが同じ位置にあれば、空間中の物体が、カメラ２の歪み補正画像とカメラ１の変換画像とで同じ位置に写るように画像をあらかじめ変換する。それにより、カメラ個体差の影響を受けずに位置姿勢を算出する。

ここで、共通パラメータc ^＾を、地図情報に含まれる三次元空間を二次元配列に投影する、すなわち異なるカメラの画像に三次元の特徴点を投影した時に、画像上で同一の位置に投影されるカメラパラメータと定義する。このとき、共通パラメータc ^＾は、焦点距離f_x ^＾，f_y ^＾、画像中心座標c_x ^＾，c_y ^＾を含み、歪みパラメータは０である。そして、共通パラメータの下で同一の幾何対応関係となるよう変換された画像を「共通パラメータで表される変換画像」または単に変換画像と呼ぶ。

本実施形態では、共通パラメータをカメラ２の歪み補正済みカメラパラメータc₂ ^＾とする（すなわち、c^＾＝c₂ ^＾）。なお、c₂ ^＾は、焦点距離f_x2 ^＾，f_y2 ^＾、画像中心座標c_x2 ^＾，c_y2 ^＾を含み、歪みパラメータは０である。そして、カメラ１で撮像した画像を共通パラメータ（すなわちカメラ２の歪み補正済みカメラパラメータ）で表されるように変換する。

本実施形態においては、地図情報は、事前にカメラ２の入力画像を用いて作成してあり、図３を参照して後述する外部メモリ２４に格納済みであるとする。なお、地図情報は、画像からカメラの位置姿勢と特徴点の三次元位置（すなわち地図情報）を作成するＳＬＡＭ（Simultaneous Localization And Mapping）技術を用いることで作成する。例えば、文献２（R. Mur-Artal et al., "ORB-SLAM: a Versatile and Accurate Monocular SLAM System", T-RO, 2015）（以降ではＲａｕｌと呼ぶ）に記載の方法で作成しておく。

＜装置構成＞
図２は、第１実施形態に係る情報処理装置１００の機能構成を示す図である。上述したように、情報処理装置１００は、センサ１０であるカメラから入力された画像に基づいて位置姿勢を算出し、移動体の制御するために、移動体制御部（不図示）に位置姿勢を出力する。

共通パラメータ生成部１１は、共通パラメータを生成する。なお、パラメータ入力部（不図示）から共通パラメータを入力するよう構成してもよい。上述したように、本実施形態における共通パラメータとは地図保持部１７が保持する地図情報を作成したカメラ２の歪み補正済みカメラパラメータc₂ ^＾であり、c^＾＝c₂ ^＾である。すなわち、地図情報は、カメラ２が撮影した画像に対し歪み補正のみがなされた補正画像に基づいて作成されている。ただし、カメラ２が撮影した画像に対する画角、画像中心の調整または歪み補正の少なくとも何れか一つがなされた補正画像に基づいて作成されていればよい。

パラメータ保持部１２は、共通パラメータ生成部１１が生成した共通パラメータと、カメラ１のカメラパラメータc₁を保持する。カメラパラメータはパラメータ入力部（不図示）から入力される。共通パラメータは、変換情報生成部１３および地図照合部１８に出力される。

変換情報生成部１３は、カメラ１から入力される入力画像を、共通パラメータで表される変換画像に変換するためのルックアップテーブル（以降ではリマップテーブルと呼ぶ）を生成する。リマップテーブルは、パラメータ保持部１２が入力する共通パラメータとカメラ１のカメラパラメータとを用いて生成される。リマップテーブルとは、ある画像の画素が、別の画像のどの画素に対応するかを示した二次元配列のデータ構造のことである。生成したリマップテーブルを変換情報保持部１４に出力する。変換情報保持部１４は、変換情報生成部１３が生成したリマップテーブルを保持する。リマップテーブルは変換部１６に出力される。

入力部１５は、センサ１０であるカメラ１と接続されており、カメラ１が撮像した画像を時系列（例えば毎秒６０フレーム）で画像取得し、変換部１６に出力する。ここでは、センサ１０は、モノクロ画像を取得するとする。変換部１６は、入力部１５が入力した画像を、変換情報保持部１４から入力されたリマップテーブルを用いて幾何変換（画像変換）する。幾何変換により得られた変換画像は地図照合部１８に出力される。

地図保持部１７は、共通パラメータを用いて事前に作成した地図情報を外部メモリ２４よりロードし保持する。保持した地図情報を地図照合部１８に出力する。地図照合部１８は、地図保持部１７からの地図情報取得を行い、変換部１６が入力した変換画像と、地図保持部１７から取得した地図情報とを照合して、センサ１０の位置姿勢を算出する。算出した位置姿勢は移動体制御部（不図示）に出力される。

図３は、情報処理装置１００のハードウェア構成を示す図である。ＣＰＵ２１は、システムバス２９に接続された各種デバイスの制御を行う。ＲＯＭ２２は、ＢＩＯＳのプログラムやブートプログラムを記憶する。ＲＡＭ２３は、ＣＰＵ２１の主記憶装置として使用される。外部メモリ２４は、情報処理装置１００が処理するプログラムを格納する。

入力部２５はキーボードやマウスなど情報等の入力に係る処理を行う。表示部２６はＣＰＵ２１からの指示に従って演算結果を表示装置に出力する。なお、表示装置は液晶表示装置やプロジェクタ、ＬＥＤインジケーターなど、種類は問わない。通信インターフェイス２７は、ネットワークを介して情報通信を行うものである。インターフェイス規格は、イーサネットなどのネットワーク通信規格でもよい。また、ＵＳＢなどのシリアル通信、無線通信等種類は問わない。なお、情報処理装置１００が算出した位置姿勢情報は、通信インターフェイス２７を介して移動体制御部（不図示）に出力される。Ｉ／Ｏ２８は、センサ１０から画像を入力する。

＜装置の動作＞
図４は、情報処理装置１００の動作を説明するフローチャートである。

ステップＳ１１では、情報処理装置１００は、システムの初期化を行う。すなわち、外部メモリ２４からプログラムを読み込み、情報処理装置１００を動作可能な状態にする。また、必要に応じて外部メモリ２４から地図情報やカメラパラメータをＲＡＭ２３に読み込む。

ステップＳ１２では、共通パラメータ生成部１１は、パラメータ入力部（不図示）を介して共通パラメータおよびカメラ１のカメラパラメータを取得する。そして、取得した共通パラメータをパラメータ保持部１２に出力する。

ステップＳ１３では、変換情報生成部１３は、カメラ１の入力画像から共通パラメータで表される変換画像を生成するための変換情報（すなわちリマップテーブル）を生成する。具体的には、パラメータ保持部１２が保持する共通パラメータとカメラ１のカメラパラメータc₁を用いて、リマップテーブルを生成する。

カメラ１の入力画像の画像座標u_d ^―＝(u_d ^―，v_d ^―)^Ｔと、変換後の画像u^―＝(u^―，v^―)^Ｔとは、数式（６）で表すことができる。

π（）^－１は画像座標から正規化座標への変換関数であり、数式（７）で表す。

ｄ（）はレンズ歪みモデルであり、歪みあり（入力画像）の正規化座標x^`＝（ｘ^`，y^`）と、歪み無しの画像の正規化座標x＝(x，y)との関係を表す関数であり、数式（８）で表す。

π（）は正規化座標から共通パラメータで表される変換画像への画像座標との変換関数であり、数式（９）で表す。

数式（６）は変換後の各画素の座標u^―に対する入力画像の画像座標を表している。ここでは、リマップテーブルは、変換後の各画素に対する歪み補正前の座標を格納した二次元配列として作成しておく。作成したリマップテーブルは、変換情報保持部１４が保持する。

ステップＳ１４では、入力部１５は、センサ１０であるカメラ１が撮像した画像を入力する。そして入力された画像を、変換部１６に出力する。

ステップＳ１５では、変換部１６は、リマップテーブルを用いて入力画像を共通パラメータで表される変換画像に変換する。具体的には、リマップテーブルの各要素が指定する座標に基づいて、バイリニア補間で画素値を決め、変換画像の各画素に画素値を格納し、変換画像を生成する。なお、リマップテーブルにおいて、ある画素が画像外の座標を指し示す場合には、当該画素を黒（輝度０）とする。その後、変換画像を、地図照合部１８に出力する。

ステップＳ１６では、地図照合部１８は、地図保持部１７が保持する地図と、変換部１６が入力した共通パラメータで表される変換画像とを用いてセンサ１０の位置姿勢を算出する。例えば、地図を用いた位置姿勢算出にＲａｕｌの方法を用いる。ただし、カメラ１の入力画像の代わりに変換画像を入力し、位置姿勢算出で用いるカメラパラメータに共通パラメータを用いる。

ステップＳ１７では、情報処理装置１００は、システムを終了するか否かの判断を行う。例えば、移動体（不図示）が目的に到着した場合に、システムを終了するコマンドが移動体制御部（不図示）から入力される。終了コマンドが入力された場合にはシステムを終了する。そうでなければステップＳ１４に戻り、センサ情報の変換および地図照合を継続する。

＜効果＞
以上説明したとおり第１実施形態によれば、カメラ１の画像を共通パラメータで表される変換画像にあらかじめ変換してから地図との照合を行う。このとき、地図を作成したカメラ２の歪み補正済みパラメータを共通パラメータとして用いる。このようにすることで、地図を作成したカメラと位置姿勢算出で用いるカメラが異なる場合であっても、画像と地図との照合や位置姿勢算出を、高精度で安定して行うことが可能となる。また、カメラ毎に地図を作成するという手間もなくなる。

さらに、共通パラメータで表せられる画像への変換は、従来の歪み補正における画像補正処理（リマップ）におけるリマップテーブルを変えるだけで実現可能である。そのため、地図照合における処理時間の増加させることなく実現することができる。

＜変形例＞
上述の説明では、センサ１０（カメラ１）はモノクロ画像を取得するモノクロカメラであるとした。しかし、センサ１０としては、モノクロカメラに限定されず、カラーカメラ、ステレオカメラ、奥行カメラなどを用いることも可能である。すなわち、三次元空間を射影して得られる二次元配列情報を取得するものであれば何でもよい。なお、奥行カメラとはカメラの各画素がセンサからの奥行（デプス）値を格納したデプスマップを取得するカメラである。また、センサ１０は三次元空間を射影して二次元配列に格納する構成の三次元ＬｉＤＡＲでもよい。センサは単眼でもよいしステレオやさらに複数のカメラを備えるようにしてもよい。

また、地図情報とは、画像から検出した画像特徴情報、画像特徴が検出された画像を撮影したカメラ２の位置姿勢情報、および画像特徴の三次元位置情報を保持するデータであるとした。しかし、地図情報のデータ構造はこれに限らず、三次元空間の位置を表す座標を持つ特徴と、それを二次元空間に射影した二次元空間の位置を表す特徴を保持する構成であればよい。三次元空間の位置を表す特徴としては、特徴点のようなある一点の三次元座表を保持するだけでなく、法線も持つＮＰ（Normal Point Data）でもよい。また、空間中の物体との境界位置を表すＳＤＦ（Signed Distance Function）やＴＳＤＦ（Truncated Signed Distance Function）でもよい。さらに三次元の線分でもよい。また、二次元空間の位置を表す特徴は、本実施形態で延べた特徴点に限らず、エッジでもよし、明暗の分布情報でもよい。

さらに、カメラモデルとしてピンホールカメラモデルを用いるとしたが、他のモデルを用いてもよい。三次元空間をある平面や球面、超関数面といった所定の面に射影するモデルであれば足りる。例えば、ｏｍｎｉｄｉｒｅｃｔｉｏｎａｌカメラモデルやｄｏｕｂｌｅｓｐｈｅｒｅカメラモデル、ｅｘｔｅｎｄｅｄｕｎｉｆｉｅｄカメラモデルを用いることができる。さらに、Ｅｑｕｉｒｅｃｕｔａｎｇｕｌａｒカメラモデルを用いることができる。なお、カメラモデルが変われば共通パラメータもカメラモデルにあった形式に変わる。

また、歪みモデルとしてｒａｄｉａｌ－ｔａｎｇｅｎｔｉａｌモデルを用いて説明した。ただし、これに限るものではなく、歪み前と歪み補正後の画像の画素の対応関係が取得できるモデルであれば何でもよく、ｅｑｕｉｄｉｓｔａｎｔモデルやｆｏｖモデルを用いてもよい。また、歪み補正前と補正後の画素対応を求める方法としてＺｈａｎｇの方法について述べたが、対応関係が求まればこれに限らない。例えばｅｑｕｉｄｉｓｔａｎｔモデルの場合には、文献３（C. Hughes et al., "Equidistant Fish-Eye Calibration and Rectification by Vanishing Point Extraction", TPAMI, 2010）に記載の方法でもよい。

さらに、変換部１６はリマップテーブルとバイリニア補間により画素値を決めていた。しかしながら、共通パラメータで表される変換画像の各画素値を決められる方法であれば、ニアレストネイバー法や、トリリニア補間など任意の補間処理が利用可能である。また、リマップテーブルが指定する画素が画像範囲外は黒（輝度値０）としていたが、別の特定の値でもよいし、最も近い画像範囲内の輝度値としてもよい。

また、共通パラメータをカメラ２の補正済みカメラパラメータとした。これに限らず、共通パラメータは異なるカメラで共通（同一）のパラメータであればよい。例えば、カメラ１の補正済みカメラパラメータとカメラ２の補正済みカメラパラメータの平均値や重み付き平均を共通パラメータにしてもよい。なお、共通パラメータは厳密にいえばカメラ毎に完全に一致したパラメータでなくともとい。例えば、異なるカメラで作成した地図情報を用いた地図照合の精度や安定度合いが、共通パラメータを用いない場合より向上するような変換パラメータであればよい。例えば、小数点の所定桁数以下が異なっていても許容できる。

さらに、システムに共通パラメータを入力できる方法であれば共通パラメータ生成部１１を取り除いた構成であってもよい。このような場合には、例えばＲＯＭ１２に共通パラメータをあらかじめ格納しておき、パラメータ保持部１２が共通パラメータを取得できる構成であればよい。

また、変換情報（リマップテーブル）をあらかじめ生成しておき、パラメータ入力部（不図示）を用いて変換情報保持部１４に変換情報を入力する構成としてもよい。この場合、共通パラメータ生成部１１、パラメータ保持部１２、変換情報生成部１３を取り除いた構成とすることができる。

さらに、地図保持部１７に保持された地図情報を更新する構成としてもよい。地図情報更新では、ＳＬＡＭ（Simultaneous Localization And Mapping）技術を用いて、地図情報を更新および追加する。このとき、ステップＳ１６で述べたように、上述の変換画像を用い、位置姿勢算出や三次元復元（地図作成）で用いるカメラパラメータに共通パラメータを用いることで、更新された地図情報も共通パラメータで表される地図情報となる。そのため、作成した地図情報をカメラ１以外の他のカメラで好適に利用できるようになる。

また、変換情報としてリマップテーブルを用いる方法について述べたが、カメラで取得した画像を共通パラメータで表される変換画像に変換できる方法であればこれに限らない。例えば、カメラで取得した画像を共通パラメータで表すことができるようにあらかじめ学習したＣＮＮ（Convolutional Neural Network）を用いることもできる。例えば、このようなＣＮＮは、文献４（M. Jaderberg et al., "Spatial Transformer Networks", NIPS, 2015）に記載の方法を用いて生成する。

さらに、地図照合部１８が算出した位置姿勢を、移動体の制御に用いる方法について説明したが、他の位置姿勢を用いる装置に応用できる。例えば、ＭＲやＡＲといった仮想物体を現実画像に合成して提示するための位置姿勢推定装置としても利用できる。また、バーチャル空間を移動するＶＲにおける現在位置姿勢を、現実空間の位置姿勢を基に入力する装置としても利用できる。ロボットハンドの先端位置を計測する装置として用いれば、カメラを交換した場合に、地図を再作成せずともロボットハンドの先端位置を算出できるようになる。

また、地図照合部１８は、地図情報を基にカメラの位置姿勢を算出する構成を説明した。地図照合は、位置姿勢算出に限らず、地図と入力画像とをマッチングする構成であればよい。すなわち地図照合として、例えば地図中の画像と入力画像との類似具合を算出してもよいし、地図と入力画像の背景差分による環境変化や物体の配置の変化を検知するように実装してもよい。画像に写る被写体（例えば、人や物）の検出や識別に用いるよう実装してもよい。

さらに、地図照合（位置姿勢推定）や地図作成はＲａｕｌの方法を用いると述べたが、これに限定されない。地図情報に含まれる三次元の特徴と画像に含まれる二次元の特徴とを対応付けて位置姿勢推定するような方法であればよい。

また、カメラの外部パラメータ（すなわち取付け位置）が異なる場合における取り付け位置差異の吸収にも第１実施形態の構成を用いることができる。例えば、変換部は、取り付け位置が異なるカメラの画像を生成するように画像を変換する。具体的には、ＲＧＢ画像から奥行値を推定し、画像の各画素の三次元点をあらかじめ算出しておいたカメラの取り付け位置オフセットの位置に投影し画像を生成する。このようにすることで、例えば、ある移動体に取り付けたカメラにより取得された画像に基づいて作成した地図を、車高の異なる別の移動体に取り付けたカメラで利用するといった場合に精度向上が図れる。なお、ＲＧＢ画像から奥行値の推定には、例えば、文献５（I. Laina et al., "Deeper Depth Prediction with Fully Convolutional Residual Networks", 3DV, 2016）に記載の方法により生成（学習）したＣＮＮを用いるとよい。取り付け位置の差異を吸収する画像の生成方法は上述の方法に限定されず、任意視点画像生成技術を用いて生成してよい。入力画像から別視点の画像を生成するように学習したＣＮＮを用いてもよい。例えば、文献６（H. Dhamo et al., "Object-Driven Multi-Layer Scene Decomposition From a Single Image", ICCV, 2019）（以降Ｄｈａｍｏと呼ぶ）の方法を適用する。

（第２実施形態）
第２実施形態では、ユーザが指定した設定パラメータ（例えば画角と画像サイズ）となるように共通パラメータを生成する形態について説明する。なお、第２実施形態における装置の構成は、第１実施形態（図２、図３）と同様であるため説明は省略する。また、装置の動作についても第１実施形態（図４）と同様であり、ステップＳ１２の詳細動作が異なる。

すなわち、共通パラメータを生成したあと、当該共通パラメータを用いて地図情報を作成する。具体的には、Ｒａｕｌの方法において、カメラ２が撮像する画像を入力するのではなく、カメラ２が撮像する画像を共通パラメータで表される変換画像を入力する。また、位置姿勢算出や特徴点の投影、三次元復元や地図最適化で用いるカメラパラメータに共通パラメータを用いる。

＜ユーザ入力用のグラフィカルユーザインタフェース（ＧＵＩ）＞
上述したように、第２実施形態では、ユーザから設定パラメータの指定を受け付け、当該設定パラメータに適合する共通パラメータを生成する。設定パラメータの指定は、例えば、表示部２６に表示されるＧＵＩを介して受け付ける。

図５は、共通パラメータを生成するためのＧＵＩ２００の一例を示す図である。ここでは、入力部２５および表示部２６はタッチパネルディスプレイとして構成されていることを想定する。そして、ＧＵＩ２００は、共通パラメータで表される変換画像の画角、画像サイズの入力を受け付ける。

ＧＵＩ部品２１０は、共通パラメータで表される変換画像の垂直方向の画角（ＦＯＶ）を指定するスライドバーである。スライドバーを左右に指で移動させることで、画角を設定することができる。表示部２１１は、設定した画角値を提示する表示ウィンドウである。ＧＵＩ部品２２０は、共通パラメータで表される変換画像の横サイズを指定するスライドバーである。スライドバーを左右に指で移動させることで、横サイズを設定することができる。表示部２２１は、設定した横サイズを提示する表示ウィンドウである。ＧＵＩ部品２３０は、共通パラメータで表される変換画像の縦サイズを指定するスライドバーである。スライドバーを左右に指で移動させることで、縦サイズを設定することができる。表示部２３１は、設定した縦サイズを提示する表示ウィンドウである。

表示画像２４０は、カメラ１が撮像することにより得られた変換前の画像である。表示部品２４１は、ユーザが入力した設定パラメータを用いて画像を変換した場合に切り取られる画像範囲を示す枠である。表示画像２５０は、ユーザが入力した設定パラメータに基づいて、変換部１６が変換した画像である。表示部品２４１と表示画像２５０は、ユーザが設定パラメータを入力するごとに更新される。

上述のように、ユーザが入力するのは共通パラメータで表される変換画像のサイズ（ｗ，ｈ）と垂直画角（ＦＯＶ）である。ユーザは共通パラメータを入力する場合には、表示画像２４０、表示部品２４１を見ながら以下のような手順でパラメータを設定する。

まず、位置姿勢算出に用いる画像サイズをＶＧＡサイズなど適当なものに設定する。次に、入力画像に写る領域を最大限利用する（すなわち入力画像の欠けを減少させる）場合には、ＦＯＶ値を減少させる。また、入力画像より広い範囲の画像を使用する（画像の欠けを許容し入力画像のより多くの画素を利用する）場合には、ＦＯＶ値を増大させる。ユーザは、入力されたＦＯＶ値に応じて更新された表示部品２４１と表示画像２５０を確認し、適切なＦＯＶ値を決定する。さらに、変換画像に含まれる縦横各々の領域を調整する場合には、画像サイズ値を調整（例えば、横方向に画角を広げるにはｗ値を増大させる）する。

＜共通パラメータの生成＞
上述の通り、第２実施形態では、ステップＳ１２における共通パラメータ生成の詳細動作が異なる。ステップＳ１２で共通パラメータを生成しステップＳ１３まで実施した後に、生成した共通パラメータで表される地図をロードする。そして、ステップＳ１４以降の地図照合（すなわちカメラ１の位置姿勢算出）を行う。

ステップＳ１２では、共通パラメータ生成部１１は、ユーザからの設定パラメータの入力を受け付ける。ユーザがＧＵＩ２００を用いて所定の数値の入力を完了したら、共通パラメータを生成する。すなわち、入力された設定パラメータから、共通パラメータc ^＾（焦点距離ｆ_x ^＾，ｆ_y ^＾、画像中心ｃ_x ^＾，ｃ_y ^＾）を生成する。具体的には数式（１０）～（１３）で計算する。

このようにして生成した共通パラメータを用いて、変換部１６が入力画像を変換し、地図照合部１８がセンサ１０の位置姿勢を算出する。

＜効果＞
以上説明したとおり第２実施形態によれば、ユーザは、変換後の画像を見ながら共通パラメータを設定することが出来る。例えば、カメラ１の入力画像に写る領域を最大限利用できる共通パラメータを設定したり、広角範囲を処理できる共通パラメータにしたりすることができ、ユーザの目的に応じた共通パラメータを設定することができるようになる。

＜変形例＞
上述の説明では、ユーザが入力した画像のサイズ（ｗ，ｈ）と垂直画角（ＦＯＶ）に基づいて共通パラメータを生成したが、ユーザが入力する設定パラメータは上記に限定されない。すなわち、共通パラメータを一意に生成できる設定パラメータであれば何でもよい。例えば、垂直画角の代わりに水平画角を入力する構成としてもよい。さらに、共通パラメータc ^＾に含まれるパラメータ（すなわち、焦点距離および画像中心座標）を直接入力する構成としてもよい。さらに、ＧＵＩ２００において、表示画像２４０や表示部品２４１の変形を行うユーザ操作を受け付けるなど、インタラクティブな入力方法を利用してもよい。

また、カメラモデルを選択できるようにしてもよい。具体的には、カメラモデルを表示し、ユーザがモデルを選択後、そのモデルに適合した設定パラメータの入力を求める構成とする。例えば、ｏｍｎｉｄｉｒｅｃｔｉｏｎａｌカメラモデルであればＭｉｒｒｏｒｔｙｐｅパラメータεの入力を受け付ける構成とする。

さらに、上述の説明では、ＧＵＩ２００の表示画像２４０および表示画像２５０においては撮影画像を表示していたが、共通パラメータで変換後の画角がわかる表示であれば足りる。例えば、グリッド線画像を用いて表示範囲を示すように構成してもよい。また、カメラ１の画像のみ表示するのではなく、地図情報を作成・利用するカメラ毎に画像を提示する構成でもよい。さらに、ＧＵＩ２００において表示画像２４０、表示部品２４１、表示画像２５０を配置せず（すなわち画像を提示せず）パラメータのみ入力する構成でもよい。

また、入力部２５および表示部２６としてタッチパネルディスプレイを用いていたが、設定パラメータ（もしくは共通パラメータそのもの）を入力することができれば足りる。例えば、入力部２５はマウスやキーボードを用いてもよく、表示部２６は液晶ディスプレイや７セグメントＬＥＤといった表示デバイスでもよい。また、画面上に複数のパラメータ候補を提示して選択を受け付ける構成としてもよい。

さらに、共通パラメータで表される地図情報を作成（更新）する構成を含めてもよい。その場合、地図照合部１８は、例えばＳＬＡＭを用いて地図を作成（更新）する。そして、ステップＳ１６において、地図照合部１８は、共通パラメータで表される変換画像を用いてＲａｕｌの方法で位置姿勢と地図情報を生成する。ステップＳ１７の後に、作成した地図情報を外部メモリ２４に保存する。

（第３実施形態）
第３実施形態では、複数のカメラパラメータから共通パラメータを自動生成する形態について説明する。なお、以下の説明では、カメラが撮像する画素情報量を最大限利用できるような共通パラメータを生成する場合を想定する。すなわち、画像を共通パラメータで表される変換画像に変換するときに画像領域外となる領域を最小にする。なお、第３実施形態における装置の構成は、第１実施形態（図２、図３）と同様であるため説明は省略する。また、装置の動作についても第１実施形態（図４）と同様であり、ステップＳ１２の詳細動作が異なる。

＜共通パラメータの自動生成＞
図６は、共通パラメータ自動生成の概念を示す図である。図６では、変換画像、カメラ１、カメラ２それぞれの画像領域が示されており、図面の左から右に進むにつれて共通パラメータが調整されていることを示している。

具体的には、初期状態（最も左）では、変換画像の画像領域（実線）内に、カメラ１の撮影範囲である画像領域（点線）外およびカメラ２の撮影範囲である画像領域（一点鎖線）外が含まれている。一方、最終状態（最も右）では、変換画像の画像領域（実線）内に、カメラ１の画像領域（点線）外およびカメラ２の画像領域（一点鎖線）外が含まれていない。

上述の通り、第３実施形態では、ステップＳ１２における共通パラメータ生成の詳細動作が異なる。ステップＳ１２では、共通パラメータ生成部１１は、カメラ１とカメラ２それぞれカメラパラメータに基づいて共通パラメータを繰り返し計算で求める。具体的には、カメラ１とカメラ２の撮像領域のうち共通パラメータで表される変換画像の領域外となる領域を最小化する（すなわちカメラ１とカメラ２の共通画像領域を最大化する）ような共通パラメータを求める。以下では図６および図７を参照して共通パラメータの生成動作（Ｓ１２）の詳細を説明する。

図７は、第３実施形態における情報処理装置の動作を説明するフローチャートである。上述したように、図７は共通パラメータの生成動作（Ｓ１２）の詳細を示している。

ステップＳ３１０では、共通パラメータ生成部１１は、共通パラメータの初期値を設定する。例えば、カメラ２のカメラパラメータからＺｈａｎｇの方法でカメラ２の歪み補正済みパラメータを算出し初期値として設定する。

ステップＳ３１１では、共通パラメータ生成部１１は、変換画像にすべての画像領域（カメラ１とカメラ２の両方）が含まれているかどうか判定する。具体的には、ステップＳ１３で述べた方法でリマップテーブルを作成し、リマップテーブルが指し示す座標がすべて画像内に含まれるか否かを判定する。含まれていればステップＳ３１２に、含まれていなければステップＳ３１３に進む。

ステップＳ３１２では、共通パラメータ生成部１１は、ｆ_x ^＾，ｆ_y ^＾を所定値Δだけ増加させる。一方、ステップＳ３１３では、共通パラメータ生成部１１は、ｆ_x ^＾，ｆ_y ^＾を所定値Δだけ減少させる。すなわち、Ｓ３１２およびＳ３１３では、共通パラメータで表される焦点距離値を調整する。そして、ステップＳ３１４では、共通パラメータ生成部１１は、Δを所定値ε（＜１．０）積算する。

ステップＳ３１５では、共通パラメータ生成部１１は、積算された所定値Δが所定の閾値γより小さいか否かを判定する。小さい場合は処理を終了する。小さくない場合はＳ３１１に戻り処理を繰り返す。

＜効果＞
以上説明したとおり第３実施形態によれば、各々のカメラの画素を最大限利用できる画角となる共通パラメータを生成することができる。それにより、異なるカメラで作成した地図を利用する場合においても、安定して、高い精度で位置姿勢を算出できるようになる。

＜変形例＞
上述の説明では、共通パラメータの焦点距離を調節したが、地図の照合性能が向上する方法であれば、調節するのは共通パラメータの焦点距離に限定されない。例えば、画像中心座標（c_x2 ^＾，c_y2 ^＾）を調節してもよい。また、変換画像の画像サイズを調整してもよい。カメラモデルが異なる場合は、各カメラモデルの各々のパラメータを調整してもよい。

また、各々のカメラの画素を最大限利用できる最大画角となるような共通パラメータの焦点距離値を算出していたが、他の方法を用いることも可能である。例えば、リマップ時に入力画像中に参照しない画素が減るように、各カメラの画像のすべての領域が変換画像に含まれるように共通パラメータを算出してもよい。また、変換画像中の１画素が占める画角の平均値や中央値が、各カメラの各画素が占める画角の平均値や中央値と一致するようにしてもよい。さらに、変換画像の画質が高くなるように共通パラメータを算出してもよい。すなわち、いくつかの共通パラメータ候補を用いて変換した変換画像のＰＳＮＲやＭＳＥ、ＳＳＩＭなど画質評価値が高くなる共通パラメータを選択するようにしてよい。

さらに、複数生成した共通パラメータで地図との照合を実際に行った場合の性能を比較し、性能が高いパラメータを選択するような構成でもよい。地図との照合精度とは、例えば、位置姿勢算出精度であり、特徴点検出数や特徴点のマッチング個数を利用することができる。

（第４実施形態）
第４実施形態では、共通パラメータによる変換画像を生成しない形態について説明する。すなわち、第１～第３実施形態では、カメラの入力画像から変換画像を生成していたが、第４実施形態では、変換画像に相当する入力画像上の画素を、地図照合の際の画像参照時に参照する。

＜装置構成＞
第４実施形態における装置の構成は、第１実施形態（図２）から変換部１６を取り除いた構成である。また、入力部１５から入力画像が地図照合部１８に入力され、変換情報保持部１４から変換情報が地図照合部１８に入力する点が第１実施形態と異なる。

＜装置の動作＞
第４実施形態における装置の動作についても第１実施形態（図４）からステップＳ１５を取り除いたものとなる。また、ステップＳ１４では、入力部１５が入力画像を地図照合部１８に入力する点が異なり、ステップＳ１６では、地図照合部１が入力画像と地図保持部１７が保持する地図とを照合する点で異なる。

より具体的には、ステップＳ１６では、地図照合部１８は、入力画像から特徴点を検出する。次に、検出した特徴点の二次元座標を変換情報であるリマップテーブルを用いて共通パラメータで表される変換座標に変換する。この時、リマップテーブルは２次元配列の離散的な画素対応を表しているため、検出特徴点座標はバイリニア補間により中間座標を補間する。そして、変換された特徴点座標と地図保持部１７が保持する地図とを照合し、センサ１０の位置姿勢を算出する。

＜効果＞
以上説明したとおり第４実施形態によれば、画像を変換するのではなく、画像から検出した特徴点の二次元座標を共通パラメータで表される変換画像で検出された二次元座標に変換する。このようにすることで、変換した画像を保持するメモリを削減しつつ、異なるカメラで作成した地図を利用して位置姿勢を算出することができるようになる。

＜変形例＞
上述の説明では、変換情報とはリマップテーブルであった。これに限らず、変換情報は、地図照合に用いる要素を共通パラメータで表される幾何空間に変換できるものであれば良い。例えば、数式（６）の逆変換により入力画像から検出した特徴点座標を直接共通パラメータで表される二次元幾何空間の二次元座標に変換することもできる。このようにすることで、リマップテーブルにおける補間が必要ないためより高精度に二次元座標を変換することができる。

また、検出した特徴点だけでなく周囲の局所領域（例えば周囲１５ピクセル：以降では局所パッチと呼ぶ）を含めて、変換情報を用いて変換してもよい。そして、変換した局所パッチを用いて算出した特徴量を用いて地図との特徴点マッチングを行ってもよい。このようにすることで、特徴量を算出するためのパッチがカメラ間で共通する（すなわち共通パラメータで表される）ため、より高い精度で特徴点マッチングを行うことができるようになる。

（第５実施形態）
第５実施形態では、共通パラメータを用いずに作成された地図情報を、当該地図情報の作成に利用したカメラと異なるカメラで用いることを可能とする形態について述べる。具体的には、第１～第４実施形態で述べた共通パラメータを用いて作成された地図情報同様に利用可能とすべく地図情報を変換する。

＜装置構成＞
図８は、第５実施形態に係る情報処理装置５００の機能構成を示す図である。情報処理装置５００は、地図変換部５１、共通パラメータ生成部１１、パラメータ保持部１２、変換情報生成部１３、変換情報保持部１４、地図保持部１７を含む。情報処理装置１００と同一の参照符号を付した構成についてはほぼ同様の機能を有する。ただし、変換情報保持部１４が変換情報を地図変換部５１に出力すること、地図変換部５１が変換情報を用いて地図情報変換を行う点が異なる。

＜装置の動作＞
図９は、第５実施形態における情報処理装置５００の動作を説明するフローチャートである。ステップＳ１１及びステップＳ１２は第１実施形態と同様のため説明を省略する。ステップＳ１３では、変換情報生成部１３は、変換情報（リマップテーブル）を生成する。ここでは、地図を作成したカメラ２の歪み補正済みパラメータで表される画像座標から共通パラメータで表される変換画像座標に変換するリマップテーブルを生成する。

ステップＳ２１では、地図変換部５１は、変換情報を用いて地図情報を共通パラメータで表される形式に変換し変換地図情報を生成する。より詳細には、リマップテーブルを参照して、地図情報（カメラ２の歪み補正済みパラメータで表される地図情報）における特徴点の二次元座標を、共通パラメータで表される変換画像上で検出される二次元座標に変換する。このとき、二次元座標の算出には第４実施形態で述べた補間を用いることができる。

ステップＳ２２では、地図変換部５１は、変換により得られた変換地図情報を地図保持部１７に保存する。

＜効果＞
以上説明したとおり第５実施形態によれば、共通パラメータを用いずに作成した地図情報に含まれる特徴点の二次元座標を、共通パラメータで表される変換画像座標に変換する。このようにすることで、共通パラメータを用いずに作成された地図情報を、他のカメラでも用いることができるようになる。すなわち、第１～第４実施形態と同様に、カメラ毎に地図を再作成する手間や、共通パラメータ変更時の地図再作成の手間を減らすことができる
＜変形例＞
上述の説明では、地図情報に含まれる特徴点の二次元座標を、共通パラメータで表される変換画像上で検出される二次元座標に変換した。ただし、地図情報に、画像や特徴点周りのパッチといったカメラパラメータに紐づく情報が保持されている場合、画像や特徴点周りのパッチも合わせて変換してもよい。このようにすることで、マップと入力画像との特徴点マッチングや、位置姿勢計測精度が向上する。

また、１つの地図情報を共通パラメータで表されるように変換するだけでなく、複数の地図情報を共通パラメータで表されるように変換し合成する構成としてもよい。複数の地図情報は、それぞれ異なるカメラパラメータに基づき生成されたものであってもよい。地図の合成とは、二つの地図同士を位置合わせし、ひとつの地図情報にまとめ上げることである。地図の合成では、各々の地図に含まれる特徴点同士をマッチングし、マッチングした特徴点が同一座標となるように残りの地図要素の座標を変換する。このような構成とすることで、広大な領域（三次元空間）を複数のカメラで分担して並列に撮影・作成し合成することができ、地図作成時間を短縮することができるようになる。また、これに加えて複数の視点から同様に観測されている冗長な特徴点をＲａｕｌの方法により除去することで、地図の容量を削減することも可能である。

さらに、単一の装置に実装する構成について説明したが、サーバクライアントシステムとして構成してもよい。例えば、地図合成をサーバに実装し、地図作成を複数の移動ロボットのような複数のクライアントに実装する。個々のクライアントは個別のローカルな地図を作成・更新し、サーバに送信する。サーバは、受信した個々の地図を、上述した方法で合成し、グローバルな地図を更新する。また、サーバは、グローバルな地図の一部分をクライアントに送信し、クライアントは受信したローカルな地図を用いて位置姿勢や地図更新を行う。

また、共通パラメータで表される地図情報に変換し保存する代わりに、変換した地図情報をそのまま地図照合に用いる構成としてもよい。つまり、地図照合部１８が地図を利用するときに、利用時に参照する地図情報の要素のみ変換し、利用することもできる。すなわち、地図情報の変換は、地図情報すべてを変換してもよいし、照合に利用する情報のみ選択的に変換してもよい。また、地図保持部１７は、共通パラメータを用いずに作成した複数の地図情報を保持する構成としてもよい。このときには、それぞれの地図を地図照合部１８が利用するときに、必要に応じて共通パラメータとなるように地図を変換しつつ利用する。

（第１～第５実施形態における効果のまとめ）
第１実施形態によれば、カメラ１の画像を共通パラメータで表される変換画像にあらかじめ変換してから地図との照合を行う。このとき、地図を作成したカメラ２の歪み補正済みパラメータを共通パラメータとして用いる。このようにすることで、地図を作成したカメラと位置姿勢算出で用いるカメラが異なる場合であっても、画像と地図との照合や位置姿勢算出を、高精度で安定して行うことが可能となる。また、カメラ毎に地図を作成するという手間もなくなる。さらに、共通パラメータで表せられる画像への変換は、従来の歪み補正における画像補正処理（リマップ）におけるリマップテーブルを変えるだけで実現可能である。そのため、地図照合における処理時間の増加させることなく実現することができる。

第２実施形態によれば、ユーザは、変換後の画像を見ながら共通パラメータを設定することが出来る。例えば、カメラ１の入力画像に写る領域を最大限利用できる共通パラメータを設定したり、広角範囲を処理できる共通パラメータにしたりすることができ、ユーザの目的に応じた共通パラメータを設定することができるようになる。

第３実施形態によれば、各々のカメラの画素を最大限利用できる画角となる共通パラメータを生成することができる。それにより、異なるカメラで作成した地図を利用する場合においても、安定して、高い精度で位置姿勢を算出できるようになる。

第４実施形態によれば、画像を変換するのではなく、画像から検出した特徴点の二次元座標を共通パラメータで表される変換画像で検出された二次元座標に変換する。このようにすることで、変換した画像を保持するメモリを削減しつつ、異なるカメラで作成した地図を利用して位置姿勢を算出することができるようになる。

第５実施形態によれば、共通パラメータを用いずに作成した地図情報に含まれる特徴点の二次元座標を、共通パラメータで表される変換画像座標に変換する。このようにすることで、共通パラメータを用いずに作成された地図情報を、他のカメラでも用いることができるようになる。すなわち、第１～第４実施形態と同様に、カメラ毎に地図を再作成する手間や、共通パラメータ変更時の地図再作成の手間を減らすことができる。

（第１～第５実施形態における各構成要素のまとめ）
共通パラメータ生成部は、三次元空間を二次元配列に投影した時に、同じ対応関係となるようになるような共通パラメータを生成する。センサにカメラを用い、カメラモデルにピンホールカメラモデルを用いる場合には、共通パラメータc ^＾は、焦点距離（ｆ_x ^＾，ｆ_y ^＾）および、画像中心座標（ｃ_x ^＾，ｃ_y ^＾）で表される。

共通パラメータは、異なるカメラを用いたときにも三次元／二次元の対応関係が同じ対応関係になればよい。そのため、地図を作成したカメラの歪み補正済みパラメータを用いてもよいし、ユーザが入力した値から生成してもよい。さらに、複数のカメラパラメータから地図照合精度が向上するようなパラメータを生成してもよい。

パラメータ保持部は、共通パラメータ生成部が生成したパラメータを保持する。必要に応じて、パラメータを変換情報生成部や地図照合部に出力する。

変換情報生成部は、共通パラメータを用いて、入力画像を共通パラメータで表される変換画像に変換する変換情報を生成する。変換情報は入力画像と共通パラメータで表される変換画像の対応関係がわかればよく、変換式（例えば数式（６））や、リマップテーブルなど種別は問わない。

変換情報保持部は、変換情報生成部が生成した変換情報を保持する。また、必要に応じて変換情報を変換部に出力する。

入力部は、センサで取得したセンサ情報を入力し、変換部に出力する。センサとは、三次元空間を撮像して二次元配列に格納するものであればよい。モノクロカメラやカラーカメラ、ステレオカメラ、奥行カメラなど任意のカメラが利用可能である。また、三次元空間を射影して二次元配列に格納する構成の三次元ＬｉＤＡＲでもよい。センサは単眼でもよいしステレオやさらに複数のセンサを備えるように構成してもよい。

変換部は、入力部が入力するセンサ情報を、共通パラメータで表されるよう変換するものであればよい。センサ情報で画像を用いる場合には、リマップテーブルを参照して画像を変換してよい。また、画像から検出した特徴点の二次元座標を共通パラメータで表される変換画像の二次元座標に変換してもよい。

地図保持部は、入力部が入力するセンサ情報と異なるセンサで作成した地図情報を保持する。地図情報とは、三次元位置情報を持つ特徴と二次元位置情報として表される特徴を含む。センサ情報として画像を用いる場合は、地図情報は、画像から検出した画像特徴情報、画像特徴が検出された画像を撮影したカメラの位置姿勢情報、および画像特徴の三次元位置情報を保持する。しかし、地図情報のデータ構造はこれに限らず、三次元空間の位置を表す座標を持つ特徴と、それを二次元空間に射影した二次元空間の位置を表す特徴を保持する構成であればよい。三次元空間の位置を表す特徴としては、特徴点のようなある一点の三次元座表を保持するだけでなく、法線も持つＮＰ（Normal Point Data）でもよい。また、空間中の物体との境界位置を表すＳＤＦ（Signed Distance Function）やＴＳＤＦ（Truncated Signed Distance Function）でもよい。さらに三次元の線分でもよい。また、二次元空間の位置を表す特徴は、本実施形態で延べた特徴点に限らず、エッジでもよし、明暗の分布情報でもよい。

地図照合部は、変換部が変換したセンサ情報と地図情報とを照合する。照合処理は、位置姿勢算出でもよいし、地図との特徴点マッチングでもよい。位置姿勢算出では、ＳＬＡＭ技術を用いてもよい。また、地図との照合に限らず、地図情報を共通のパラメータで表されるように変換する地図変換部として構成してもよい。さらに、複数の地図を共通のパラメータで表されるようにし合成する地図合成部として構成してもよい。

（その他の実施例）
第１～第５実施形態においては、地図情報を作成するカメラ２と、その地図情報を利用して位置姿勢を算出するカメラ１の２つのカメラ間で地図情報を共通して利用する方法について述べた。しかし、地図情報を利用するカメラは２つに限定されるものではなく、さらに多くのカメラで地図情報を利用してよい。また、共通パラメータも、それら複数のカメラに対して適当なパラメータを生成できる。

例えば、第１実施形態で、複数のカメラのうちどれか１つの歪み補正済みパラメータを選択して共通パラメータとして用いればよい。第２実施形態で説明したＧＵＩ２００の表示部品２４１で、複数のカメラの画像の共通領域を提示してもよい。また、表示画像２５０でそれぞれのカメラの変換画像を提示してもよい。その場合、ユーザは、複数のカメラの画像を基に共通パラメータを決める。また、第３実施形態において、図４のステップＳ３１１で、３番目以降のカメラでも変換画像が画像領域に含まれるかを順次判定し、共通パラメータを生成する。

本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。

１情報処理装置；１１共通パラメータ生成部；１２パラメータ保持部；１３変換情報生成部；１４変換情報保持部；１５入力部；１６変換部；１７地図保持部；１８地図照合部

Claims

三次元空間を第１のカメラにより撮影して得られる第１の画像を取得する画像取得手段と、
前記三次元空間を前記第１のカメラとは異なる第２のカメラにより撮影して得られる第２の画像を第２の変換情報により幾何変換して得られる第２の変換画像に基づいて生成された地図情報を取得する地図情報取得手段と、
前記第１の画像を第１の変換情報により幾何変換して第１の変換画像を生成する画像変換手段と、
前記地図情報と前記第１の変換画像とを照合する照合手段と、
を有し、
前記第１の変換情報および前記第２の変換情報は、前記三次元空間と前記第１の変換画像との幾何対応関係と前記三次元空間と前記第２の変換画像との幾何対応関係とが共通の幾何対応関係となるように設定される
ことを特徴とする情報処理装置。
前記第１の変換情報は前記第１のカメラのカメラパラメータを含み、前記第２の変換情報は前記第２のカメラのカメラパラメータを含む
ことを特徴とする請求項１に記載の情報処理装置。
前記第２の変換情報は、前記第２のカメラにより撮影された画像に対する画角、画像中心の調整または歪み補正の少なくとも何れか一つを行う変換情報である
ことを特徴とする請求項１または２に記載の情報処理装置。
前記共通の幾何対応関係と前記第１のカメラのカメラパラメータとに基づいて前記第１の変換情報を生成する変換情報生成手段をさらに有する
ことを特徴とする請求項１乃至３の何れか１項に記載の情報処理装置。
前記第１の画像および前記第２の画像は、デプスマップを含む
ことを特徴とする請求項１乃至４の何れか１項に記載の情報処理装置。
前記共通の幾何対応関係を示す共通パラメータを生成するパラメータ生成手段をさらに有する
ことを特徴とする請求項１乃至５の何れか１項に記載の情報処理装置。
前記パラメータ生成手段は、前記第２のカメラのカメラパラメータまたは前記第２のカメラにより撮影された画像の歪みおよびバイアスを補正した画像におけるカメラパラメータの何れか一つを選択する
ことを特徴とする請求項６に記載の情報処理装置。
前記パラメータ生成手段は、前記第１の変換画像に含まれる前記第１のカメラによる撮像領域量または変換画像の画質の高さを表す度合の少なくとも一方に基づいて前記共通パラメータを生成する
ことを特徴とする請求項６に記載の情報処理装置。
前記パラメータ生成手段は、ユーザにより指定されたカメラパラメータに基づいて前記共通パラメータを生成する
ことを特徴とする請求項６に記載の情報処理装置。
前記パラメータ生成手段は、前記第１のカメラによる撮影範囲と前記第２のカメラによる撮影範囲とに基づいて前記共通パラメータを生成する
ことを特徴とする請求項６に記載の情報処理装置。
前記パラメータ生成手段は、前記第１の変換画像の範囲が前記第１のカメラによる撮影範囲と前記第２のカメラによる撮影範囲との両方に含まれるように前記共通パラメータを生成する
ことを特徴とする請求項１０に記載の情報処理装置。
前記第１の変換画像に基づいて前記地図情報を更新する地図情報更新手段をさらに有する
ことを特徴とする請求項１乃至１１の何れか１項に記載の情報処理装置。
三次元空間を第１のカメラにより撮影して得られる第１の画像を取得する画像取得手段と、
前記三次元空間を前記第１のカメラとは異なる第２のカメラにより撮影して得られる第２の画像を第２の変換情報により幾何変換して得られる第２の変換画像に基づいて生成された地図情報を取得する地図情報取得手段と、
前記第１の画像の特徴点と、該第１の画像の特徴点の座標を第１の変換情報により幾何変換して得られる変換座標における前記地図情報とを照合する照合手段と、
を有し、
前記第１の変換情報および前記第２の変換情報は、前記三次元空間と前記第１の画像を前記第１の変換情報により変換した第１の変換画像との幾何対応関係と前記三次元空間と前記第２の変換画像との幾何対応関係とが共通の幾何対応関係となるように設定される
ことを特徴とする情報処理装置。
前記三次元空間を第３のカメラにより撮影して得られる第３の画像を第３の変換情報により幾何変換して得られる第３の変換画像に基づいて生成された第２の地図情報を取得する第２の地図情報取得手段と、
前記第２の地図情報を前記地図情報と共通の幾何対応関係となるよう変換し変換地図情報を生成する地図情報変換手段と、
をさらに有する
ことを特徴とする請求項１乃至１３の何れか１項に記載の情報処理装置。
前記地図情報と前記変換地図情報とを単一の地図情報に合成する合成手段をさらに有する
ことを特徴とする請求項１４に記載の情報処理装置。
前記照合手段は、前記照合により前記第１のカメラの位置姿勢を算出する
ことを特徴とする請求項１乃至１５の何れか１項に記載の情報処理装置。
三次元空間を撮影する第１のカメラと接続される情報処理装置の制御方法であって、
前記第１のカメラにより得られる第１の画像を取得する画像取得工程と、
前記三次元空間を前記第１のカメラとは異なる第２のカメラにより撮影して得られる第２の画像を第２の変換情報により幾何変換して得られる第２の変換画像に基づいて生成された地図情報を取得する地図情報取得工程と、
前記第１の画像を第１の変換情報により幾何変換して第１の変換画像を生成する画像変換工程と、
前記地図情報と前記第１の変換画像とを照合する照合工程と、
を含み、
前記第１の変換情報および前記第２の変換情報は、前記三次元空間と前記第１の変換画像との幾何対応関係と前記三次元空間と前記第２の変換画像との幾何対応関係とが共通の幾何対応関係となるように設定される
ことを特徴とする制御方法。
三次元空間を撮影する第１のカメラと接続される情報処理装置の制御方法であって、
前記第１のカメラにより得られる第１の画像を取得する画像取得工程と、
前記三次元空間を前記第１のカメラとは異なる第２のカメラにより撮影して得られる第２の画像を第２の変換情報により幾何変換して得られる第２の変換画像に基づいて生成された地図情報を取得する地図情報取得工程と、
前記第１の画像の特徴点と、該第１の画像の特徴点の座標を第１の変換情報により幾何変換して得られる変換座標における前記地図情報とを照合する照合工程と、
を含み、
前記第１の変換情報および前記第２の変換情報は、前記三次元空間と前記第１の画像を前記第１の変換情報により変換した第１の変換画像との幾何対応関係と前記三次元空間と前記第２の変換画像との幾何対応関係とが共通の幾何対応関係となるように設定される
ことを特徴とする制御方法。
コンピュータを、請求項１乃至１６の何れか１項に記載の情報処理装置の各手段として機能させるためのプログラム。