WO2022186256A1

WO2022186256A1 - マップ情報更新方法

Info

Publication number: WO2022186256A1
Application number: PCT/JP2022/008794
Authority: WO
Inventors: 哲也田中; 幸宏笹川
Original assignee: 株式会社ソシオネクスト
Priority date: 2021-03-04
Filing date: 2022-03-02
Publication date: 2022-09-09
Also published as: US20230335016A1; JPWO2022186256A1

Abstract

マップ情報更新方法は、１つ以上の投影関係を取得するステップと、１つ以上の投影関係の各々に対して再投影誤差情報を取得するステップと、１つ以上のランドマークの各々に対して、当該ランドマークに関連付けられたすべての再投影誤差情報に基づく第１の合計値を求めるステップと、１つ以上のキーフレームの各々に対して、当該キーフレームに関連付けられたすべての再投影誤差情報に基づく第２の合計値を求めるステップと、１つ以上のランドマークの各々に対して、第１の合計値から当該ランドマークの位置情報の更新値である位置情報更新値を推論し、位置情報更新値を用いて当該ランドマークの位置情報を更新するステップと、１つ以上のキーフレームの各々に対して、第２の合計値から当該キーフレームの姿勢情報の更新値である姿勢情報更新値を推論し、姿勢情報更新値を用いて当該キーフレームの姿勢情報を更新するステップと、を含む。

Description

マップ情報更新方法

　本開示は、マップ情報更新方法に関する。

　従来、カメラを用いて撮影を行い、撮影された画像であるキーフレームに含まれる情報から、カメラの位置と周辺のランドマークの位置との推定を同時に行うＶＳＬＡＭ（Ｖｉｓｕａｌ　Ｓｉｍｕｌｔａｎｅｏｕｓ　Ｌｏｃａｌｉｚａｔｉｏｎ　ａｎｄ　Ｍａｐｐｉｎｇ）技術が知られている。

　ＶＳＬＡＭ技術において中心となる処理は、撮影されたランドマークのキーフレーム内での位置と、仮定したキーフレームの姿勢情報（つまり、カメラの位置及び向き）と仮定したランドマーク位置から算出したキーフレーム内での位置である再投影位置との誤差である再投影誤差と、を求めることと、再投影誤差が０になる（現実的には誤差が十分小さくなる）キーフレームの姿勢情報及びランドマークの位置を求めることである。キーフレームの姿勢情報及びランドマークの位置を組み合わせた情報は、マップ情報と称される。

　再投影誤差が０になるようなマップ情報を探索することは、バンドル調整と称され、一般に非線形最小二乗法の最適化問題に分類される処理である。このため、バンドル調整においては、マップ情報を再投影誤差が減少するように微小に補正し、再投影誤差の値が収束するまで当該補正を反復する、という処理が必要になる（例えば、特許文献１、非特許文献１、非特許文献２参照）。

特表２０１７－５０３２９０号公報

岩元祐輝、菅谷保之、金谷健一、３次元復元のためのバンドル調整の実装と評価、情報処理学会研究報告、２０１１－ＣＶＩＭ－１７５－１９、ｐｐ．１－８、２０１１岡谷貴之、バンドルアジャストメント、情報処理学会研究報告、２００９－ＣＶＩＭ１６７－３７、ｐｐ．１－１６、２００９

　ＶＳＬＡＭ技術においては、新しいキーフレームが追加されるたびに新たに再投影誤差が算出され、バンドル調整を経てマップ情報が更新される。このような処理は、マップ情報の精度を維持するには必須の処理である。

　バンドル調整時に必要となる収束のためのアルゴリズムとして、勾配法を用いたアルゴリズムが一般に使用されている。勾配法を用いたアルゴリズムとして、例えば最急降下法とガウス・ニュートン法とを組み合わせたアルゴリズムが知られている。このアルゴリズムにおいては、再投影誤差が最小値に近づくまでは最急降下法を用いて補正を行い、再投影誤差が最小値に近づいた後は、ガウス・ニュートン法で補正を行う。このようなアルゴリズムにおいては、補正の繰り返し毎に、ヘッセ行列の生成、及び、連立方程式を解くことによる補正量の算出という演算量の多い処理を実行する必要がある。このような演算量の多い処理が含まれることがＶＳＬＡＭ技術を用いる際に問題となる。

　本開示は、このような問題を解決するためになされたものであり、演算量を削減できるマップ情報更新方法を提供することを目的とする。

　上記目的を達成するために、本開示の一形態に係るマップ情報更新方法は、１つ以上のランドマークにそれぞれ対応付けられた１つ以上の位置情報と、１つ以上のキーフレームにそれぞれ対応付けられた１つ以上の姿勢情報と、を含むマップ情報を更新するマップ情報更新方法であって、前記１つ以上のキーフレームの各々は、前記１つ以上のランドマークの少なくとも１つを含むように撮影された撮影画像であり、前記１つ以上の姿勢情報の各々は、位置、及び向きの情報を含み、１つ以上の投影関係を取得する投影関係取得ステップであって、前記１つ以上の投影関係の各々は、前記１つ以上のランドマークの各々と、前記１つ以上のキーフレームの各々と、前記１つ以上のキーフレームの各々に前記１つ以上のランドマークの各々を投影したときの投影点の当該キーフレーム上の座標に対応する投影座標情報と、の関係である、投影関係取得ステップと、前記１つ以上の投影関係の各々に対して、前記１つ以上の位置情報のうち、当該投影関係を構成する前記１つ以上のランドマークの１つに対応付けられた位置情報と、前記１つ以上の姿勢情報のうち、当該投影関係を構成する前記１つ以上のキーフレームの１つに対応付けられた姿勢情報と、当該投影関係を構成する前記投影座標情報と、に基づいて再投影誤差情報を取得し、前記再投影誤差情報を当該投影関係に関連付ける再投影誤差情報取得ステップと、前記１つ以上のランドマークの各々に対して、当該ランドマークに関連付けられたすべての前記再投影誤差情報が集約された第１の再投影誤差情報群を生成し、前記第１の再投影誤差情報群に含まれるすべての前記再投影誤差情報に基づく第１の合計値を求めるランドマーク起点誤差集約ステップと、前記１つ以上のキーフレームの各々に対して、当該キーフレームに関連付けられたすべての前記再投影誤差情報が集約された第２の再投影誤差情報群を生成し、前記第２の再投影誤差情報群に含まれるすべての前記再投影誤差情報に基づく第２の合計値を求めるキーフレーム起点誤差集約ステップと、前記１つ以上のランドマークの各々に対して、前記第１の合計値から前記１つ以上の位置情報のうち当該ランドマークの位置情報の更新値である位置情報更新値を推論し、前記位置情報更新値を用いて当該ランドマークの位置情報を更新する位置情報更新ステップと、前記１つ以上のキーフレームの各々に対して、前記第２の合計値から前記１つ以上の姿勢情報のうち当該キーフレームの姿勢情報の更新値である姿勢情報更新値を推論し、前記姿勢情報更新値を用いて当該キーフレームの姿勢情報を更新する姿勢情報更新ステップと、を含む。

　本開示により、演算量を削減できるマップ情報更新方法を提供できる。

図１は、実施の形態１に係るマップ情報更新方法の流れを示すフローチャートである。図２は、バンドル調整におけるマップ情報と再投影誤差との関係を示す模式的なグラフである。図３は、実施の形態１に係る予測マップ情報の概要を説明するための模式的なグラフである。図４は、実施の形態１に係る予測マップ情報を算出する方法を示すフローチャートである。図５は、キーフレーム及びランドマークに係る投影関係を説明する模式図である。図６は、実施の形態１に係る第１の再投影誤差情報群を説明するための模式図である。図７は、実施の形態１に係る第２の再投影誤差情報群を説明するための模式図である。図８は、実施の形態１に係るマップ情報更新装置の機能構成を示すブロック図である。図９は、各実施の形態に係る方法をソフトウェアにより実行するためのコンピュータのハードウェア構成の一例を示す図である。

　以下、本開示の実施の形態について、図面を用いて詳細に説明する。なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示す。以下の実施の形態で示される数値、形状、材料、規格、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序等は、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、本開示の最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、各図は、必ずしも厳密に図示したものではない。各図において、実質的に同一の構成については同一の符号を付し、重複する説明は省略又は簡略化する場合がある。

　（実施の形態１）
　実施の形態１に係るマップ情報更新方法について説明する。

　［１－１．マップ情報更新方法の概要］
　まず、マップ情報更新方法の概要について説明する。マップ情報更新方法は、カメラを用いて撮影を行い、撮影された画像であるキーフレームに含まれる情報から、カメラの位置と周辺のランドマークの位置との推定を同時に行うＶＳＬＡＭ技術において用いられる方法である。本実施の形態に係るマップ情報更新方法は、１つ以上のランドマークにそれぞれ対応付けられた１つ以上の位置情報と、１つ以上のキーフレームにそれぞれ対応付けられた１つ以上の姿勢情報と、を含むマップ情報を更新する。１つ以上のキーフレームの各々は、１つ以上のランドマークの少なくとも１つを含むように撮影された撮影画像である。１つ以上の姿勢情報の各々は、撮影に用いられるカメラの位置、及び向きの情報を含む。

　ＶＳＬＡＭ技術においては、まず、第１の座標系として、３次元座標系を１つ想定し、第１の座標系にカメラを配置する。第１の座標系は、カメラなどが配置される空間に対して固定された座標系であり、ワールド座標系とも称される。当該カメラにより撮影されたキーフレームからランドマークを生成する。ここで、ランドマークとは、第１の座標系に作られた３次元点であり、例えば、二つのキーフレームの各々に含まれる対応する特徴点に基づいて、三角測量によりランドマークが生成される。本実施の形態に係るマップ情報更新方法においては、カメラと、１つ以上のランドマークとの第１の座標系での推定位置を含むマップ情報を更新する。具体的には、カメラで撮影されたキーフレームの情報がマップ情報に追加された場合、かつ／またはバンドル調整をした場合に本実施の形態に係るマップ情報を更新する。

　以下、本実施の形態に係るマップ情報更新方法について、図１を用いて説明する。図１は、本実施の形態に係るマップ情報更新方法の流れを示すフローチャートである。

　図１に示されるように、本実施の形態に係るマップ情報更新方法においては、まず、マップ情報を取得する（Ｓ２０）。マップ情報には、少なくとも、１つ以上のランドマークの位置情報と、１つ以上のキーフレームの姿勢情報とが含まれる。

　続いて、カメラで撮影されたキーフレームにおける第２の座標系での１つ以上のランドマークの位置を示す投影座標情報を取得する（Ｓ３０）。第２の座標系は、撮影画像に対して固定された座標系であり、キーフレーム座標系とも称される。投影座標情報は、１つ以上のランドマークの位置に対応する特徴点の第２の座標系での位置である。言い換えると、投影座標情報は、１つ以上のキーフレームの各々に１つ以上のランドマークの各々を投影したときの投影点の当該キーフレーム上の座標に対応する情報である。

　続いて、ステップＳ２０で取得されたマップ情報に投影座標情報を追加することで追加マップ情報を生成する（Ｓ４０）。追加マップ情報には、投影座標情報に係る情報が追加されてもよい。例えば、投影座標情報に係る情報は、キーフレームに含まれる特徴点に基づいて生成されるランドマークの推定位置などである。投影座標情報に係る情報は、カメラの位置などから簡易的に概算された情報であってもよい。

　ステップＳ４０の後に、ステップＳ４０で生成された追加マップ情報に基づいて予測マップ情報を算出し、ステップＳ４０で更新されたマップ情報を予測マップ情報に更新する（Ｓ５０）。ここで、予測マップ情報の算出方法について説明する。マップ情報の更新において、一般にバンドル調整を行う。つまり、再投影誤差が０になるようなマップ情報を探索する。本実施の形態では、再投影誤差は、位置情報と、姿勢情報と、投影座標情報とに基づいて取得された情報である。より具体的には、投影座標情報と、当該投影座標における投影座標情報に対応する撮影画像上の再投影位置であって、マップ情報に基づいて算出される再投影位置との誤差を算出する関数である再投影誤差関数を用いて算出される。なお、再投影誤差は、マップ情報に含まれる１つ以上のランドマークに対して再投影誤差関数を用いて算出された誤差、及び、１つ以上のキーフレームの各々に対して再投影誤差関数を用いて算出された誤差の、一方又は両方の総和を含んでもよい。

　ここで、バンドル調整の概要について図２を用いて説明する。図２は、バンドル調整におけるマップ情報と再投影誤差との関係を示す模式的なグラフである。図２の横軸は、マップ情報を一つの変数として模式的に表現した量を示し、縦軸は、マップ情報に対する再投影誤差を示す。

　図２に示されるように、バンドル調整によって、バンドル調整前のマップ情報を、再投影誤差を最小化させるマップ情報に補正する。例えば、最急降下法とガウス・ニュートン法とを組み合わせたアルゴリズムなどの勾配法を用いたアルゴリズムによりバンドル調整を行う場合には、バンドル調整前のマップ情報に対して微小な補正量で補正を行い、補正後の再投影誤差を算出することを繰り返すことで、再投影誤差を最小化させるマップ情報を探索する。なお、以下では、再投影誤差を最小化させるマップ情報のことをマップ情報の解とも称する。ここで、勾配法を用いた空間幾何学的なアルゴリズムにおいては、補正の繰り返し毎に、ヘッセ行列の生成、及び、非線形最小二乗法を用いる連立方程式を解くことによる補正量の算出という演算量の多い処理が含まれる。特に、バンドル調整前のマップ情報と、マップ情報の解との間の誤差が大きい場合には、多数回の反復演算を行う必要がある。

　このような従来技術に対して本実施の形態では、予測マップ情報の算出の少なくとも一部に推論エンジンを用いることで演算量を削減する。本実施の形態に係る予測マップ情報の算出方法の概要について、図３を用いて説明する。図３は、本実施の形態に係る予測マップ情報の概要を説明するための模式的なグラフである。

　図３に示されるように、本実施の形態では、推論エンジンを用いて、マップ情報に基づき、再投影誤差が最小値に近いマップ情報を予測マップ情報として算出する。これにより、勾配法を用いたアルゴリズムによる演算を繰り返すことなく、再投影誤差が最小値に近いマップ情報を取得することができる。このような推論エンジンに含まれる予測用ニューラルネットワークは、学習用マップ情報を入力とし、学習用更新済マップ情報を教師データとして学習した学習済みのニューラルネットワークである。ここでの学習は、学習用更新済みマップ情報と、ニューラルネットワーク出力のマップ情報との差分に基づいた損失関数を考え、その損失関数を０にするように学習を進める。学習用マップ情報は、本実施の形態に係るマップ情報更新方法で用いる追加マップ情報と同様の情報であれば特に限定されない。

　学習用更新済マップ情報は、学習用マップ情報に基づいて生成され、かつ、再投影誤差関数を用いて算出された再投影誤差を減少させるマップ情報である。このことから、学習における損失関数はこの再投影誤差関数に基づいたものとしてもよい。再投影誤差関数は（学習用）マップ情報から直接求まるため、この場合の学習では教師データとしての学習用更新済マップ情報は不要となる。ここで、再投影誤差関数は、投影座標情報と、投影座標情報に対応する撮影画像上の再投影位置であって、マップ情報に基づいて算出される再投影位置との誤差を算出する関数である。再投影誤差関数として、具体的には、例えば、非特許文献１などに記載されているような周知の関数を用いることができる。

　学習用更新済マップ情報は、例えば、学習用投影座標情報及び学習用マップ情報に対して勾配法を用いて実際にバンドル調整を行うことで得られる。なお、再投影誤差を減少させるマップ情報は、例えば、再投影誤差を最小化させるマップ情報であってもよい。再投影誤差を最小化させるマップ情報とは、再投影誤差を厳密に最小化させるマップ情報に限定されず、再投影誤差を概ね最小化させるマップ情報も含む。例えば、マップ情報の再投影誤差と、再投影誤差の最小値との差が、当該最小値の５％以下となるマップ情報も、再投影誤差を最小化させるマップ情報に含まれる。

　本実施の形態に係る予測用ニューラルネットワークが、上記学習を行うことで、マップ情報と再投影誤差との関係を示す誤差関数の形状を学習する。予測用ニューラルネットワークの学習は、誤差関数へのフィッティングに相当する処理である。予測用ニューラルネットワークは、誤差関数の形状を学習することで、再投影誤差を最小化させるマップ情報を予測できるようになる。なお、マップ情報に含まれるカメラの位置などの情報は、マップ情報に応じて変化するが、予測用ニューラルネットワークが学習した誤差関数は変化しない。また、予測マップ情報は、再投影誤差を最小化させるマップ情報でなくてもよい。

　なお、本実施の形態に係るマップ情報更新方法において、推論エンジンを用いて算出される予測マップ情報が、マップ情報の解から遠ざかる（つまり、予測マップ情報と、マップ情報の解との差が、追加マップ情報と、マップ情報の解との差より大きくなる）ことを抑制するステップが追加されてもよい。例えば、追加マップ情報に対してマップ情報の解へ近づく補正方向を予測する推論エンジンを予め準備し、当該推論エンジンによって、予測マップ情報が追加マップ情報よりマップ情報の解へ近づいているか否かを判定してもよい。

　本実施の形態では、従来技術の勾配法における連立方程式の解計算などの演算の少なくとも一部を、推論エンジンを用いた推論に置き換えることができる。このため、本実施の形態では、勾配法に対して、計算量を削減でき、かつ、演算の並列度を高められる。したがって、本実施の形態では、マップ情報更新の高速化及び低消費電力化などの効果が得られる。さらに、推論エンジンを用いた推論では、演算精度も低減し得る。このため、マップ情報更新方法を実行するためのコンピュータなどのハード構成を簡素化することも可能となる。なお、推論エンジンを用いた予測マップ情報の算出方法の詳細については、後述する。

　続いて、図１に示されるように、ステップＳ５０で更新されたマップ情報に対して更新済マップ情報を空間幾何学的に算出し、ステップＳ５０で更新されたマップ情報を更新済マップ情報に更新する（Ｓ６０）。つまり、従来技術と同様に、例えば、最急降下法とガウス・ニュートン法とを組み合わせたアルゴリズムを用いて、マップ情報を更新することで、マップ情報をマップ情報の解に近づける。

　続いて、マップ情報に対する再投影誤差を算出する（Ｓ７０）。具体的には、上述した再投影誤差関数を用いて、マップ情報に対する再投影誤差を算出する。

　続いて、ステップＳ６０で更新されたマップ情報に対して再投影誤差関数を用いて算出された再投影誤差に基づいてステップＳ６０で更新されたマップ情報の更新の収束を判定し、判定の結果に基づいて、予測ステップ、若しくは更新ステップへ戻るか、又は、ステップＳ６０で更新されたマップ情報の更新を終了するかを決定する（Ｓ８０）。例えば、再投影誤差の前回の判定時から変化量（最初の判定時においては、予測マップ情報に対する再投影誤差からの変化量）ΔＥが予め定められた収束閾値Ｓｃより小さい場合には（Ｓ８０でΔＥ＜Ｓｃ）、マップ情報の解が求められたと判断して、マップ情報の更新を終了する。また、再投影誤差Ｅが、上限値Ｓｕより大きい場合には（Ｓ８０でＥ＞Ｓｕ）、予測マップ情報が適切でないと判断してステップＳ５０に戻り、再度予測マップ情報を算出する。また、再投影誤差の前回の判定時から変化量ΔＥが、収束閾値Ｓｃ以上であり、再投影誤差Ｅが、上限値Ｓｕ以下である場合には（Ｓ８０でΔＥ≧Ｓｃ、Ｅ≦Ｓｕ）、ステップＳ６０に戻り、再度、勾配法を用いたマップ情報の更新を行う。

　以上のようなマップ情報更新方法により、マップ情報更新に要する演算量を、従来技術を用いる場合より削減できる。

　［１－２．予測マップ情報の算出方法］
　本実施の形態に係るマップ情報更新方法における予測マップ情報の算出方法について、図４を用いて説明する。図４は、本実施の形態に係る予測マップ情報を算出する方法を示すフローチャートである。

　図４に示されるように、まず、投影関係を取得する（投影関係取得ステップＳ５１０）。ここで、投影関係について、図５を用いて説明する。図５は、キーフレーム及びランドマークに係る投影関係を説明する模式図である。投影関係とは、１つのランドマークと、１つのキーフレームと、当該１つのキーフレームに当該１つのランドマークを投影したときの投影点の当該キーフレーム上の座標に対応する投影座標情報との関係である。図５には、二つのランドマークＬＭ１、ＬＭ２と、二つのキーフレームＫＦ１、ＫＦ２と、が示されている。また、図５には、ランドマークＬＭ１を、キーフレームＫＦ１、及びＫＦ２にそれぞれ投影した投影座標情報Ｃ１１、Ｃ１２が示されており、ランドマークＬＭ２を、キーフレームＫＦ１、及びＫＦ２にそれぞれ投影した投影座標情報Ｃ２１、Ｃ２２が示されている。

　本ステップでは、１つ以上のランドマークの各々と、１つ以上のキーフレームの各々とに対する投影関係を取得する。図５に示される例では、ランドマークＬＭ１と、キーフレームＫＦ１と、投影座標情報Ｃ１１との対応関係と、ランドマークＬＭ１と、キーフレームＫＦ２と、投影座標情報Ｃ１２との対応関係と、ランドマークＬＭ２と、キーフレームＫＦ１と、投影座標情報Ｃ２１との対応関係と、ランドマークＬＭ２と、キーフレームＫＦ２と、投影座標情報Ｃ２２との対応関係と、が含まれる。また、投影座標情報とは、キーフレームに投影されたランドマークの当該キーフレーム上の実際の投影点の座標であり、マップ情報から算出された座標ではない。

　続いて、図４に示されるように、１つ以上の投影関係の各々に対して、再投影誤差情報を取得し、再投影誤差情報を当該投影関係に関連付ける（再投影誤差情報取得ステップＳ５２０）。再投影誤差情報は、１つの投影関係に対応する、１つ以上の位置情報のうちの一つ、１つ以上の姿勢情報のうちの一つ、及び、投影座標情報から再投影誤差を推論した結果を示す特徴量を含む。ここで、再投影誤差は、当該位置情報、当該姿勢情報、及び、当該投影座標情報から空間幾何学的に算出される誤差であり、本実施の形態では、この再投影誤差を算出することに代えて、この再投影誤差を推論した結果を示す特徴量を求める。再投影誤差情報に含まれる特徴量は、例えば、ランドマーク及びキーフレームに対応する投影関係に対応する重みベクトル、誤差ベクトルなどを含む。言い換えると、当該特徴量は、マップ情報の更新値を算出するために用いられるヘッセ行列の対角要素を含むブロックに共通して含まれる項を含む。

　ここで、この特徴量について、ヘッセ行列を用いて詳細に説明する。従来のガウス・ニュートン法によるマップ情報の更新値を求める方程式は、ヘッセ行列Ｈと、パラメータξの更新値Δξを用いて以下の式（１）で表される。

　ここで、式（１）の行列及びベクトルの要素を記載すると以下の式（２）で表される。

　なお、式（２）のヘッセ行列において、対角ブロック以外の記載は省略されている。

　ここで、αを１以上Ｎ以下の整数とすると、ヘッセ行列のランドマークに関するブロックと、式（１）の右辺の勾配ベクトルの各要素のうち、当該ブロックに関連する要素は以下の式（３ａ）、（３ｂ）で表される。

　式（３ａ）、（３ｂ）において、Ｉ_αｊは、０又は１であり、ｊ番目のカメラの姿勢からα番目のランドマークの視認性を示す。Ｒ_ｊは、ｊ番目のカメラの姿勢を示す回転行列である。Ｗ_αｊは、α番目のランドマークとｊ番目のカメラの姿勢から計算される３×２行列である。ｅ_αｊは、再投影座標と、投影座標情報（実際の投影点の座標）との差であり、２次元座標ベクトルとなる。

　また、ヘッセ行列のうち対角ブロック（ｄｉａｇｏｎａｌ　ｂｌｏｃｋｓ）と、勾配ベクトルの対角ブロックに関連する要素は、κを１以上Ｍ以下の整数とすると、以下の式（４ａ）～（５ｃ）で表される。

　ここで、ｘ_ｉは、ｉ番目のランドマークの位置情報である。ｔ_κは、κ番目のカメラの姿勢の並進ベクトルで、カメラ位置である。

　ヘッセ行列などが以上のように表される場合、特徴量は、ｕ_ακ、Ｒ_κＷ_ακ、（ｘ_α－ｔ_κ）に基づいて算出される。ここで、ｕ_ακは、再投影座標を表す。Ｒ_κＷ_ακは、重み係数を表す。（ｘ_α－ｔ_κ）は、ランドマークとキーフレームとの相対位置を示す。このような特徴量は、対応関係毎に得られる。

　続いて、ランドマーク起点誤差を集約する（ランドマーク起点誤差集約ステップＳ５３０）。つまり、１つ以上のランドマークの各々に対して、当該ランドマークに関連付けられたすべての再投影誤差情報が集約された第１の再投影誤差情報群を生成し、第１の再投影誤差情報群に含まれるすべての再投影誤差情報に基づく第１の合計値を求める。ここで、第１の再投影誤差情報群について、図６を用いて説明する。図６は、本実施の形態に係る第１の再投影誤差情報群を説明するための模式図である。図６には、ランドマークＬＭ１が３つのキーフレームＫＦ１、ＫＦ２、及びＫＦ３だけに投影されている構成例が示されている。図６に示されるように、あるランドマークＬＭ１が、３つのキーフレームＫＦ１、ＫＦ２、及びＫＦ３だけに投影されている場合について説明する。この場合、ランドマークＬＭ１の位置情報、キーフレームＫＦ１の姿勢情報、及び、ランドマークＬＭ１のキーフレームＫＦ１への投影座標情報から、再投影誤差情報が算出される。このような再投影誤差情報の算出を、他のキーフレームＫＦ２及びＫＦ３についても行い、これらの３つの再投影誤差を集約する。他のランドマークについてもそれぞれ再投影誤差を集約する。

　具体的には、上述した対応関係毎に得られる特徴量が要素毎に合計される。このような誤差が集約されることで、上記式（３ａ）に示されるランドマークに関するブロック、及び、上記式（３ｂ）に示される勾配ベクトルの当該ブロックに関連する要素が得られる。

　続いて、図４に示されるように、キーフレーム起点誤差を集約する（キーフレーム起点誤差集約ステップＳ５４０）。つまり、１つ以上のキーフレームの各々に対して、当該キーフレームに関連付けられたすべての再投影誤差情報が集約された第２の再投影誤差情報群を生成し、第２の再投影誤差情報群に含まれるすべての再投影誤差情報に基づく第２の合計値を求める。ここで、第２の再投影誤差情報群について、図７を用いて説明する。図７は、本実施の形態に係る第２の再投影誤差情報群を説明するための模式図である。図７には、キーフレームＫＦ１に、３つのランドマークＬＭ１、ＬＭ２、及びＬＭ３だけが投影されている構成例が示されている。図７に示されるように、あるキーフレームＫＦ１に、ランドマークＬＭ１、ＬＭ２、及びＬＭ３だけが投影されている場合について説明する。この場合、キーフレームＫＦ１の姿勢情報、ランドマークＬＭ１の位置情報、及び、ランドマークＬＭ１のキーフレームＫＦ１への投影座標情報から、再投影誤差情報が算出される。このような再投影誤差情報の算出を、他のランドマークＬＭ２及びＬＭ３についても行い、これらの３つの再投影誤差を集約する。他のキーフレームについてもそれぞれ再投影誤差を集約する。

　具体的には、上述した対応関係毎に得られる特徴量が要素毎に合計される。このような誤差が集約されることで、上記式（４ａ）～（４ｃ）、（５ａ）～（５ｃ）に示されるヘッセ行列の対角ブロック、及び、勾配ベクトルの上記式（３ｂ）に示される勾配ベクトルの当該ブロックに関連する要素が得られる。

　続いて、図４に示されるように、位置情報を更新する（位置情報更新ステップＳ５５０）。本ステップでは、１つ以上のランドマークの各々に対して、ランドマーク起点誤差集約ステップＳ５３０で算出した第１の合計値から当該ランドマークの位置情報の更新値である位置情報更新値を推論し、当該位置情報更新値を用いて当該ランドマークの位置情報を更新する。

　続いて、姿勢情報を更新する（姿勢情報更新ステップＳ５６０）。本ステップでは、１つ以上のキーフレームの各々に対して、キーフレーム起点誤差集約ステップＳ５４０で算出した第２の合計値から当該キーフレームの姿勢情報の更新値である姿勢情報更新値を推論し、当該姿勢情報更新値を用いて当該キーフレームの姿勢情報を更新する。

　以上のように、１つ以上のランドマークの各々の位置情報更新値、及び、１つ以上のキーフレームの姿勢情報更新値を求めることができる。これらの位置情報更新値及び姿勢情報更新値に基づいて予測マップ情報を得ることができる。

　本実施の形態では、上述したように、位置情報更新値及び姿勢情報更新値を推論することによって求められるため、空間幾何学的に算出する場合より、大幅に演算量を削減できる。また、本実施の形態では、位置情報の推論と、姿勢情報の推論とを分離することで、推論における解の自由度を低減できるため、より正確に推論することが可能となる。

　また、本実施の形態では、位置情報の推論と、姿勢情報の推論とを分離すること、さらには姿勢情報の推論を、向きと位置に分離することで、各推論エンジンの解の自由度を低減できるため、より確実に学習させることができる。なお、各推論エンジンの学習方法については後述する。

　また、本実施の形態では、再投影誤差情報も推論によって求めるため、さらに演算量を削減できる。

　［１－３．マップ情報更新装置］
　本実施の形態に係るマップ情報更新方法の予測マップ情報算出方法を実現できるマップ情報更新装置の一例について、図８を用いて説明する。図８は、本実施の形態に係るマップ情報更新装置１０の機能構成を示すブロック図である。図８に示されるように、マップ情報更新装置１０は、位置情報、姿勢情報、及び投影関係を含む入力情報が入力されて、位置情報更新値及び姿勢情報更新値を含む出力情報を出力する装置である。

　図８に示されるように、マップ情報更新装置１０は、誤差推論エンジン２０と、第１の集約部２１と、第２の集約部２２と、位置推論エンジン２３と、姿勢推論エンジン２４とを備える。

　誤差推論エンジン２０は、マップ情報更新方法の再投影誤差情報取得ステップを実行する推論エンジンである。誤差推論エンジン２０は、１つ以上の投影関係の各々に対して、当該投影関係を構成する１つのランドマークに対応付けられた位置情報と、当該投影関係を構成する１つのキーフレームに対応付けられた姿勢情報と、当該投影関係を構成する投影座標情報と、に基づいて再投影誤差情報を取得し、再投影誤差情報を当該投影関係に関連付ける。

　本実施の形態では、再投影誤差情報は、１つ以上の投影関係の一つに対応する、１つの位置情報、１つの姿勢情報、及び、投影座標情報から再投影誤差を推論した結果を示す特徴量を含む。上述したとおり、再投影誤差は、当該位置情報、当該姿勢情報、及び、当該投影座標情報から空間幾何学的に算出される誤差である。

　第１の集約部２１は、マップ情報更新方法のランドマーク起点誤差集約ステップを実行する処理部である。第１の集約部２１は、１つ以上のランドマークの各々に対して、当該ランドマークに関連付けられたすべての再投影誤差情報が集約された第１の再投影誤差情報群を生成し、第１の再投影誤差情報群に含まれるすべての再投影誤差情報に基づく第１の合計値を求める。

　第２の集約部２２は、マップ情報更新方法のキーフレーム起点誤差集約ステップを実行するステップである。第２の集約部２２は、１つ以上のキーフレームの各々に対して、当該キーフレームに関連付けられたすべての再投影誤差情報が集約された第２の再投影誤差情報群を生成し、第２の再投影誤差情報群に含まれるすべての再投影誤差情報に基づく第２の合計値を求める。

　位置推論エンジン２３と、マップ情報更新方法の位置情報更新ステップを実行する推論エンジンである。１つ以上のランドマークの各々に対して、第１の合計値から当該ランドマークの位置情報の更新値である位置情報更新値を推論し、位置情報更新値を用いて当該ランドマークの位置情報を更新する。

　姿勢推論エンジン２４は、マップ情報更新方法の姿勢情報更新ステップを実行する推論エンジンである。姿勢推論エンジン２４は、１つ以上のキーフレームの各々に対して、第２の合計値から当該キーフレームの姿勢情報の更新値である姿勢情報更新値を推論し、姿勢情報更新値を用いて当該キーフレームの姿勢情報を更新する。

　以上のようなマップ情報更新装置１０により、上述したマップ情報更新方法の予測マップ情報算出方法を実現できる。

　［１－４．推論エンジン学習方法］
　上述した各推論エンジンの学習方法について図８を用いて説明する。上述したように、本実施の形態では、位置情報更新値は、位置推論エンジン２３によって推論され、姿勢情報更新値は、姿勢推論エンジン２４によって推論され、再投影誤差情報は、誤差推論エンジン２０によって推論される。

　位置推論エンジン２３、姿勢推論エンジン２４、及び、誤差推論エンジン２０は、マップ情報の更新値に基づいて空間幾何学的に求められた再投影誤差の和を損失関数として、学習したエンジンである。マップ情報の更新値は、マップ情報に基づいて誤差推論エンジン２０によって推論された再投影誤差情報に基づいて、位置推論エンジン２３及び姿勢推論エンジン２４が推論することで求められる。

　本実施の形態に係るマップ情報更新方法において用いる推論エンジンによれば、位置情報及び姿勢情報を、それぞれ別の推論エンジンで推論することで、マップ情報全体の更新値をまとめて推論する場合と比較して、大幅に推論の自由度を削減できる。つまり、マップ情報全体の更新値を演算するためのヘッセ行列全体で定まる規模と、ヘッセ行列のうち、位置情報に対応する部分行列の規模、及び、姿勢情報に対応する部分行列の規模との違いに相当する推論の自由度を削減できる。したがって、各推論エンジンの学習に要する工数を大幅に削減できる。また、推論の自由度を削減できることで、推論エンジンの学習の確実性を高めることができる。これにより、必要な推論精度を得るために必要なモデルの規模（言い換えると計算量）を削減できる。

　また、本実施の形態に係るマップ情報更新方法に関して、一般に任意の数値の組み合わせで構成されたヘッセ行列を用いた解法を推論で行う場合、単純なパーセプトロンや畳み込みニューラルネットワークのような構造では、それらの数値と解との組み合わせを獲得する際の自由度が非常に大きくなってしまい、結果、推論モデルの規模、及び計算量が大きくなる。これに伴い、その推論モデルの学習も同様に規模及び計算量が大きくなるため、学習の工数、困難度が増す。

　一方で本実施の形態に係るマップ情報更新方法によれば、推論モデルを、１つの投影関係において再投影誤差情報を推論する誤差推論エンジン２０と、誤差推論エンジン２０から出力される再投影誤差情報の和から位置情報及び姿勢情報の更新値をそれぞれ推論する位置推論エンジン２３、及び姿勢推論エンジン２４とに分割している。このように推論エンジンを分割することで、ヘッセ行列の大きさの変化を投影関係の個数（誤差推論エンジン２０の使用回数に関係）と、位置情報及び姿勢情報の個数（位置推論エンジン２３及び姿勢推論エンジン２４の使用回数に関係）との変化で吸収できる。つまり、ヘッセ行列の規模は、同じ推論エンジンの使用回数に帰着され、分割された各推論エンジンの規模は、一定で、かつ、小さくすることができる。したがって、分割された各推論エンジンの学習を容易化できる。

　［１－５．実験結果］
　本実施の形態に係るマップ情報更新方法を用いて実際にマップ情報を更新する実験を行った。本実験では、本実施の形態に係るマップ情報更新方法を用いてバンドル調整を行った結果と、従来のマップ情報更新方法を用いてバンドル調整を行った結果とを比較した。ここで、従来のマップ情報更新方法として、推論を用いずに空間幾何学的に更新値を算出する方法を用いる公開されたソフトウェアであるｇ２ｏを用いた。

　実験結果から、本実施の形態に係るマップ情報更新方法によれば、従来のマップ情報更新方法と同様に、入力情報における再投影誤差より、出力情報における再投影誤差を低減できた。また、本実施の形態に係るマップ情報更新方法によれば、演算量を削減できるため、バンドル調整に要する時間を１／１０以下に削減できた。また、本実施の形態に係るマップ情報更新方法によれば、従来のマップ情報更新方法より、再投影誤差の平均値を低減できた。

　したがって、本実施の形態に係るマップ情報更新方法によれば、従来のマップ情報更新方法と比較して、正確にかつ短時間でバンドル調整を行うことができる。

　（実施の形態２）
　実施の形態２に係るマップ情報更新方法について説明する。本実施の形態に係るマップ情報更新方法は、主に、再投影誤差情報取得ステップにおいて、実施の形態１に係るマップ情報更新方法と相違する。以下、本実施の形態に係るマップ情報更新方法について実施の形態１に係るマップ情報更新方法との相違点を中心に説明する。

　本実施の形態に係るマップ情報更新方法の再投影誤差情報取得ステップにおいて算出される再投影誤差情報は、１つ以上の投影関係の一つに対応する、１つの位置情報、１つの姿勢情報、及び、投影座標情報、から空間幾何学的に算出される再投影誤差である。つまり、本実施の形態では、実施の形態１に係るマップ情報更新方法のように、再投影誤差を推論するのでなく、再投影誤差を空間幾何学的に算出する。

　これにより、本実施の形態では、再投影誤差を正確に算出することができる。また、本実施の形態においても、位置情報更新値及び姿勢情報更新値は、推論によって算出されるため、この点については、実施の形態１に係るマップ情報更新方法と同様の効果が奏される。

　また、本実施の形態では、位置情報更新値は、位置推論エンジンによって推論され、姿勢情報更新値は、姿勢推論エンジンによって推論され、再投影誤差は、空間幾何学的に算出される。位置推論エンジン、及び、姿勢推論エンジンは、実施の形態１に係る各推論エンジンと同様に、マップ情報の更新値に基づいて空間幾何学的に求められた再投影誤差の和を損失関数として、学習したエンジンである。マップ情報の更新値は、マップ情報に基づいて空間幾何学的に求められた再投影誤差に基づいて、位置推論エンジン及び姿勢推論エンジンが推論することで求められる。

　本実施の形態に係る位置推論エンジン及び姿勢推論エンジンにおいても、実施の形態１に係る位置推論エンジン２３及び姿勢推論エンジン２４と同様の効果が奏される。

　（ハードウェア構成）
　上記各実施の形態に係る方法を実行するためのハードウェア構成について、図９を用いて説明する。図９は、上記各実施の形態に係る方法をソフトウェアにより実行するためのコンピュータ１０００のハードウェア構成の一例を示す図である。つまり、コンピュータ１０００により、実施の形態１及び実施の形態２に係る各マップ情報更新方法を実行するマップ情報更新装置を実現できる。

　コンピュータ１０００は、図９に示されるように、入力装置１００１、出力装置１００２、ＣＰＵ１００３、内蔵ストレージ１００４、ＲＡＭ１００５、読取装置１００７、送受信装置１００８及びバス１００９を備える。入力装置１００１、出力装置１００２、ＣＰＵ１００３、内蔵ストレージ１００４、ＲＡＭ１００５、読取装置１００７及び送受信装置１００８は、バス１００９により接続される。

　入力装置１００１はキーボード、マウス、入力ボタン、タッチパッド、タッチパネルディスプレイなどといったユーザインタフェースとなる装置であり、ユーザの操作を受け付ける。なお、入力装置１００１は、ユーザの接触操作を受け付ける他、音声での操作、リモコン等での遠隔操作を受け付ける構成であってもよい。

　出力装置１００２は、コンピュータ１０００からの信号を出力する装置であり、信号出力端子の他、ディスプレイ、スピーカなどのユーザインタフェースとなる装置であってもよい。

　内蔵ストレージ１００４は、フラッシュメモリなどである。また、内蔵ストレージ１００４には、実施の形態１及び２に係る各方法のステップを実行するためのプログラムなどが、予め記憶されていてもよい。

　ＲＡＭ１００５は、ランダムアクセスメモリ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）であり、プログラム又はアプリケーションの実行に際して算出されたデータ等の記憶に利用される。

　読取装置１００７は、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）メモリなどの記録媒体から情報を読み取る。読取装置１００７は、上記のようなプログラムやアプリケーションが記録された記録媒体からそのプログラムやアプリケーションを読み取り、内蔵ストレージ１００４に記憶させる。

　送受信装置１００８は、無線又は有線で通信を行うための通信回路である。送受信装置１００８は、例えばネットワークに接続されたサーバ装置と通信を行い、サーバ装置から上記のようなプログラムやアプリケーションをダウンロードして内蔵ストレージ１００４に記憶させる。

　ＣＰＵ１００３は、中央演算処理装置（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）であり、内蔵ストレージ１００４に記憶されたプログラム、アプリケーションなどをＲＡＭ１００５にコピーし、コピーしたプログラム、アプリケーションなどに含まれる命令をＲＡＭ１００５から順次読み出して実行する。

　（変形例など）
　以上、本開示に係る各方法について、各実施の形態に基づいて説明したが、本開示は、これらの実施の形態に限定されるものではない。本開示の主旨を逸脱しない限り、当業者が思いつく各種変形を各実施の形態に施したものや、各実施の形態における一部の構成要素を組み合わせて構築される別の形態も、本開示の範囲内に含まれる。

　また、以下に示す形態も、本開示の一つ又は複数の態様の範囲内に含まれてもよい。

　本開示に係る各方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、当該コンピュータプログラムからなるデジタル信号であるとしてもよい。さらに、本開示は、そのコンピュータプログラムを記録したＣＤ－ＲＯＭ等である非一時的なコンピュータ読み取り可能な記録媒体として実現してもよい。

　また、本開示は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、当該メモリは、上記コンピュータプログラムを記憶しており、上記マイクロプロセッサは、上記コンピュータプログラムにしたがって動作するとしてもよい。

　また、上記プログラム又は上記デジタル信号を上記記録媒体に記録して移送することにより、又は上記プログラム又は上記デジタル信号を、ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。

　上記実施の形態をそれぞれ組み合わせるとしてもよい。

　本開示は、例えば、ＶＳＬＡＭ技術などにおいて利用できる。

　１０　マップ情報更新装置
　２０　誤差推論エンジン
　２１　第１の集約部
　２２　第２の集約部
　２３　位置推論エンジン
　２４　姿勢推論エンジン
　１０００　コンピュータ
　１００１　入力装置
　１００２　出力装置
　１００３　ＣＰＵ
　１００４　内蔵ストレージ
　１００５　ＲＡＭ
　１００７　読取装置
　１００８　送受信装置
　１００９　バス
　Ｃ１１、Ｃ１２、Ｃ２１、Ｃ２２　投影座標情報
　ＫＦ１、ＫＦ２、ＫＦ３　キーフレーム
　ＬＭ１、ＬＭ２、ＬＭ３　ランドマーク

Claims

　１つ以上のランドマークにそれぞれ対応付けられた１つ以上の位置情報と、１つ以上のキーフレームにそれぞれ対応付けられた１つ以上の姿勢情報と、を含むマップ情報を更新するマップ情報更新方法であって、
　前記１つ以上のキーフレームの各々は、前記１つ以上のランドマークの少なくとも１つを含むように撮影された撮影画像であり、
　前記１つ以上の姿勢情報の各々は、位置、及び向きの情報を含み、
　１つ以上の投影関係を取得する投影関係取得ステップであって、前記１つ以上の投影関係の各々は、前記１つ以上のランドマークの各々と、前記１つ以上のキーフレームの各々と、前記１つ以上のキーフレームの各々に前記１つ以上のランドマークの各々を投影したときの投影点の当該キーフレーム上の座標に対応する投影座標情報と、の関係である、投影関係取得ステップと、
　前記１つ以上の投影関係の各々に対して、前記１つ以上の位置情報のうち、当該投影関係を構成する前記１つ以上のランドマークの１つに対応付けられた位置情報と、前記１つ以上の姿勢情報のうち、当該投影関係を構成する前記１つ以上のキーフレームの１つに対応付けられた姿勢情報と、当該投影関係を構成する前記投影座標情報と、に基づいて再投影誤差情報を取得し、前記再投影誤差情報を当該投影関係に関連付ける再投影誤差情報取得ステップと、
　前記１つ以上のランドマークの各々に対して、当該ランドマークに関連付けられたすべての前記再投影誤差情報が集約された第１の再投影誤差情報群を生成し、前記第１の再投影誤差情報群に含まれるすべての前記再投影誤差情報に基づく第１の合計値を求めるランドマーク起点誤差集約ステップと、
　前記１つ以上のキーフレームの各々に対して、当該キーフレームに関連付けられたすべての前記再投影誤差情報が集約された第２の再投影誤差情報群を生成し、前記第２の再投影誤差情報群に含まれるすべての前記再投影誤差情報に基づく第２の合計値を求めるキーフレーム起点誤差集約ステップと、
　前記１つ以上のランドマークの各々に対して、前記第１の合計値から前記１つ以上の位置情報のうち当該ランドマークの位置情報の更新値である位置情報更新値を推論し、前記位置情報更新値を用いて当該ランドマークの位置情報を更新する位置情報更新ステップと、
　前記１つ以上のキーフレームの各々に対して、前記第２の合計値から前記１つ以上の姿勢情報のうち当該キーフレームの姿勢情報の更新値である姿勢情報更新値を推論し、前記姿勢情報更新値を用いて当該キーフレームの姿勢情報を更新する姿勢情報更新ステップと、を含む
　マップ情報更新方法。
　前記再投影誤差情報は、前記１つ以上の投影関係の一つに対応する、前記１つ以上の位置情報のうちの一つ、前記１つ以上の姿勢情報のうちの一つ、及び、前記投影座標情報から再投影誤差を推論した結果を示す特徴量を含み、前記再投影誤差は、当該位置情報、当該姿勢情報、及び、前記投影座標情報から空間幾何学的に算出される
　請求項１に記載のマップ情報更新方法。
　前記再投影誤差情報は、前記１つ以上の投影関係の一つに対応する、前記１つ以上の位置情報のうちの一つ、前記１つ以上の姿勢情報のうちの一つ、及び、前記投影座標情報から空間幾何学的に算出される再投影誤差である
　請求項１に記載のマップ情報更新方法。
　前記位置情報更新値は、位置推論エンジンによって推論され、
　前記姿勢情報更新値は、姿勢推論エンジンによって推論され、
　前記再投影誤差情報は、誤差推論エンジンによって推論され、
　前記位置推論エンジン、前記姿勢推論エンジン、及び、前記誤差推論エンジンは、前記マップ情報の更新値に基づいて空間幾何学的に求められた再投影誤差の和を損失関数として、学習したエンジンであり、
　前記マップ情報の更新値は、前記マップ情報に基づいて前記誤差推論エンジンによって推論された前記再投影誤差情報に基づいて、前記位置推論エンジン及び前記姿勢推論エンジンが推論することで求められる
　請求項２に記載のマップ情報更新方法。
　前記位置情報更新値は、位置推論エンジンによって推論され、
　前記姿勢情報更新値は、姿勢推論エンジンによって推論され、
　前記再投影誤差は、空間幾何学的に算出され、
　前記位置推論エンジン、及び、前記姿勢推論エンジンは、前記マップ情報の更新値に基づいて空間幾何学的に求められた前記再投影誤差の和を損失関数として、学習したエンジンであり、
　前記マップ情報の更新値は、前記マップ情報に基づいて空間幾何学的に求められた前記再投影誤差に基づいて、前記位置推論エンジン及び前記姿勢推論エンジンが推論することで求められる
　請求項３に記載のマップ情報更新方法。
　前記特徴量は、前記マップ情報の更新値を算出するために用いられるヘッセ行列の対角要素を含むブロックに共通して含まれる項を含む
　請求項２に記載のマップ情報更新方法。