WO2011145239A1

WO2011145239A1 - 位置推定装置、位置推定方法及びプログラム

Info

Publication number: WO2011145239A1
Application number: PCT/JP2011/000749
Authority: WO
Inventors: ノッパリットトンプラシット; アラムカウィーウォン; 長谷川　修
Original assignee: 国立大学法人東京工業大学
Priority date: 2010-05-19
Filing date: 2011-02-10
Publication date: 2011-11-24
Also published as: US20130108172A1; US9098744B2; JPWO2011145239A1

Abstract

　位置推定装置１０は、入力画像から不変特徴量を抽出する特徴量抽出部１１と、各登録場所と不変特徴量が対応づけられて保存されている共通辞書１２を参照し、入力画像と登録場所とのマッチングを求めるマッチング１３と、マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出部１４と、類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する位置認定部１５とを有する。特徴量抽出部は、連続して撮影された連続画像からなる入力画像それぞれから局所特徴量を抽出し、連続する画像間でマッチングが取れた特徴量を連続特徴量とし、この連続特徴量に基づき不変特徴量を求める。ここで、マッチングが取れた特徴量の数に応じて、前記連続する画像の枚数を可変とする。

Description

位置推定装置、位置推定方法及びプログラム

　本発明は、ロボット装置などに好適に使用され得る位置推定装置、位置推定方法及びプログラムに関し、特に局所特徴量を使用して位置推定する位置推定装置、位置推定方法及びプログラム関する。

　自己位置の推定・特定は、人間や機械にとっては必須の能力である。現在、自分はどこにいるかということを知ることは、ロボットやコンピュータビジョンにとっては、常に重要である。特に、可動式のロボットのナビゲーションシステムにおいては、現在、自分がどこにいるかを把握することは基本的な要求となっている。

　従来、特許文献１に記載の位置検出装置がある。この位置検出装置では、移動体の前方視野の輝度画像を取得する輝度画像取得手段と、輝度画像取得手段と同一の視野を有し、輝度画像取得手段が輝度画像を取得するのと同時に距離画像を取得する距離画像取得手段と、少なくとも連続する２フレームの輝度画像からそれぞれ特徴点を抽出する特徴点抽出手段と、特徴点抽出手段によって抽出された特徴点の２フレーム間の位置の変位量を距離画像に基づいて算出し、当該変位量から自己位置を算出するための基準特徴点を選択する基準特徴点選択手段とを備えている。

特開２００２－０４８５１３号公報

　ところで、現在画像を撮影した場所が、ロボットが以前も訪れた場所であるか、又は全く知らない場所であるかを識別することは大変難しい。特徴量の抽出の仕方によっては、全く知らない場所をある場所に関連づけてしまうことがある。位置推定においては、現在の位置がデータベースに登録済みの場所であるか、新しい場所であるかを切り分ける能力は大変重要である。また、当該撮影した場所が新しい場所であることが認識できれば、ＤＢを拡大していく、すなわち、地図を学習していくことが可能になる。このような、移動体、特にロボット装置に好適に搭載される位置推定装置の開発が望まれている。一方で、学習によりメモリ容量が増大するが、ロボットには、限られたメモリリソースしかないため、メモリ容量の増大を抑制する必要もある。また、リアルタイムで位置認識するためには、演算速度を向上する必要もある。

（発明の目的）
　本発明は、このような問題点を解決するためになされたものであり、現在の位置が既に登録済みの場所であるか、未登録の場所であるかを認識することができる位置推定装置、位置推定方法及びプログラムを提供することを目的とする。

　本発明に係る位置推定装置は、入力画像から不変特徴量を抽出する特徴量抽出手段と、各登録場所と不変特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング手段と、マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出手段と、前記類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する位置認定手段とを有する。そして、特徴量抽出手段は、連続して撮影された連続画像からなる入力画像それぞれから、局所特徴量を抽出する局所特徴量抽出手段と、前記局所特徴量抽出手段により抽出された局所特徴量について、連続する入力画像間でマッチングをとる特徴量マッチング手段と、前記特徴量マッチング手段により連続する画像間でマッチングが取れた特徴量を連続特徴量として選択する連続特徴量選択手段と、前記連続特徴量に基づき不変特徴量を求める不変特徴量算出手段とを有し、前記連続特徴量選択手段は、前記マッチングが取れた特徴量の数に応じて、前記連続する画像の枚数を可変とするものである。

　本発明においては、連続して撮影された連続画像からなる入力画像から不変特徴量を抽出し、これを使用してマッチングを行うことで現在位置を同定する。ここで、不変特徴量を抽出する際に、マッチングが取れた特徴量の数に応じて連続する画像の枚数を可変とすることで、不変特徴量の数を任意に変更することができ、目的や用途、計算速度等を考慮して適切な数の不変特徴量とすることができる。

　また、前記マッチング手段は、各特徴量をインデックスに対応づけて記録した共通辞書を有し、前記共通辞書を参照して各入力画像の局所特徴量をインデックスに変換し、マッチングを行うことができ、特徴量をインデックスに対応付けて１つの共通辞書により管理するため、メモリ容量を大幅に削減することができる。

　さらに、前記マッチング手段は、前記共通辞書に登録された特徴量とマッチングした数と、マッチング対象画像に含まれる特徴量とマッチングした数との積により、マッチングスコアを算出することができ、シンプルな演算でマッチングスコアを求めることができるので、演算速度を向上させることができる。

　さらにまた、前記類似度算出手段は、前記選ばれた登録場所及び近傍の登録場所のマッチングスコアに重みをかけて第１の推定値を算出し、前記認定手段は、前記第１の推定値を前記類似度として登録場所の認定を行うことができ、単にマッチングするのみならず、近傍の登録場所を考慮して位置推定することで、推定率を向上することができる。

　また、前記類似度算出手段は、第１の推定値を正規化した第２の推定値を算出し、前記認定手段は、前記第２の推定値を前記類似度として登録場所の認定を行うことができ、正規化することで、更に誤認定をなくし、認定率を向上することができる。

　さらに、前記局所特徴量は、ＳＩＦＴ（Scale Invariant Feature Transformation）及び／又はＳＵＲＦ（Speed Up Robustness Features）の特徴量を使用することができる。また、これらＳＩＦＴやＳＵＲＦに限らず、スケール、回転の変動、又はノイズ等に対してロバストな他の局所特徴量を用いることも可能である。これにより、これら既存の局所特徴量を用いることで、これらの特徴量が有する性能もそのまま引き継がれ、照明変化等にも頑健な特徴として抽出・記述することが可能となる。

　本発明に係る位置推定方法は、入力画像から不変特徴量を抽出する特徴量抽出工程と、各登録場所と不変特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング工程と、マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出工程と、前記類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する位置認定工程とを有する。そして、前記特徴量抽出工程は、連続して撮影された連続画像からなる入力画像それぞれから、局所特徴量を抽出する局所特徴量抽出工程と、前記局所特徴量抽出工程にて抽出された局所特徴量について、連続する入力画像間でマッチングをとる特徴量マッチング工程と、前記特徴量マッチング工程にて連続する画像間でマッチングが取れた特徴量を連続特徴量として選択する連続特徴量選択工程と、前記連続特徴量に基づき不変特徴量を求める不変特徴量算出工程とを有し、前記連続特徴量選択工程では、前記マッチングが取れた特徴量の数に応じて、前記連続する画像の枚数を可変とするものである。

　また、本発明に係るプログラムは、上述した位置推定処理をコンピュータに実行させるものである。

　本発明によれば、現在の位置が既に登録済みの場所であるか、未登録の場所であるかを認識することができる位置推定装置、位置推定方法及びプログラムを提供することができる。

本発明の実施の形態にかかる位置推定装置を示すブロック図である。ウィンドウサイズと特徴量ＰＩＲＦの関係を説明する図である。本発明の実施の形態にかかる位置推定方法を示すフローチャートである。共通辞書１２とマッチングを取る方法を説明する図である。シティセンタデータセットを使用した場合の認識結果を示すグラフ図である。 Crowded University canteen dataを使用した場合の認識結果を示すグラフ図である。

　以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、移動型のロボット装置などに搭載される、位置を推定する位置推定装置に適用したものである。

本発明の実施の形態１.
　図１は、本発明の実施の形態にかかる位置推定装置を示すブロック図である。位置推定装置１０は、連続して撮影された連続画像からなる入力画像から不変特徴量を抽出する特徴量抽出部１１、共通辞書１２、マッチング部１３、類似度算出部１４及び位置認定部１５を有する。また、特徴量抽出部１１は、局所特徴量抽出部２１、特徴量マッチング部２２、連続特徴量選択部２３、及び不変特徴量抽出部２４を有する。

　局所特徴量抽出部２１は、入力画像それぞれから、局所特徴量を抽出する。特徴量マッチング部２２は、局所特徴量抽出部２１により抽出された局所特徴量について、連続する入力画像間でマッチングをとる。連続特徴量選択部２３は、特徴量マッチング部により連続する画像間でマッチングが取れた特徴量を連続特徴量として選択する。不変特徴量抽出部２４は、連続特徴量に基づき不変特徴量を求める。ここで、本実施の形態においては、連続特徴量選択部２３は、マッチングが取れた特徴量の数に応じて、連続する画像の枚数を可変とする。

　マッチング部１３は、各登録場所と不変特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求める。類似度算出部１４は、マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する。位置認定部１５は、類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する。

　以下の説明においては、不変特徴量抽出部２４が抽出する不変特徴量のことを、特徴量ＰＩＲＦ（Position-Invariant Robust Features）ということとする。特徴量抽出部２０は、撮影位置の変化に影響を受けにくい（局所）特徴量として特徴量ＰＩＲＦを抽出する。

　本願発明者が実環境における移動ロボットの自己位置推定問題を解決すべく鋭意実験研究した結果、近くの対象については撮影位置や撮影時間帯の変化による見え方の差（特徴量変化）が大きいが、遠くの対象については変化が小さい（ランドマークの特徴量はあまり変化しない）ことから、本特徴量ＰＩＲＦを抽出する方法を見出した。

　本実施の形態にかかる特徴量抽出部２０は、簡単には、連続画像間で局所特徴のマッチングを行い、連続してマッチングのとれている特徴を選択し、選択された特徴において、それとマッチングのとれている局所特徴量のうち、現在の画像の局所特徴量を、特徴量ＰＩＲＦとして抽出・記述するものである。この時の連続する画像の数をウィンドウサイズという。ウィンドウサイズを大きくすれば、マッチングの取れる局所特徴量は減少し、ウィンドウサイズを小さくすれば、マッチングの取れる局所特徴量は増加する。本実施の形態においては、このウィンドウサイズを可変とすることで、所望の数の特徴量ＰＩＲＦを得る。

　図２は、ウィンドウサイズと特徴量ＰＩＲＦの関係を説明する図である。図２に示すように、現在の画像Ｌ_ｔにおいて、Ｋ、Ｂ、Ｃ、Ｊ、・・・の局所特徴量を有するものとする。この現在の画像Ｌ_ｔの１つ前の画像Ｌ_ｔ－１の局所特徴量がＢ、Ｋ、Ｃ、Ｉ・・・であれば、両者は、局所特徴量Ｂ、Ｋ、Ｃでマッチングが取れている。更に、１つ前の画像であるＬ_ｔ－２の局所特徴量がＡ、Ｂ、Ｄ、Ｃ、・・・である場合、同様に、Ｌ_ｔ～Ｌ_ｔ－２の間でマッチングが取れている局所特徴量は、Ｂ、Ｃとなる。ここで、ウィンドウサイズを、Ｌ_ｔ－１、Ｌ_ｔ－２、Ｌ_ｔ－３まで広げると、マッチングが取れる局所特徴量がＢのみとなる。このように、ウィンドウサイズが３の場合、特徴量ＰＩＲＦは、Ｂのみとなる。ウィンドウサイズを広げれば、全画像間でマッチングが取れている特徴量ＰＩＲＦの数は少なくなり、ウィンドウサイズを小さくすれば、特徴量ＰＩＲＦの数は、増加する。ここで、特徴量ＰＩＲＦの数が０になれば、ウィンドウサイズを小さくする。一方、特徴量ＰＩＲＦが決められた最大特徴量数より大きければ、ウィンドウサイズを大きくして特徴量ＰＩＲＦの数を減らせばよい。各画像間でマッチングが取れた局所特徴量は、コネクションリストに追加される。これにより、次の画像の処理をする際に、再度マッチングを取る手間が省ける。

　ここで、特徴量ＰＩＲＦは、各画像の局所特徴量の平均とすることも可能であるが、本実施の形態においては、現在の画像の局所特徴量を特徴量ＰＩＲＦとして採用する。このことにより、より現在の画像にマッチした局所特徴量を特徴量ＰＩＲＦとすることができる。なお、用途に応じて、全局所特徴量の平均を特徴量ＰＩＲＦとしてもよい。

　次に、本実施の形態にかかる位置推定方法について説明する。図３は、本実施の形態にかかる位置推定方法を示すフローチャートである。図３に示すように、先ず、特徴量抽出部１１が、現在位置Ｌ_ｔの不変特徴量ＰＩＲＦを抽出する(ステップＳ１)。

　局所特徴量抽出部２１には、連続して撮影された連続画像が入力画像として入力される。ここで、ＰＩＲＦで要求される連続画像とは、ある画像セットであって、一定のフレームで、例えば１秒毎に２フレームなど、毎秒毎に連続的に撮影されたビデオ画像をいう。すなわち、ビデオからキャプチャされた画像は一般的に連続的であり、ＰＩＲＦにおける連続画像は、ビデオ画像を使用したものでなければならない。画像の取得率は、カメラの速度に応じて設定される。たとえば、カメラが車に搭載されていた場合、カメラの速度は１分間に約１０００ｍ／分であり、ビデオからキャプチャされる連続画像はおよそ５０乃至１００フレーム／秒となる。

　先ず、局所特徴量抽出部２１は、既存の局所特徴量抽出方法を使用して局所特徴量を抽出する。局所特徴量抽出部２１は、例えば、ＳＩＦＴ（Scale Invariant Feature Transformation）、又はＳＵＲＦ（Speed Up Robustness Features）の特徴量を使用することができる。または、これらＳＩＦＴやＳＵＲＦに限らず、他の局所特徴量を使用することができることは勿論である。特に、スケール、回転の変動、又はノイズ等に対してロバストな他の局所特徴量を用いることが好ましい。これらの局所特徴量を用いることで、既存の特徴量が有する性能もそのまま引き継がれ、照明変化等にも頑健な特徴として抽出・記述することが可能となる。

　本実施の形態においては、ＳＵＲＦを使用するものとする。ＳＩＦＴは、局所特徴量として２０００乃至３０００以上の特徴量を抽出する。これに対し、ＳＵＲＦは、２００乃至３００の局所特徴量を抽出するため、演算量が少なくてすむ。本実施の形態においては、このＳＵＲＦを利用し、１プレイスに１００程度のＰＩＲＦを抽出する。

　特徴量マッチング部２２は、現在位置で取得した画像と、その直前に取得した画像とで、連続する画像間の局所特徴量のマッチングを求める。例えばマッチングスコアが所定の閾値以上であれば、両局所特徴量は、マッチングしたものとみなす。

　連続特徴量選択部２３は、ウィンドウサイズを決定する。本実施の形態においては、例えば、不変特徴量ＰＩＲＦの数が１００程度になるようウィンドウサイズを決定する。そして、不変特徴量抽出部２４は、連続する画像間の局所特徴量の平均ではなく、現在位置の局所特徴量を、不変特徴量ＰＩＲＦとして抽出する。

　次に、現在位置Ｌ_ｔのＰＩＲＦと、共通辞書１２とのマッチングを取る(ステップＳ２)。図４は、共通辞書１２とマッチングを取る方法を説明する図である。ここで、図４に示すように、現在位置ＬｔのＰＩＲＦは、Ａ、Ｍ、Ｒ、Ｃ、Ｑであるとする。アルファベットは、ＰＩＲＦを示すものとする。共通辞書１２には、各ＰＩＲＦがインデックスと対応して格納されている。すなわち、インデックス１がＬで、インデックス２がＭ等として格納されている。マッチング部１３は、現在位置Ｌ_ｔにおけるＰＩＲＦと共通辞書１２のＰＩＲＦとの一致を検出し、一致した場合は、インデックスに置き換える。一致しない場合は、インデックスを例えば０とする。

　次に、マッチングスコアｓ_ｍを求める(ステップＳ３)。マッチングスコアｓ_ｍは、下記の式により求まる、
ｓ_ｍ＝ｎ_ｍ×ｎｕｍ＿ａｐｐｅａｒ・・・（１）
ここで、ｓ_ｍは、モデルｍと現在位置Ｌ_ｔとのマッチングスコアを示す。ｎｕｍ＿ａｐｐｅａｒは、共通辞書１２で一致したＰＩＲＦの数を示す。図４の例では、Ｍ、Ｒ、Ｑの３つのＰＩＲＦが一致しているので、ｎｕｍ＿ａｐｐｅａｒ＝３である。ｎ_ｍは、モデルｍとマッチングしたＰＩＲＦの数を示す。例えば、ｎ_ｍ＝２であれば、ｓ_ｍ＝２×３＝６となる。

　次に、類似度算出部１４は、隣接位置を考慮して、第２状態スコア（第１の推定値）ｂ_ｍを求める(ステップＳ４)。現在位置Ｌ_ｍで表れた特徴は、同様に隣接位置Ｌ_ｍ－２、Ｌ_ｍ－１、Ｌ_ｍ＋１、Ｌ_ｍ＋２で表れる可能性が高い。すなわち、これら隣接位置のマッチングスコアは、ｓ_ｍと略同じか若干低い程度と予測される。すなわち、例えばｓ_ｍが高いスコアであっても、ｓ_ｍ－１やｓ_ｍ＋１が０であるような場合は、マッチングスコアｓ_ｍの値がおかしい、すなわち、位置推定できていないことになる。ここで、本実施の形態においては、ガウシアン関数ｐ_ｔ（ｍ，ｉ）で重みづけをした第２状態スコアｂ_ｍを下記の式（２）により求める。

ここで、ｗは、考慮する隣接位置の個数を示す。例えば、フレームレートが一定である場合、スピードが早ければ、このｗの値を例えば１とし、スピードが遅ければｗの値を２とするなどすることができる。

　ここで、この第２状態スコアｂ_ｍに基づき、現在の位置がモデルｍと一致する、すなわち、既知の場所（known place）であると判定することも可能であるが、本実施の形態においては、この第２状態スコアｂ_ｍを正規化することで、認定率を更に向上させる。

　正規化スコア（第２推定値）b_norm_mは、下記式（３）より求めることができる(ステップＳ５)。

　ここで、ｎは位置推定装置の移動速度に応じた値であり、ＰＩＲＦの抽出で得られる最大抽出数とすることができる。類似度算出部１４は、この正規化スコアb_norm_mを求め、位置認定部１５は、この値が所定の閾値より大きければ、現在位置をモデルｍと一致する、すなわち、既知の場所として認定する(ステップＳ６、７)。例えば現在位置が、モデル（プレイス）ｍの一致した場合、オリジナルのプレイスｍに含まれていなかった特徴量ＰＩＲＦをプレイスｍに追加することで、プレイスｍの特徴量ＰＩＲＦをアップデートする。このとき、各プレイスの特徴量はインデックスで保存されているので、インデックスを増やすのみでよく、メモリ容量の増加を抑制することができる。また、プレイスｍの特徴量ＰＩＲＦは、例えばファーストインファーストアウト方式を取れば、メモリ容量を増加させることがない。

　一方、正規化スコアb_norm_mが所定の閾値に満たない場合、位置認定部１５は、現在位置を新しい場所として認定し(ステップＳ８)、現在位置おいて抽出されたＰＩＲＦを共通辞書１２に登録する。

　本実施の形態においては、共通辞書１２を用いている。すなわち、１つの場所毎に、辞書を持つことなく、全プレイスに共通の辞書を有することで、メモリ容量を大きく削減することができる。共通辞書１２においても、ＦＩＦＯとすることで、メモリ容量の増大を抑制することができる。

　次に、本実施の形態を実際に適用した実施例を参照して本発明の効果について説明する。
１．Ｃｉｔｙ　Ｃｅｎｔｕｒ　Ｄａｔａｓｅｔ

　シティセンタデータセットは、CumminsとNewmanによって集められたデータセットである（M.Cummins, and P. Newman, "Highly Scalable Appearance-Only SLAM-FAB-MAP 2.0", Proc. Robotics : Sciences and Systems (RSS), 2009）。ステレオカメラにより、１．５ｍおきに、１２３７ロケーション、２４７４枚（左右１枚ずつ）のデータからなる。下記表１はその認識率を示すもので、図５は、認識結果を示すグラフ図である。FAB-MAPに比べて本実施例の認識率が格段に高いことがわかる。表１において、Recallは、システムが、答えを出した割合（既知の場所であると認識した割合）であり、Precisionは、その正答率を示す。また、Total Timeは、認識に要した時間を示し、いずれの結果も、本実施例が驚異的な数値を示していることがわかる。

　なお、比較例１は、FAB-MAP（M.Cummins, and P. Newman, "Highly Scalable Appearance-Only SLAM-FAB-MAP 2.0", Proc. Robotics : Sciences and Systems (RSS), 2009）、比較例２は、Fast and incremental BOWs (A.Angeli, D.Filliat, S. Soncieux, and J. A. Mayer, "Fast Ubcrenabtak Nethid for Loop-Closure Detection Using Bags of Visual Wird,"IEEE Trans. Rovotics, 2008, 24(5),pp. 1027-1037)である。
２．Lip6Indoor dataset

　次の例は、インドアのデータセットを使用した例である。１秒毎に集められた３１８枚の画像からなる。表２は、その認識結果を示すものである。実施例は、１枚認識を誤っているものの、他に比べて優れた成績であることがわかる。

３．Crowded University canteen data

　次の例は、最も難しいとされる動きのある空間を撮影したデータを使用したものである。１秒間に２フレームの割合で２７０×４８０のサイズで６９２のロケーションで６９２枚の画像を全方位カメラで撮影したものである。表３は、その認識率を示すもので、図６は、その認識結果を示すグラフ図である。なお、比較例２は、発明者がデータセットをフランスに送り、比較例２の実験結果を送り返してもらったものである。

　このデータセットは、世界で初めて混雑する大学食堂環境下で撮影されたものであり、このような変動要因の多い（多くの人が動く）環境下でも、本実施例は、高い極めて高い認識率を示している。比較例１、２においては、このような変動要因の多い環境下での認識は、ほぼ不可能であるのに対し、本実施例は、約８７％の割合で位置を推定することができている。

本発明のその他の実施の形態
　上述したように、本発明においては、画像から自己位置同定ができ、辞書のオンライン更新が可能である。そこで、例えば、携帯の動画撮影機能と組み合わせると、以下のような応用が可能である。

　デパートやショッピングモールなどで迷子になった時、携帯で周りの景色をさっと一振り撮影し、サーバに送る。サーバはその画像を解析し、それがどこに位置するのか、また付加的に、周りにどのような施設やショップがあるか、などを返答することができる。

　屋内ではＧＰＳは使えない。これに対し、本実施の形態においては、ユーザから送られてくる検索動画が、同時に辞書や地図の更新のためのデータとしても使える。このため、常時、辞書と地図の更新ができる。なお、従来のカーナビ等では、基本的に地図データの更新ができないか、更新するにはかなりの手間と費用がかかる。

　携帯電話網にはサービス地域を分担して管理する基地局があるので、それぞれの基地局が、担当する範囲の地図を持ち、それを更新すればよい。つまり、巨大な辞書は不要で、メモリと演算速度が大幅に節約することができる。今後、眼鏡のようなウエアラブルビジョン（カメラ）が登場する可能性は高く、そうした眼鏡では常時自己位置を同定し、有用な情報を提示することもできる。

　なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。

　例えば、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、ＣＰＵ（Central Processing Unit）にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（random access memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　この出願は、２０１０年５月１９日に出願された日本出願特願２０１０－１１５３０７を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　本発明は、ロボット装置等で使用することができる位置推定装置、位置推定方法及びプログラムに好適に適用することができる。

　１０　位置推定装置
　１１　特徴量抽出部
　１２　共通辞書
　１３　マッチング部
　１４　類似度算出部
　１５　位置認定部
　２１　局所特徴量抽出部
　２２　特徴量マッチング部
　２３　連続特徴量選択部
　２４　不変特徴量抽出部

Claims

　入力画像から不変特徴量を抽出する特徴量抽出手段と、
　各登録場所と不変特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング手段と、
　マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出手段と、
　前記類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する位置認定手段とを有し、
　前記特徴量抽出手段は、
　連続して撮影された連続画像からなる入力画像それぞれから、局所特徴量を抽出する局所特徴量抽出手段と、
　前記局所特徴量抽出手段により抽出された局所特徴量について、連続する入力画像間でマッチングをとる特徴量マッチング手段と、
　前記特徴量マッチング手段により連続する画像間でマッチングが取れた特徴量を連続特徴量として選択する連続特徴量選択手段と、
　前記連続特徴量に基づき不変特徴量を求める不変特徴量算出手段とを有し、
　前記連続特徴量選択手段は、前記マッチングが取れた特徴量の数に応じて、前記連続する画像の枚数を可変とする、位置推定装置。
　前記マッチング手段は、各特徴量をインデックスに対応づけて記録した共通辞書を有し、前記共通辞書を参照して各入力画像の局所特徴量をインデックスに変換し、マッチングを行う、請求項１記載の位置推定装置。
　前記マッチング手段は、前記共通辞書に登録された特徴量とマッチングした数と、マッチング対象画像に含まれる特徴量とマッチングした数との積により、マッチングスコアを算出する、請求項２記載の位置推定装置。
　前記類似度算出手段は、前記選ばれた登録場所及び近傍の登録場所のマッチングスコアに重みをかけて第１の推定値を算出し、
　前記認定手段は、前記第１の推定値を前記類似度として登録場所の認定を行う、請求項１乃至３のいずれか１項記載の位置推定装置。
　前記類似度算出手段は、第１の推定値を正規化した第２の推定値を算出し、
　前記認定手段は、前記第２の推定値を前記類似度として登録場所の認定を行う、請求項１乃至３のいずれか１項記載の位置推定装置。
　前記局所特徴量は、ＳＩＦＴ（Scale Invariant Feature Transformation）及び／又はＳＵＲＦ（Speed Up Robustness Features）の特徴量である、請求項１乃至３のいずれか１項記載の位置推定装置。
　入力画像から不変特徴量を抽出する特徴量抽出工程と、
　各登録場所と不変特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング工程と、
　マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出工程と、
　前記類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する位置認定工程とを有し、
　前記特徴量抽出工程は、
　連続して撮影された連続画像からなる入力画像それぞれから、局所特徴量を抽出する局所特徴量抽出工程と、
　前記局所特徴量抽出工程にて抽出された局所特徴量について、連続する入力画像間でマッチングをとる特徴量マッチング工程と、
　前記特徴量マッチング工程にて連続する画像間でマッチングが取れた特徴量を連続特徴量として選択する連続特徴量選択工程と、
　前記連続特徴量に基づき不変特徴量を求める不変特徴量算出工程とを有し、
　前記連続特徴量選択工程では、前記マッチングが取れた特徴量の数に応じて、前記連続する画像の枚数を可変とする、位置推定方法。
　前記マッチング工程では、各特徴量をインデックスに対応づけて記録した共通辞書を有し、前記共通辞書を参照して各入力画像の局所特徴量をインデックスに変換し、マッチングを行う、請求項７記載の位置推定方法。
　前記マッチング工程では、前記共通辞書に登録された特徴量とマッチングした数と、マッチング対象画像に含まれる特徴量とマッチングした数との積により、マッチングスコアを算出する、請求項８記載の位置推定方法。
　前記類似度算出工程では、前記選ばれた登録場所及び近傍の登録場所のマッチングスコアに重みをかけて第１の推定値を算出し、
　前記認定工程では、前記第１の推定値を前記類似度として登録場所の認定を行う、請求項７乃至９のいずれか１項記載の位置推定方法。
　前記類似度算出工程では、第１の推定値を正規化した第２の推定値を算出し、
　前記認定工程では、前記第２の推定値を前記類似度として登録場所の認定を行う、請求項７乃至９のいずれか１項記載の位置推定方法。
　前記局所特徴量は、ＳＩＦＴ（Scale Invariant Feature Transformation）及び／又はＳＵＲＦ（Speed Up Robustness Features）の特徴量である、請求項７乃至９のいずれか１項記載の位置推定方法。
　所定の動作をコンピュータに実行させるためのプログラムであって、
　入力画像から不変特徴量を抽出する特徴量抽出工程と、
　各登録場所と不変特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング工程と、
　マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出工程と、
　前記類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する位置認定工程とを有し、
　前記特徴量抽出工程は、
　連続して撮影された連続画像からなる入力画像それぞれから、局所特徴量を抽出する局所特徴量抽出工程と、
　前記局所特徴量抽出工程にて抽出された局所特徴量について、連続する入力画像間でマッチングをとる特徴量マッチング工程と、
　前記特徴量マッチング工程にて連続する画像間でマッチングが取れた特徴量を連続特徴量として選択する連続特徴量選択工程と、
　前記連続特徴量に基づき不変特徴量を求める不変特徴量算出工程とを有し、
　前記連続特徴量選択工程では、前記マッチングが取れた特徴量の数に応じて、前記連続する画像の枚数を可変とするプログラム。