WO2014192061A1

WO2014192061A1 - 画像処理装置、画像処理方法及び画像処理プログラム

Info

Publication number: WO2014192061A1
Application number: PCT/JP2013/064637
Authority: WO
Inventors: 達也織茂; 宏美武居
Original assignee: パイオニア株式会社
Priority date: 2013-05-27
Filing date: 2013-05-27
Publication date: 2014-12-04

Abstract

　画像処理装置は、被撮影物を異なる位置から撮影した複数の画像を取得する取得手段と、複数の画像に基づき、被撮影物を撮影した位置と、被撮影物の位置と、を算出する第１位置算出手段と、第１位置算出手段による算出結果に基づいて、被撮影物を撮影した位置から被撮影物までの距離に応じた基線長の範囲を算出する基線長範囲算出手段と、基線長の範囲を満たし、撮影した複数の画像の中から、選択画像を選択する画像選択手段と、画像選択手段によって選択された選択画像に基づいて、被撮影物を撮影した位置及び被撮影物の位置の少なくとも一方を算出する第２位置算出手段と、を備える。

Description

画像処理装置、画像処理方法及び画像処理プログラム

　本発明は、カメラの撮影画像を処理する技術分野に関する。

　近年、ＳｆＭ（Structure from Motion）を利用して、カメラによって撮影された複数の撮影画像から、カメラの３次元位置・姿勢や、被写体（言い換えると非撮影物である。以下同様とする。）の３次元位置を求める技術が提案されている。なお、ＳｆＭは、未知環境下で移動ロボット等の自己位置推定やマッピングに使用される場合には、ＳＬＡＭ（Simultaneously Localization and Mapping）やＶｉｓｕａｌ　ＳＬＡＭと呼ばれることがある。

　この種の技術が、例えば特許文献１及び２に提案されている。特許文献１には、車両に取り付けられた２台以上のカメラにより得られた画像を用いて、車両周辺の３次元座標を取得する３次元座標取得装置において、カメラ間の相対的な位置関係を取得するキャリブレーション機能を有するものが記載されている。また、特許文献２には、オプティカルフローの出現点を含む第１の領域と当該第１の領域以外の第２の領域とにフレーム画像を分割し、第１の領域におけるオプティカルフローを生成するために用いる１組のフレーム画像の間隔と、第２の領域におけるオプティカルフローを生成するために用いる１組のフレーム画像の間隔とを個別に決定することが記載されている。

　その他にも、本発明に関連する技術が非特許文献１乃至４に記載されている。

特開２００７－２６３６６９号公報特開２０１０－２８６９８５号公報

S. Arya, D. Mount, R. Silverman and A. Y. Wu: "An optimal algorithm for approximate nearest neighbor searching", Journal of the ACM, 45, 6, pp. 891-923 (1998). ディジタル画像処理、CG-ARTS協会、ISBN4-906665-47-0, p266 Y.I. Abdel-Aziz and H. M. Karara. "Direct linear transformation from comparator coordinates into object space coordinates in close-range photogrammetry. In Proceedings of the Symposium on Close-Range Photogrammetry", pp. 1-18. American Society of Photogrammetry, Falls Church, 1971. R.Hartley, A.Zisserman, "Mutiview Geometry in computer vision", 2nd Edition, Cambridge University Press, 2004.

　特許文献１に記載の技術は、２眼ステレオ画像処理結果を利用し、３次元座標の推定精度を向上させることを目的としていた。そのため、単眼ステレオ処理における処理コストを低減することはできなかった。また、２眼ステレオ画像処理では、２枚の画像のみで仮の３次元位置を推定するため、ロバスト耐性が低く、オクルージョンや撮影範囲の相違等によりマッチングが取れない場合に、精度向上が期待できなかった。

　他方で、特許文献２に記載の技術は、前向きカメラのみを適用対象としており、消失点が写らない方向に向いたカメラには適用することができなかった。また、車速センサ等の別の手段から車の移動速度を取得する必要があった。更に、画像を２領域に分割して処理するため、１つの被写体が分割領域の両方に存在する場合には使用フレーム間隔が異なることから、１つの被写体で部分的に復元精度が異なることで違和感が発生する場合があった。

　本発明が解決しようとする課題は上記のようなものが例として挙げられる。本発明は、処理コストを適切に削減しつつ、撮影画像から被撮影物の３次元位置などを精度よく求めることが可能な画像処理装置、画像処理方法及び画像処理プログラムを提供することを課題とする。

　請求項に記載の発明では、画像処理装置は、被撮影物を異なる位置から撮影した複数の画像を取得する取得手段と、前記複数の画像に基づき、前記被撮影物を撮影した位置と、前記被撮影物の位置と、を算出する第１位置算出手段と、前記第１位置算出手段による算出結果に基づいて、前記被撮影物を撮影した位置から前記被撮影物までの距離に応じた基線長の範囲を算出する基線長範囲算出手段と、前記基線長の範囲を満たし、前記撮影した複数の画像の中から、選択画像を選択する画像選択手段と、前記画像選択手段によって選択された前記選択画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置の少なくとも一方を算出する第２位置算出手段と、を備えることを特徴とする。

　また、請求項に記載の発明では、画像処理装置によって実行される画像処理方法は、被撮影物を異なる位置から撮影した複数の画像を取得する取得工程と、前記複数の画像に基づき、前記被撮影物を撮影した位置と、前記被撮影物の位置と、を算出する第１位置算出工程と、前記第１位置算出工程による算出結果に基づいて、前記被撮影物を撮影した位置から前記被撮影物までの距離に応じた基線長の範囲を算出する基線長範囲算出工程と、前記基線長の範囲を満たし、前記撮影した複数の画像の中から、選択画像を選択する画像選択工程と、前記画像選択工程によって選択された前記選択画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置の少なくとも一方を算出する第２位置算出工程と、を備えることを特徴とする。

　また、請求項に記載の発明では、コンピュータを有する画像処理装置によって実行される画像処理プログラムは、前記コンピュータを、被撮影物を異なる位置から撮影した複数の画像を取得する取得手段、前記複数の画像に基づき、前記被撮影物を撮影した位置と、前記被撮影物の位置と、を算出する第１位置算出手段、前記第１位置算出手段による算出結果に基づいて、前記被撮影物を撮影した位置から前記被撮影物までの距離に応じた基線長の範囲を算出する基線長範囲算出手段、前記基線長の範囲を満たし、前記撮影した複数の画像の中から、選択画像を選択する画像選択手段、前記画像選択手段によって選択された前記選択画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置の少なくとも一方を算出する第２位置算出手段、として機能させることを特徴とする。

ＳｆＭを用いた技術の一例を説明するための図を示す。視差と距離との関係などを説明するための図を示す。第１実施例に係る画像処理装置が適用されたシステムの概略構成を示す。第１実施例の全体処理を示すフローチャートである。ステップＳ１０８及びＳ１０９の具体的な処理を示すフローチャートである。ベースラインの算出、及びカメラと特徴点との距離の算出を説明するための図を示す。第１実施例の変形例に係る画像処理装置の概略構成を示す。第２実施例の全体処理を示すフローチャートである。第２実施例の変形例に係る画像処理装置の概略構成を示す。第３実施例の全体処理を示すフローチャートである。第３実施例の変形例に係る画像処理装置の概略構成を示す。

　本発明の１つの観点では、画像処理装置は、被撮影物を異なる位置から撮影した複数の画像を取得する取得手段と、前記複数の画像に基づき、前記被撮影物を撮影した位置と、前記被撮影物の位置と、を算出する第１位置算出手段と、前記第１位置算出手段による算出結果に基づいて、前記被撮影物を撮影した位置から前記被撮影物までの距離に応じた基線長の範囲を算出する基線長範囲算出手段と、前記基線長の範囲を満たし、前記撮影した複数の画像の中から、選択画像を選択する画像選択手段と、前記画像選択手段によって選択された前記選択画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置の少なくとも一方を算出する第２位置算出手段と、を備える。

　上記の画像処理装置では、まず、第１位置算出手段が、被撮影物を異なる位置から撮影した複数の画像に基づいて、被撮影物を撮影した位置及び被撮影物の位置を算出する。次に、基線長範囲算出手段は、第１位置算出手段によって求められた位置に基づいて、被撮影物を撮影した位置から被撮影物までの距離に応じた、最適な基線長の範囲を算出し、画像選択手段は、複数の画像の中から、そのような基線長の範囲を満たす選択画像を選択する。なお、「基線長」は、撮影した位置の間隔（ベースライン）に相当する。次に、第２位置算出手段は、画像選択手段によって選択された選択画像に基づいて、被撮影物を撮影した位置及び被撮影物の位置の少なくとも一方を算出する。これにより、求められた基線長の範囲を満たす画像に適切に絞って、被撮影物を撮影した位置や被撮影物の位置を算出するための処理を行うことができる。したがって、３次元位置の算出精度を向上させることが可能となる。

　上記の画像処理装置の一態様では、前記第１位置算出手段は、前記第２位置算出手段よりも、前記位置を算出するための処理量が少ない。

　この態様では、位置を求めるために通常行う処理よりも処理量が少ない簡易的な処理によって、被撮影物を撮影した位置や被撮影物の位置を算出し、その位置に基づいて基線長の範囲を求める。そして、基線長の範囲を満たす画像に対して通常の処理を行うことで、被撮影物を撮影した位置や被撮影物の位置を算出する。これにより、基線長の範囲を満たす画像に適切に絞って通常の処理を行うことができる。言い換えると、基線長の範囲を満たさない画像を通常の処理の対象から適切に除外することができる。したがって、全体の処理コストを適切に削減しつつ、３次元位置の算出精度を向上させることが可能となる。

　上記の画像処理装置において好適には、前記第１位置算出手段は、前記複数の画像のデータ量を削減する処理を行い、当該処理後の画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置を算出する。好適な例では、前記第１位置算出手段は、前記複数の画像のサイズを縮小する処理を行う。

　また、上記の画像処理装置において好適には、前記第１位置算出手段は、前記複数の画像を間引く処理を行い、当該処理後の画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置を算出する。

　また、上記の画像処理装置において好適には、前記第１位置算出手段は、前記複数の画像から、特徴度合いが所定値以上である特徴点、又は前記特徴度合いが高い上位の所定数の特徴点を抽出し、抽出した前記特徴点に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置を算出する。

　好適な実施例では、前記第１及び第２位置情報算出は、ＳｆＭ（Structure from Motion）に基づいて位置情報を求める。

　また、好適には、上記の画像処理装置は、前記被撮影物を撮影する撮影手段を更に備え、前記取得手段は、前記撮影手段から、前記複数の画像を取得する。

　本発明の他の観点では、画像処理装置によって実行される画像処理方法は、被撮影物を異なる位置から撮影した複数の画像を取得する取得工程と、前記複数の画像に基づき、前記被撮影物を撮影した位置と、前記被撮影物の位置と、を算出する第１位置算出工程と、前記第１位置算出工程による算出結果に基づいて、前記被撮影物を撮影した位置から前記被撮影物までの距離に応じた基線長の範囲を算出する基線長範囲算出工程と、前記基線長の範囲を満たし、前記撮影した複数の画像の中から、選択画像を選択する画像選択工程と、前記画像選択工程によって選択された前記選択画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置の少なくとも一方を算出する第２位置算出工程と、を備える。

　本発明の更に他の観点では、コンピュータを有する画像処理装置によって実行される画像処理プログラムは、前記コンピュータを、被撮影物を異なる位置から撮影した複数の画像を取得する取得手段、前記複数の画像に基づき、前記被撮影物を撮影した位置と、前記被撮影物の位置と、を算出する第１位置算出手段、前記第１位置算出手段による算出結果に基づいて、前記被撮影物を撮影した位置から前記被撮影物までの距離に応じた基線長の範囲を算出する基線長範囲算出手段、前記基線長の範囲を満たし、前記撮影した複数の画像の中から、選択画像を選択する画像選択手段、前記画像選択手段によって選択された前記選択画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置の少なくとも一方を算出する第２位置算出手段、として機能させる。

　以下、図面を参照して本発明の好適な実施例について説明する。

　１．基本概念
　まず、本発明の実施例の内容を説明する前に、本発明の基本概念などについて説明する。

　図１に示すように、例えば、本発明は、車両に搭載されたカメラによって車両の移動中に撮影された複数の撮影画像から、ＳｆＭの技術に基づいて、カメラの３次元位置、姿勢や、被写体の３次元位置を求めるために利用される。つまり、車両の周囲環境の３次元復元や自車位置推定などを行うために利用される。１つの例では、カメラは、車両の測方（横方向）の風景を撮影する。

　一般的には、ＳｆＭでは以下のような処理が行われる（ここではＳｆＭの概要を述べるものとする）。まず、上記のように撮影された複数の画像から各画像の特徴点を検出して、２枚の画像ペアの各特徴点を比較することで、一致する特徴点を対応点とし検出する（このように特徴点についての対応点を検出するための処理を適宜「マッチング」と呼ぶ）。次に、検出された対応点から、２枚の画像ペアを撮影したカメラのカメラパラメータ（基礎行列や基本行列や内部パラメータや外部パラメータ）を求める。次に、求められたカメラパラメータに基づいて、カメラの位置及び姿勢を求めると共に、被写体の特徴点の３次元位置を求める。

　ここで、ＳｆＭでは、２つの画像ペアでの対応点数や、カメラ間の距離（言い換えると「基線長」であり、以下では適宜「ベースライン」と呼ぶ。）が、重要なファクターとなる。通常、車載のカメラによりＳｆＭを行う場合は、動画像（連続撮影画像）が使用されるが、車両の走行条件により、常にＳｆＭに最適な撮影画像が得られるとは限らない。それは、例えば、走行条件により車速が変化することで、それに伴ってベースラインも変化するからである。その場合、不適切なベースラインの撮影画像を用いると、ＳｆＭの精度が悪化してしまう。他方で、停止時には、変化のない画像が連続的に撮影される。そのような冗長な画像列に対してＳｆＭを行うと、無駄な処理コストが発生してしまう。

　上記した問題について、図２を参照して具体的に説明する。図２（ａ）は、Ｏ_１、Ｏ_２に位置するカメラ（２台のカメラであっても良いし、移動により異なる場所に位置する１台のカメラでも良い）で、異なる場所に位置する３つの被写体Ｐ_１、Ｐ_２、Ｐ_３を撮影した様子を示している。図２（ｂ）は、Ｏ_１、Ｏ_２に位置するカメラと被写体とによって規定される視差と、カメラから被写体までの距離との関係を示している。図２（ｂ）より、距離と視差とは反比例の関係にあり、距離が大きくなると視差が小さくなることがわかる（言い換えると、距離が小さくなると視差が大きくなることがわかる）。

　カメラから被写体までの距離を三角測量にて求める場合、視差が小さくなるにつれて、求められる距離に誤差が多く含まれるようになる。これを、図２（ｃ）を用いて具体的に説明する。Ｏ_１、Ｏ_２に位置するカメラで被写体Ｐ_１を撮影した場合の視差を「ΔＡ_１」とする。この視差ΔＡ_１を被写体Ｐ_２、Ｐ_３について得ようとすると、Ｏ_１に対してＯ_２よりも離れた位置から被写体Ｐ_２、Ｐ_３を撮影する必要がある、つまりベースラインを大きくする必要がある。具体的には、Ｏ_３に位置するカメラで被写体Ｐ_２を撮影する必要があると共に、Ｏ_４に位置するカメラで被写体Ｐ_３を撮影する必要がある。

　このように、カメラからの距離が異なる複数の被写体に対して同じ距離精度を求めようとすると、カメラから被写体までの距離に応じて、適用するベースラインを変えることが望ましい。つまり、カメラから被写体までの距離に応じた最適なベースラインが存在すると言える。

　以上のことを勘案して、本実施例では、まず、カメラから得られた複数の撮影画像に対して、通常のＳｆＭ（以下では適宜「通常ＳｆＭ」と呼ぶ。）よりも処理量が少ない簡易的なＳｆＭ（以下では適宜「簡易ＳｆＭ」と呼ぶ。）を行うことで、ＳｆＭについての所望の精度を満たす最適ベースラインを決定する。具体的には、簡易ＳｆＭを行うことでカメラ及び被写体の位置を求めて（この位置は暫定的な位置として扱われる）、求められた位置から、カメラと被写体との距離に応じた最適ベースラインを決定する。なお、最適ベースラインは、ある程度の範囲を有するものとする。そして、本実施例では、複数の撮影画像の中から、決定された最適ベースラインを満たす撮影画像を選択し、選択された撮影画像のみに対して通常ＳｆＭを行うことで、カメラ及び被写体の位置を求める。

　以下では、上記した実施例の具体例（第１乃至第３実施例）について説明する。

　２．第１実施例
　次に、本発明の第１実施例について説明する。

　２－１．装置構成
　図３は、第１実施例に係る画像処理装置１が適用されたシステムの概略構成を示すブロック図である。画像処理装置１は、主に、制御部１１と、記憶部１２と、インターフェース１３と、を有する。例えば、画像処理装置１は、パーソナルコンピュータである。

　制御部１１は、図示しないＣＰＵ（Central Processing Unit）などを備えて構成され、記憶部１２に記憶された所定のプログラムに応じて処理を行う。詳細は後述するが、制御部１１は、本発明における「第１位置算出手段」、「基線長範囲算出手段」、「画像選択手段」及び「第２位置算出手段」の一例に相当する。

　インターフェース１３は、カメラ２（撮影手段）による撮影によって得られた撮影画像が入力される。インターフェース１３は、本発明における「取得手段」の一例に相当する。なお、例えば、カメラ２は車両などに搭載され、車両の移動中に連続して撮影を行う。

　記憶部１２は、図示しないＲＯＭ（Read Only Memory）やＲＡＭ（Random Access Memory）やハードディスクなどの各種のメモリを備えて構成され、画像処理装置１を制御するための種々の制御プログラムなどが格納されると共に、制御部１１に対してワーキングエリアを提供する。また、記憶部１２には、インターフェース１３に入力された撮影画像のデータが記憶される。

　２－２．処理内容
　次に、図４及び図５を参照して、第１実施例において制御部１１が行う処理内容について説明する。まず、簡単に、第１実施例に係る処理内容について説明する。第１実施例では、制御部１１は、簡易ＳｆＭとして、カメラ２の撮影によって得られた撮影画像の画像サイズを縮小し（以下では縮小された撮影画像を適宜「縮小画像」と呼ぶ。）、縮小画像に対してＳｆＭを行う。具体的には、制御部１１は、縮小画像に対してＳｆＭを行うことでカメラ２及び被写体の位置を求め、その位置に基づいて最適ベースラインを決定し、最適ベースラインを満たす撮影画像（縮小していない元の画像）に対してＳｆＭを行うことで、カメラ２及び被写体の位置を求める。

　図４は、第１実施例の全体処理を示すフローチャートである。まず、ステップＳ１０１では、画像処理装置１内のインターフェース１３が、カメラ２から複数の撮影画像を取得する。こうして取得された撮影画像は、記憶部１２に記憶される。そして、処理はステップＳ１０２に進む。

　ステップＳ１０２では、画像処理装置１内の制御部１１が、ステップＳ１０１で取得された全ての撮影画像の画像サイズを縮小することで、縮小画像を生成する。つまり、制御部１１は、マッチングの全ての対象画像を縮小する処理を行う。そして、処理はステップＳ１０３に進む。ステップＳ１０３～Ｓ１０７では、縮小画像に対するＳｆＭが実行される、つまり簡易ＳｆＭが実行される。

　ステップＳ１０３では、制御部１１は、ステップＳ１０２で生成された複数の縮小画像の特徴点（以下では「暫定特徴点」と呼ぶ。）を検出する。例えば、制御部１１は、ＳＩＦＴ（Scale Invariant Feature Transform）や、Ｈａｒｒｉｓ　Ｃｏｒｎｅｒ　Ｄｅｔｅｃｔｉｏｎ等を用いて、暫定特徴点を検出する。１つの例では、暫定特徴点は被写体を構成するコーナーなどである。以上のステップＳ１０３の後、処理はステップＳ１０４に進む。

　ステップＳ１０４では、制御部１１は、複数の縮小画像における２枚の縮小画像のペアについて、ステップＳ１０３で検出された各特徴点を比較することで、一致する特徴点を対応点（以下では「暫定対応点」と呼ぶ。）として検出する。つまり、制御部１１は、マッチングを行うことで暫定対応点を検出する。例えば、制御部１１は、複数の縮小画像を組み合わせることで得られる全てのペアについて、特徴点を比較することで暫定対応点を検出する。また、制御部１１は、例えば非特許文献１に記載された近似最近傍探索などを用いて、暫定対応点を検出する。そして、処理はステップＳ１０５に進む。

　ステップＳ１０５では、制御部１１は、ステップＳ１０４で検出された暫定対応点に基づいて、縮小画像のペアを撮影したカメラ２に関する、基礎行列や基本行列や内部パラメータや外部パラメータを含むカメラパラメータ（以下では「暫定カメラパラメータ」と呼ぶ。）を求める。具体的には、制御部１１は、暫定対応点に基づいて、２次元位置（画像上での位置）と３次元位置との間の変換行列に相当する基礎行列（内部パラメータが加味された行列である）を求めると共に、その基礎行列に含まれる内部パラメータ（カメラ２のセンサ中心や焦点距離など）を求める。そして、制御部１１は、基礎行列から内部パラメータを除外することで基本行列を求めて、当該基本行列を回転行列と並進ベクトルとに分解する（なお、回転行列及び並進ベクトルは外部パラメータに相当する）。例えば、制御部１１は、非特許文献２に記載された８点アルゴリズムや、非特許文献３に記載されたＤＬＴ法などを用いて、このような暫定カメラパラメータを求める。また、制御部１１は、例えば非特許文献４に記載された特異値分解を用いて、基本行列を回転行列と並進ベクトルとに分解する。そして、処理はステップＳ１０６に進む。

　ステップＳ１０６では、制御部１１は、ステップＳ１０５で求められた回転行列及び並進ベクトルに基づいて、カメラ２の３次元位置及び姿勢（以下では「暫定カメラ位置・姿勢」と呼ぶ。なお、カメラ２の３次元位置のみを指す場合には単に「暫定カメラ位置」と呼ぶ。）を求める。そして、処理はステップＳ１０７に進む。

　ステップＳ１０７では、制御部１１は、ステップＳ１０５で求められた回転行列及び並進ベクトルを用いて、縮小画像の各特徴点を３次元空間に投影することにより、被写体の特徴点の３次元位置（以下では「暫定特徴点位置」と呼ぶ。）を求める。そして、処理はステップＳ１０８に進む。

　ステップＳ１０８では、制御部１１は、ステップＳ１０６で求められた暫定カメラ位置とステップＳ１０７で求められた暫定特徴点位置とに基づいて、カメラ２から被写体までの距離を求めて、その距離に応じた最適ベースラインを決定する。そして、処理はステップＳ１０９に進む。なお、ステップＳ１０８の処理の詳細は後述する。

　ステップＳ１０９では、制御部１１は、ステップＳ１０１で取得された撮影画像（画像サイズを縮小していない元の撮影画像）の中から、ステップＳ１０８で決定された最適ベースラインを満たす撮影画像を選択する。この場合、制御部１１は、最適ベースラインを満たす複数のカメラペアを決定し、決定された複数のカメラペアから得られた複数の撮影画像のペアを選択する（このような撮影画像のペアは、後の処理においてマッチングの対象画像とされる）。そして、処理はステップＳ１１０に進む。ステップＳ１１０～Ｓ１１４では、ステップＳ１０９で選択された、画像サイズを縮小していない元の撮影画像に対するＳｆＭが実行される、つまり通常ＳｆＭが実行される。

　なお、上記したステップＳ１０８及びＳ１０９の処理の詳細は後述する。

　ステップＳ１１０では、制御部１１は、ステップＳ１０９で選択された撮影画像の特徴点を検出する。この場合、制御部１１は、上記したステップＳ１０３と同様の手法により、特徴点を検出する。そして、処理はステップＳ１１１に進む。

　ステップＳ１１１では、制御部１１は、ステップＳ１０９で選択された撮影画像のペアについて、ステップＳ１１０で検出された各特徴点を比較することで、一致する特徴点を対応点として検出する。この場合、制御部１１は、上記したステップＳ１０４と同様の手法により、対応点を検出する。そして、処理はステップＳ１１２に進む。

　ステップＳ１１２では、制御部１１は、ステップＳ１１１で検出された対応点に基づいて、ステップＳ１０９で選択された撮影画像のペアを撮影したカメラ２に関する、基礎行列や基本行列や内部パラメータや外部パラメータを含むカメラパラメータを求める。この場合、制御部１１は、上記したステップＳ１０５と同様の手法により、カメラパラメータを求める。そして、処理はステップＳ１１３に進む。

　ステップＳ１１３では、制御部１１は、ステップＳ１１２で求められた回転行列及び並進ベクトルに基づいて、カメラ２の３次元位置及び姿勢を求める。そして、処理はステップＳ１１４に進む。なお、ステップＳ１１３において、カメラ２の３次元位置及び姿勢の両方を求めることに限定はされず、カメラ２の３次元位置及び姿勢の一方のみを求めても良い。

　ステップＳ１１４では、制御部１１は、ステップＳ１１２で求められた回転行列及び並進ベクトルで、ステップＳ１０９で選択された撮影画像の各特徴点を３次元空間に投影することにより、被写体の特徴点の３次元位置を求める。そして、処理は終了する。

　次に、図５を参照して、ステップＳ１０８及びＳ１０９の処理の詳細について説明する。図５は、ステップＳ１０８及びＳ１０９の具体的な処理を示すフローチャートである。なお、ステップＳ２０１～Ｓ２０７までの処理がステップＳ１０８の処理に相当し、ステップＳ２０８～Ｓ２１２までの処理がステップＳ１０９の処理に相当する。

　まず、ステップＳ２０１では、制御部１１は、任意のカメラペアを選択し、当該カメラペアのそれぞれのカメラ２について図４のステップＳ１０６で算出された暫定カメラ位置に基づいて、当該カメラペアのベースラインを算出する。そして、処理はステップＳ２０２に進む。

　なお、「カメラペア」とは、物理的に異なるカメラをペアにすることを意味するのではなく、異なる場所に位置する同一のカメラ２をペアにすることを意味するものとする（つまり、使用するカメラ２は１台である）。

　ステップＳ２０２では、制御部１１は、ステップＳ２０１で選択されたカメラペアのそれぞれについて図４のステップＳ１０６で算出された暫定カメラ位置と、カメラペアのそれぞれの撮影画像の両方に写っている特徴点について図４のステップＳ１０７で算出された暫定特徴点位置とに基づいて、各カメラ２と特徴点との距離を算出する。この場合、制御部１１は、カメラペアのそれぞれのカメラ２ごとに、両方のカメラ２に写っている特徴点の数だけ距離を算出する。そして、処理はステップＳ２０３に進む。

　ここで、図６を参照して、ステップＳ２０１でのカメラペアのベースラインの算出、及びステップＳ２０２でのカメラ２と特徴点との距離の算出について、具体的に説明する。ｉ番目のカメラ２の暫定カメラ位置（３次元位置）を「Ｏ_ｉ（Ｘ_ｉ，Ｙ_ｉ，Ｚ_ｉ）」と表し、ｊ番目の特徴点の暫定特徴点位置（３次元位置）を「Ｐ_ｊ（ｘ_ｊ，ｙ_ｊ，ｚ_ｊ）」と表すと、図６中の式（１）より、ｉ番目のカメラ２とｊ番目の特徴点との距離が算出される。また、ｋ番目のカメラ２の暫定カメラ位置（３次元位置）を「Ｏ_ｋ（Ｘ_ｋ，Ｙ_ｋ，Ｚ_ｋ）」と表すと、図６中の式（２）より、ｉ番目のカメラ２とｋ番目のカメラ２との距離（ベースライン）が算出される。制御部１１は、ステップＳ２０１では、式（２）を用いてカメラペアのベースラインの算出し、ステップＳ２０２では、式（１）を用いてカメラ２と特徴点との距離を算出する。

　図５に戻って、ステップＳ２０３以降の処理を説明する。ステップＳ２０３では、制御部１１は、ステップＳ２０２で算出されたカメラ２と特徴点との距離に基づいて、カメラペアの撮影画像の両方に含まれる特徴点ごとに、各カメラ２に対する平均的な距離を算出する。つまり、制御部１１は、両方のカメラ２に写っている特徴点に関して、一方のカメラ２と特徴点との距離と、他方のカメラ２と特徴点との距離との平均値（以下では「平均距離」と呼ぶ。）を算出する。この場合、制御部１１は、両方のカメラ２に写っている特徴点の数だけ平均距離を算出する。そして、処理はステップＳ２０４～Ｓ２０６に進む。

　ステップＳ２０４では、制御部１１は、ステップＳ２０３で特徴点の数だけ算出された平均距離の平均値を算出する。ステップＳ２０５では、制御部１１は、ステップＳ２０３で特徴点の数だけ算出された平均距離の中の最小値を特定する。ステップＳ２０６では、制御部１１は、ステップＳ２０３で特徴点の数だけ算出された平均距離の中の最大値を特定する。以上のステップＳ２０４～Ｓ２０６の後、処理はステップＳ２０７に進む。

　ステップＳ２０７では、制御部１１は、ステップＳ２０４～Ｓ２０６で得られた平均値、最小値及び最大値を総合的に判断して、カメラペアのベースラインとして許容できる範囲を最適ベースラインとして決定する。１つの例では、制御部１１は、平均値に基づいてベースラインの最適値を推定し、最小値及び最大値に基づいて許容範囲を設定することで、最適ベースラインを決定する。他の例では、制御部１１は、予め実験やシミュレーションなどにより、上記した平均値、最小値及び最大値に対して適用すべき最適ベースラインをテーブルなどに対応付けて設定しておき、そのようなテーブルを参照して、平均値、最小値及び最大値に応じた最適ベースラインを決定する。そして、処理はステップＳ２０８に進む。

　ステップＳ２０８では、制御部１１は、ステップＳ２０１で算出されたベースラインが、ステップＳ２０７で決定された最適ベースラインの範囲内か否かを判定する。ベースラインが最適ベースラインの範囲内である場合（ステップＳ２０８：Ｙｅｓ）、制御部１１は、そのベースラインに対応するカメラペア（ステップＳ２０１で選択されたカメラペア）を採用する（ステップＳ２０９）。これに対して、ベースラインが最適ベースラインの範囲内でない場合（ステップＳ２０８：Ｎｏ）、制御部１１は、そのベースラインに対応するカメラペアを不採用とする（ステップＳ２１０）。ステップＳ２０９、Ｓ２１０の後、処理はステップＳ２１１に進む。

　ステップＳ２１１では、制御部１１は、全カメラペアに対するチェックが完了したか否かを判定する。つまり、制御部１１は、想定される全てのカメラペアに対して、ステップＳ２０１～Ｓ２１０の処理を行ったか否かを判定する。全カメラペアに対するチェックが完了していない場合（ステップＳ２１１：Ｎｏ）、処理はステップＳ２０１に戻り、制御部１１は、他のカメラペアに対してステップＳ２０１以降の処理を再度行う。制御部１１は、全カメラペアに対するチェックが完了するまで、ステップＳ２０１～Ｓ２１０の処理を繰り返し行う。

　他方で、全カメラペアに対するチェックが完了した場合（ステップＳ２１１：Ｙｅｓ）、処理はステップＳ２１２に進む。ステップＳ２１２では、制御部１１は、ステップＳ２０９で採用した全てのカメラペアから得られた撮影画像を選択する。この場合、制御部１１は、採用したカメラペアから得られた撮影画像のペアを選択する。この後、制御部１１は、図４のステップＳ１１０以降の処理を行う。つまり、制御部１１は、ステップＳ２１２で選択された撮影画像に対してのみ通常ＳｆＭを行うことで、カメラ２の３次元位置及び姿勢と、被写体の特徴点の３次元位置とを求める。

　２－３．作用効果
　以上説明したように、第１実施例では、撮影画像を縮小した縮小画像を用いて簡易ＳｆＭを行うことで最適ベースラインを決定し、最適ベースラインを満たす撮影画像に対して通常ＳｆＭを行う。これにより、最適ベースラインを満たす撮影画像に適切に絞って通常ＳｆＭを行うことができる。言い換えると、最適ベースラインを満たさない撮影画像を通常ＳｆＭの対象から適切に除外することができる。例えば、連続画像に含まれる静止画像や静止画像に近い、十分なベースラインを有しない撮影画像や、ベースラインが長すぎてマッチングの取りにくい撮影画像等を、通常ＳｆＭの対象から適切に除外することができる。以上より、第１実施例によれば、全体の処理コストを適切に削減しつつ、３次元位置の算出精度を向上させることが可能となる。

　２－４．第１実施例の変形例
　上記では、第１実施例に係る構成を、制御部１１によるソフトウェア的な処理によって実現していたが、これに限定はされず、ハードウェアにより第１実施例に係る構成を実現しても良い。図７は、ハードウェアにより第１実施例に係る構成を実現する場合の、画像処理装置５０ａの概略構成を示すブロック図である。

　図７に示すように、画像処理装置５０ａは、撮影画像取得部５１と、画像メモリ５２と、画像サイズ縮小部５３と、特徴点検出部５４と、対応点マッチング部５５と、カメラパラメータ算出部５６と、カメラ位置・姿勢算出部５７と、特徴点位置算出部５８と、最適ベースライン決定部５９と、最適撮影画像選択部６０と、を備える。撮影画像取得部５１は、上記したインターフェース１３に相当し、画像メモリ５２は、上記した記憶部１２に相当し、撮影画像取得部５１が取得した撮影画像のデータを一時的に記憶する。

　具体的には、撮影画像取得部５１は、図４のステップＳ１０１の処理を行うように機能する。画像サイズ縮小部５３は、図４のステップＳ１０２の処理を行うように機能する。特徴点検出部５４は、図４のステップＳ１０３及びＳ１１０の処理を行うように機能する。対応点マッチング部５５は、図４のステップＳ１０４及びＳ１１１の処理を行うように機能する。カメラパラメータ算出部５６は、図４のステップＳ１０５及びＳ１１２の処理を行うように機能する。カメラ位置・姿勢算出部５７は、図４のステップＳ１０６及びＳ１１３の処理を行うように機能する。特徴点位置算出部５８は、図４のステップＳ１０７及びＳ１１４の処理を行うように機能する。最適ベースライン決定部５９は、図４のステップＳ１０８の処理（詳しくは図５のステップＳ２０１～Ｓ２０７の処理）を行うように機能する。最適撮影画像選択部６０は、図４のステップＳ１０９の処理（詳しくは図５のステップＳ２０８～Ｓ２１２の処理）を行うように機能する。

　このような画像処理装置５０ａによれば、同様の処理を行う部分を同一の構成部にて兼用しているため、ハードウェアコストを削減することができる。

　なお、上記では、簡易ＳｆＭとして、撮影画像の画像サイズを縮小することで得られた縮小画像に対してＳｆＭを行う例を示したが、これに限定はされない。要は、撮影画像のデータ量を削減した画像に対してＳｆＭを行えば良く、撮影画像のデータ量を削減する手法としては公知の種々の手法を適用することができる。

　３．第２実施例
　次に、本発明の第２実施例について説明する。なお、以下では、第１実施例と異なる構成について主に説明を行い、第１実施例と同様の構成については適宜説明を省略する。つまり、特に説明しない構成要素や動作や処理などについては、第１実施例と同様であるものとする。

　３－１．処理内容
　まず、簡単に、第２実施例に係る処理内容について説明する。第２実施例では、画像処理装置１内の制御部１１は、簡易ＳｆＭとして、縮小画像に対してＳｆＭを行う代わりに、カメラ２の撮影によって得られた時間的に連続する撮影画像を間引く処理を行い、間引いた後の撮影画像（以下では適宜「間引き画像」と呼ぶ。）に対してＳｆＭを行う点で、第１実施例と異なる。具体的には、制御部１１は、間引き画像に対してＳｆＭを行うことでカメラ２及び被写体の位置を求め、その位置に基づいて最適ベースラインを決定し、最適ベースラインを満たす撮影画像に対してＳｆＭを行うことで、カメラ２及び被写体の位置を求める。

　図８は、第２実施例の全体処理を示すフローチャートである。第２実施例に係るフローは、図４のステップＳ１０２の代わりにステップＳ１２２の処理が行われる点で、第１実施例に係るフローと異なる。その他のステップは、第１実施例と同様である。したがって、ここでは、ステップＳ１２２の処理のみを説明する。なお、図５に示したフローについては、第１実施例と第２実施例とで異なる点はない。したがって、その説明を省略する。

　ステップＳ１２２では、画像処理装置１内の制御部１１が、ステップＳ１０１で取得された時間的に連続する撮影画像を間引く処理を行うことで、間引き画像を生成する。つまり、制御部１１は、ステップＳ１０１で取得された撮影画像の枚数を削減する処理を行う。こうして枚数が削減された後の撮影画像（間引き画像）は、後の処理においてマッチングの対象画像とされる。例えば、制御部１１は、時間的に連続する撮影画像を１つ飛ばしにした画像や２つ飛ばしにした画像を、間引き画像として用いる。そして、処理はステップＳ１０３に進む。ステップＳ１０３～Ｓ１０７では、間引き画像に対するＳｆＭが実行される、つまり簡易ＳｆＭが実行される。

　以上説明した第２実施例によれば、撮影画像を間引いた間引き画像を用いて簡易ＳｆＭを行うことで最適ベースラインを決定し、最適ベースラインを満たす撮影画像に対して通常ＳｆＭを行う。このような第２実施例によっても、全体の処理コストを適切に削減しつつ、３次元位置の算出精度を向上させることが可能となる。この場合、第２実施例によれば、マッチングの対象画像を間引くことで、より直接的に処理コストを低減することができる。

　３－２．第２実施例の変形例
　上記では、第２実施例に係る構成を、制御部１１によるソフトウェア的な処理によって実現していたが、これに限定はされず、ハードウェアにより第２実施例に係る構成を実現しても良い。図９は、ハードウェアにより第２実施例に係る構成を実現する場合の、画像処理装置５０ｂの概略構成を示すブロック図である。図９に示すように、第２実施例に係る画像処理装置５０ｂは、画像サイズ縮小部５３の代わりに画像間引き部７３を有する点で、第１実施例に係る画像処理装置５０ａ（図７参照）と異なる。画像間引き部７３は、図８のステップＳ１２２の処理を行うように機能する。このような画像処理装置５０ｂによっても、同様の処理を行う部分を同一の構成部にて兼用しているため、ハードウェアコストを削減することができる。

　４．第３実施例
　次に、本発明の第３実施例について説明する。なお、以下では、第１実施例と異なる構成について主に説明を行い、第１実施例と同様の構成については適宜説明を省略する。つまり、特に説明しない構成要素や動作や処理などについては、第１実施例と同様であるものとする。

　４－１．処理内容
　まず、簡単に、第３実施例に係る処理内容について説明する。第３実施例では、画像処理装置１内の制御部１１は、簡易ＳｆＭとして、縮小画像や間引き画像に対してＳｆＭを行う代わりに、カメラ２の撮影画像から、特徴点についての特徴の強度を示す指標である特徴度合いが上位の特徴点（以下では「上位特徴点」と呼ぶ。）を抽出し、上位特徴点を用いてＳｆＭを行う点で、第１及び第２実施例と異なる。具体的には、制御部１１は、上位特徴点についての対応点のみを検出し、つまり上位特徴点のみを用いてマッチングを行い、そのマッチングの結果に基づいてカメラ２及び被写体の位置を求める。そして、制御部１１は、求められた位置に基づいて最適ベースラインを決定し、最適ベースラインを満たす撮影画像に対してＳｆＭを行うことで、カメラ２及び被写体の位置を求める。

　図１０は、第３実施例の全体処理を示すフローチャートである。第３実施例に係るフローは、図４のステップＳ１０２、Ｓ１０３の代わりにステップＳ１３２、Ｓ１３３の処理が行われる点で、第１実施例に係るフローと異なる。その他のステップは、第１実施例と同様である。したがって、ここでは、ステップＳ１３２及びＳ１３３の処理のみを説明する。なお、図５に示したフローについては、第１実施例と第３実施例とで異なる点はない。したがって、その説明を省略する。

　ステップＳ１３２では、画像処理装置１内の制御部１１が、ステップＳ１０１で取得された全ての撮影画像（縮小処理や間引き処理などが行われていない元の画像）の特徴点を検出する。この場合、制御部１１は、図４のステップＳ１０３と同様の手法により、特徴点を検出する。そして、処理はステップＳ１３３に進む。

　ステップＳ１３３では、制御部１１は、ステップＳ１３２で検出された特徴点の中から、特徴度合いが上位である上位特徴点（以下では「暫定上位特徴点」と呼ぶことがある。）を抽出する。１つの例では、制御部１１は、特徴度合いを数値化し、特徴度合いの値が閾値以上である特徴点を暫定上位特徴点として抽出する。他の例では、制御部１１は、特徴度合いが高い上位の所定数の特徴点を、暫定上位特徴点として抽出する。そして、処理はステップＳ１０４に進む。ステップＳ１０４～Ｓ１０７では、暫定上位特徴点を用いてＳｆＭが実行される、つまり簡易ＳｆＭが実行される。

　以上説明した第３実施例によれば、暫定上位特徴点を用いて簡易ＳｆＭを行うことで最適ベースラインを決定し、最適ベースラインを満たす撮影画像に対して通常ＳｆＭを行う。このような第３実施例によっても、全体の処理コストを適切に削減しつつ、３次元位置の算出精度を向上させることが可能となる。この場合、第３実施例によれば、暫定上位特徴点のみを用いてマッチングを行うことで、マッチングコストを低減し、全体の処理コストを削減することができる。

　なお、図１０のステップＳ１１０の特徴点検出では、ステップＳ１３２の特徴点検出の結果をそのまま用いると良い。その場合、ステップＳ１３２の特徴点検出の結果を記憶させておけば良い。こうすることで、新たな処理コストの発生を抑制することができる。

　４－２．第３実施例の変形例
　上記では、第３実施例に係る構成を、制御部１１によるソフトウェア的な処理によって実現していたが、これに限定はされず、ハードウェアにより第３実施例に係る構成を実現しても良い。図１１は、ハードウェアにより第３実施例に係る構成を実現する場合の、画像処理装置５０ｃの概略構成を示すブロック図である。図１１に示すように、第３実施例に係る画像処理装置５０ｃは、画像サイズ縮小部５３及び特徴点検出部５４の代わりに、特徴点検出部８３及び上位特徴点抽出部８４を有する点で、第１実施例に係る画像処理装置５０ａ（図７参照）と異なる。特徴点検出部８３は、図１０のステップＳ１３２及びＳ１１０の処理を行うように機能する。上位特徴点抽出部８４は、図１０のステップＳ１３３の処理を行うように機能する。このような画像処理装置５０ｃによっても、同様の処理を行う部分を同一の構成部にて兼用しているため、ハードウェアコストを削減することができる。

　５．その他の変形例
　上記した実施例では、画像サイズ縮小、画像間引き、及び上位特徴点抽出のいずれか１つのみを実行していたが、画像サイズ縮小、画像間引き、及び上位特徴点抽出のいずれか２以上を組み合わせて実行しても良い。つまり、簡易ＳｆＭとして、画像サイズ縮小、画像間引き、及び上位特徴点抽出のいずれか２以上を実行することで得られたデータを用いたＳｆＭを行っても良い。これにより、全体の処理コストをより削減することが可能となる。

　上記した実施例では、簡易ＳｆＭと通常ＳｆＭとを実行していたが、簡易ＳｆＭの代わりに通常ＳｆＭを実行しても良い。つまり、通常ＳｆＭを２回実行しても良い。その場合、最初に、最適ベースラインを決定するために通常ＳｆＭを実行し、その後に、最適ベースラインを満たす撮影画像のみに対して通常ＳｆＭを行うことで、カメラ２及び被写体の位置を求めれば良い。

　上記した実施例では、本発明を、単一のカメラ２を有するシステムに適用する例を示したが（図１及び図３参照）、本発明は、複数のカメラを有するシステムにも適用することができる。但し、その場合には、複数のカメラが異なる場所に設置されていることが望ましい。例えば、複数のカメラを異なる方向に向けて、カメラ間で共通の被撮影物を撮影することが望ましい。

　また、上記した実施例では、本発明を、カメラ２が車両に搭載されたシステムに適用する例を示したが（図１参照）、本発明の適用はこれに限定はされない。言い換えると、本発明は、移動時にカメラ２で撮影された複数の撮影画像に対して適用することに限定はされない。上記したように異なる場所に設置された複数のカメラを用いた場合には、カメラ２を車両に搭載して移動させる必要はない。

　１　画像処理装置
　２　カメラ
　１１　制御部
　１２　記憶部
　１３　インターフェース

Claims

　被撮影物を異なる位置から撮影した複数の画像を取得する取得手段と、
　前記複数の画像に基づき、前記被撮影物を撮影した位置と、前記被撮影物の位置と、を算出する第１位置算出手段と、
　前記第１位置算出手段による算出結果に基づいて、前記被撮影物を撮影した位置から前記被撮影物までの距離に応じた基線長の範囲を算出する基線長範囲算出手段と、
　前記基線長の範囲を満たし、前記撮影した複数の画像の中から、選択画像を選択する画像選択手段と、
　前記画像選択手段によって選択された前記選択画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置の少なくとも一方を算出する第２位置算出手段と、
　を備えることを特徴とする画像処理装置。
　前記第１位置算出手段は、前記第２位置算出手段よりも、前記位置を算出するための処理量が少ないことを特徴とする請求項１に記載の画像処理装置。
　前記第１位置算出手段は、前記複数の画像のデータ量を削減する処理を行い、当該処理後の画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置を算出することを特徴とする請求項２に記載の画像処理装置。
　前記第１位置算出手段は、前記複数の画像のサイズを縮小する処理を行うことを特徴とする請求項３に記載の画像処理装置。
　前記第１位置算出手段は、前記複数の画像を間引く処理を行い、当該処理後の画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置を算出することを特徴とする請求項２に記載の画像処理装置。
　前記第１位置算出手段は、前記複数の画像から、特徴度合いが所定値以上である特徴点、又は前記特徴度合いが高い上位の所定数の特徴点を抽出し、抽出した前記特徴点に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置を算出することを特徴とする請求項２に記載の画像処理装置。
　前記第１及び第２位置算出手段は、ＳｆＭ（Structure from Motion）に基づいて前記位置を求めることを特徴とする請求項１乃至６のいずれか一項に記載の画像処理装置。
　前記被撮影物を撮影する撮影手段を更に備え、
　前記取得手段は、前記撮影手段から、前記複数の画像を取得することを特徴とする請求項１乃至７のいずれか一項に記載の画像処理装置。
　画像処理装置によって実行される画像処理方法であって、
　被撮影物を異なる位置から撮影した複数の画像を取得する取得工程と、
　前記複数の画像に基づき、前記被撮影物を撮影した位置と、前記被撮影物の位置と、を算出する第１位置算出工程と、
　前記第１位置算出工程による算出結果に基づいて、前記被撮影物を撮影した位置から前記被撮影物までの距離に応じた基線長の範囲を算出する基線長範囲算出工程と、
　前記基線長の範囲を満たし、前記撮影した複数の画像の中から、選択画像を選択する画像選択工程と、
　前記画像選択工程によって選択された前記選択画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置の少なくとも一方を算出する第２位置算出工程と、
　を備えることを特徴とする画像処理方法。
　コンピュータを有する画像処理装置によって実行される画像処理プログラムであって、
　前記コンピュータを、
　被撮影物を異なる位置から撮影した複数の画像を取得する取得手段、
　前記複数の画像に基づき、前記被撮影物を撮影した位置と、前記被撮影物の位置と、を算出する第１位置算出手段、
　前記第１位置算出手段による算出結果に基づいて、前記被撮影物を撮影した位置から前記被撮影物までの距離に応じた基線長の範囲を算出する基線長範囲算出手段、
　前記基線長の範囲を満たし、前記撮影した複数の画像の中から、選択画像を選択する画像選択手段、
　前記画像選択手段によって選択された前記選択画像に基づいて、前記被撮影物を撮影した位置及び前記被撮影物の位置の少なくとも一方を算出する第２位置算出手段、
　として機能させることを特徴とする画像処理プログラム。