JP4573085B2

JP4573085B2 - 位置姿勢認識装置とその位置姿勢認識方法、及び位置姿勢認識プログラム

Info

Publication number: JP4573085B2
Application number: JP2001244473A
Authority: JP
Inventors: 塁石山
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2001-08-10
Filing date: 2001-08-10
Publication date: 2010-11-04
Anticipated expiration: 2021-08-10
Also published as: CA2397237C; US20070172127A1; US20030035098A1; CA2397237A1; US7218773B2; US7313266B2; GB0218591D0; GB2380383B; JP2003058896A; GB2380383A

Description

【０００１】
【発明の属する技術分野】
本発明は、画像中に示される物体の認識に関し、特に、認識対象の物体の３次元形状や、表面反射率や色情報等の情報を用いて、画像に写っている物体の位置や姿勢を高精度に認識する位置姿勢認識装置とその位置姿勢認識方法、及び位置姿勢認識プログラムに関する。
【０００２】
【従来の技術】
本発明の属する技術である画像中に示される物体の位置姿勢の認識技術とは、カメラなどの撮影装置を用いて３次元物体を撮影した２次元画像を入力として、その画像に写っている物体の位置や姿勢を認識する技術である。
【０００３】
従来より、物体上の特定のｎ個の点の３次元空間における位置と画像上の位置の対応が与えられたときに、物体のカメラに対する位置姿勢を計算する問題は、「透視ｎ点問題」と呼ばれており、数多くの公知の手法が存在する。これらの手法は例えば文献１（「An Analytic Solution for the Perspective 4-Point Problem」、Radu Horaud et al.、 Computer Vision、 Graphics and Image Processing、47、pp.33-44（1989））や、文献２（「Linear N≧4-Point Pose Determination」、Long Quan and Zhongdan Lan、 Proc. IEEE Int. Conf. Computer Vision、6、pp.778-783（1998））などにもまとめられている。
【０００４】
これら従来の透視ｎ点問題の手法では、いずれも図１９のフローチャートに示すように、まず予め処理対象の物体の特徴点の３次元位置情報を登録しておく（ステップ１９０１）。そして、処理対象の物体の画像の入力を受け付けて（ステップ１９０２）、その入力画像に写っている物体特徴点の位置を抽出する（ステップ１９０３）。その入力画像から抽出された特徴点の位置に、登録されている処理対象の物体の特徴点の３次元位置が該当する物体の位置と姿勢を計算し（ステップ１９０４、１９０５）、最適の姿勢候補を選択して出力する（ステップ１９０６）。
【０００５】
まず、最低３点以上について前記対応が与えられれば、最大４つの姿勢候補を計算することができる。しかし、３点の特徴点位置情報だけでは該姿勢候補群から正しい姿勢候補を一意に定めることができないため、通常４点以上の対応を用いる。すなわち、４点以上の内から３点を選んで計算した各姿勢候補の中から、残りの点の位置を計算した際に最も近くなる姿勢候補を選択すればよい。
【０００６】
ところが逆に、３点より多くの対応が与えられた場合、与えられた特徴点位置情報の誤差がゼロでない限り、全ての点が一致する姿勢パラメタは存在しない。
しかし現実には、特徴点位置の抽出を手動で入念に行った場合でさえも、必ず誤差が伴う。したがって、最小二乗などの方法を用いることにより与えられた特徴点群全体に対するモデル当てはめ誤差が最小となる解を求めるか、誤差が大きいと思われる点を捨てて姿勢を計算する、などの手法が利用されている。
【０００７】
このように、透視ｎ点問題の技術は、いずれも与えられた特徴点群全体に対するモデルの当てはめ誤差を最小化するような姿勢解を求める技術である。また、ここに示されたようにいずれも特徴点の位置情報のみを用いており、画像の濃淡情報自体は用いていない。
【０００８】
他の従来の手法としての文献３（特願２０００−２５７３０４号「３次元空間内の物体の位置及び向きを計算する方法」）記載の手法は、図２０のフローチャートに示されるように、与えられた特徴点位置に誤差が含まれていることを考慮し、誤差の少ない特徴点だけを選択して姿勢計算に使おうとする技術である。
【０００９】
文献３の手法では、与えられた特徴点群の中から任意の組み合わせで３点を選んで抜き出し、抜き出したそれぞれの３点の位置を修正しながら多数の姿勢候補を計算し、該姿勢候補群から与えられた特徴点群全体に対する当てはめ誤差が最小となる姿勢解を選び出す。
【００１０】
他の従来の手法としての文献４（特開２０００−３３９４６８号「３次元データの位置合わせ方法及び装置」）記載の技術も、２次元画像中に写っている物体の位置姿勢の認識に利用可能である。
【００１１】
文献４記載の手法は、同じ物体を異なる向きから測定した２つの３次元物体形状データの位置姿勢の微小なずれを推定する手法であり、設定したある視点から見た２つの形状データの画像をそれぞれ生成し、該生成した画像上で２つの形状データの対応する特徴点の位置を探索し、姿勢のずれを計算する。一方の形状データから生成した画像を入力画像であると考えれば、２次元画像中の物体の位置姿勢に応用可能である。
【００１２】
さらに他の従来の手法としての文献５（特開平１１−０５１６１１号「認識対象物体の位置姿勢認識装置及び位置姿勢認識方法」）記載の技術は、円柱など特定形状の対象物体を対象とし、画像から該輪郭線のエッジを抽出し、記憶している３次元形状モデルから生成した該輪郭エッジ画像と比較し、計算された姿勢パラメタの値を修正する。
【００１３】
さらに他の従来の手法としての文献６（特願２０００−２５１７７２号「物体位置姿勢推定装置及びその方法並びそれを用いた特徴点位置抽出方法及び画像照合方法」）記載の技術は、与えられた初期姿勢データを用いて生成した物体の比較画像を用いて、特徴点の位置周辺の部分画像を切り出してテンプレートとし、その周辺でテンプレートに最も似ている位置を探すことで特徴点の位置を修正し、姿勢を再計算する。
【００１４】
【発明が解決しようとする課題】
以下、上述した従来の技術における問題点について述べる。
【００１５】
一般に、認識対象の画像（入力画像）における物体の位置姿勢や照明条件が大きく変動したり、物体の形状や色に明確な特徴がない場合などに特徴点の位置を正確に抽出することは極めて困難であり、認識対象の画像から抽出された特徴点の位置は誤差を含んでいる。
【００１６】
特に、対象物体がエッジや角が明確でその検出が容易な多角形のような形状でない場合や、表面の模様に特徴的な点がない場合には抽出誤差が大きくなり、更に、特徴点として使える点の数が少なくなる。
【００１７】
しかし、前記透視ｎ点問題、文献３、文献４、文献５のいずれの手法も、モデルを当てはめたときの計算上の特徴点位置と、認識対象の画像から抽出された画像上の特徴点位置が近くなる姿勢が正しい姿勢であるとして最適解を決定している。したがって、誤差を含んだ特徴点位置情報を元に最適な解を決定しているため、正しい姿勢が求められないという問題があった。
【００１８】
透視ｎ点問題の技術では、入力された各特徴点位置に対する誤差の総和が最小である姿勢を計算するが、それは必ずしも正しい姿勢ではないという問題があった。例えば、一点だけ誤差の大きい点があり、その他の点の誤差がゼロであった場合を考えても、これらの手法では正しい姿勢解を求めることはできない。
【００１９】
また、特徴点が３点しか抽出できなかった場合や、４点以上抽出できてもそれらの特徴点が同一平面上にあるなど特別な配置にあった場合には、複数の姿勢候補を計算することはできても、その中から正しい姿勢を一意に決定することができない場合があるという問題があった。
【００２０】
文献３の技術では、原理的に、どの特徴点が誤差の小さい点であり、どの点が誤差の大きい点であるかは入力された特徴点位置データだけからは判別不能であるため、この手法で本当に誤差が少ない特徴点だけを選択することは不可能であるという問題があった。
【００２１】
また、最適な姿勢であるかどうかの判定を、誤差の伴った特徴点情報に基づいて決定している以上、正しい判別ができずに誤った姿勢候補を正しいものとして選んだり、誤った位置へと特徴点位置を修正した場合に、偶然、当てはめ誤差が最小となって誤った姿勢が求まってしまう場合がある。
【００２２】
文献４の手法も、認識対象の画像からの特徴点位置の抽出を行い、抽出された特徴点位置を元に姿勢を計算するので、前記文献１、文献２、文献３の手法と同様に正確な姿勢が計算できないことや、特徴点の数が少ない場合には一意に姿勢を決定できないという問題があった。
【００２３】
文献５の手法は、回転体のように特定の形状の物体のみに適用可能であって複雑な形状の物体には適用できないことや、認識対象の画像から外輪郭線が正確に抽出できなければ誤差を含んだ特徴位置情報に基づいて姿勢を計算することになるため正しい姿勢を求められないという問題があった。
【００２４】
文献６の手法は、認識対象の画像の撮影時の照明条件が大きく変動し、特徴点周辺の陰影が変化した場合、比較画像の対応する部位との類似度が低下するため、正しい特徴点位置を探索し特徴点位置を修正することが困難であるという問題があった。
【００２５】
以上をまとめると、従来の手法には次のような問題があった。
【００２６】
第１の問題として、物体形状又は表面の文様に、位置姿勢や照明条件が変動してもその画像上での位置の特定が容易な、特徴的な部位がない場合、特徴点の抽出が行えないために姿勢を計算できなかった。
【００２７】
第２の問題として、特徴点の数が３点しかない場合、又は、特徴点が４点以上あってもそれらが３次元的に特別な配置にある場合に、位置姿勢を一意に決定することができなかった。
【００２８】
第３の問題として、一般には認識対象の画像から抽出された特徴点位置に誤差が含まれる。したがって、誤差を含む特徴点群データから、誤差の少ない（又は誤差がない）点を選別することは、正しい特徴点位置が不明である限り不可能であるため正しい姿勢パラメタを求められなかった。誤差を含む特徴点群に対しての当てはめ誤差が最小となる解を求めても、一般には、その解は正しい姿勢パラメタとは一致しなかった。特徴点の位置を修正しながら多数の解を求め、その中から最適な解を選ぶ手法もあるが、誤差を含んだ特徴点の位置情報に基づいて最適解を選択する限り、正しい姿勢解を選び出すことができなかった。
【００２９】
本発明の目的は、上記従来技術の欠点を解決し、認識対象の画像における物体の位置姿勢や照明条件が大きく変動したり、物体の形状や色に明確な特徴がない場合等における、認識対象の画像から十分な数の特徴点を抽出できなかったり、特徴点の位置を正確に抽出することができない場合においても、正しい位置姿勢を認識することができる位置姿勢認識装置とその位置姿勢認識方法、及び位置姿勢認識プログラムを提供することである。
【００３０】
【課題を解決するための手段】
上記目的を達成するため本発明の位置姿勢認識装置は、認識対象の画像から物体の位置姿勢を認識する位置姿勢認識装置において、前記物体の３次元形状と、当該物体表面の各位置の輝度を表すテクスチャの各要素を並べてベクトルとし、様々な照明条件の下でのテクスチャ群をベクトル群とし、前記ベクトル群の張る高次元線形空間の基底ベクトルとして算出された基底ベクトル群である基底テクスチャ群とから成る３次元物体モデルを生成し、前記３次元物体モデルの前記基底テクスチャ群に基づいて照明条件を再現した画像を生成する際に、当該再現画像と認識対象画像が合致するような姿勢を求めることにより、前記認識対象の画像中における前記物体の位置姿勢を認識することを特徴とする。
【００３１】
請求項２の本発明の位置姿勢認識装置は、前記認識対象の画像中における前記物体の位置姿勢の候補である姿勢候補に基づいて、前記姿勢候補の位置姿勢に当該物体がある場合の画像の輝度値の照明条件による変動を表す照明変動空間を生成する照明変動空間生成手段と、前記姿勢候補の位置姿勢に当該物体がありかつ照明条件が前記認識対象の画像と同等である場合に得られる画像である比較画像を、前記３次元物体モデル及び前記照明変動空間に基づいて生成する比較画像生成手段と、複数の前記姿勢候補のそれぞれに基づいて生成された各前記比較画像を、前記認識対象の画像と比較して、前記認識対象の画像に最も近い前記比較画像を判定する姿勢選択手段を備えることを特徴とする。
【００３２】
請求項３の本発明の位置姿勢認識装置は、前記物体の位置姿勢を示すパラメタの各値を、指定された範囲内において標本化することにより、複数の前記姿勢候補を生成する姿勢候補群決定手段を備え、前記姿勢候補群決定手段が生成した複数の前記姿勢候補の中から、前記認識対象の画像に最も近い前記比較画像を判定することを特徴とする。
【００３３】
請求項４の本発明の位置姿勢認識装置は、前記物体の位置姿勢を示す与えられたパラメタの各値を、指定された増減を行なうことにより、複数の前記姿勢候補を生成する姿勢候補群決定手段を備え、前記姿勢候補群決定手段が生成した複数の前記姿勢候補の中から、前記認識対象の画像に最も近い前記比較画像を判定することを特徴とする。
【００３４】
請求項５の本発明の位置姿勢認識装置は、認識対象の画像中の特徴点の位置を入力画像特徴点位置として抽出する特徴点位置抽出手段を備え、前記姿勢候補群決定手段は、前記物体の前記特徴点の位置の情報と、前記入力画像特徴点位置の情報とに基づいて、複数の前記姿勢候補を生成することを特徴とする。
【００３５】
請求項６の本発明の位置姿勢認識装置は、前記特徴点位置抽出手段が抽出した前記入力画像特徴点位置の一部の特徴点を選択した組を、特徴点群として一つ又は複数生成し、前記姿勢候補群決定手段は、前記物体の前記特徴点の位置の情報と、前記入力画像特徴点位置の当該特徴点組群において選択された前記特徴点とに基づいて、一つ又は複数の前記姿勢候補を生成することを特徴とする。
【００３６】
請求項７の本発明の位置姿勢認識装置は、前記特徴点位置抽出手段が抽出した前記入力画像特徴点位置のデータを、指定された増減を行なうことにより一つ又は複数の新たな前記入力画像特徴点位置を生成することを特徴とする。
【００３７】
請求項８の本発明の位置姿勢認識装置は、前記姿勢候補群決定手段は、定められた前記入力画像特徴点位置に含まれる誤差の範囲である特徴点誤差範囲に基づいて、前記特徴点位置抽出手段が抽出した前記入力画像特徴点位置のデータを、前記特徴点誤差範囲内において標本化することにより、一つ又は複数の前記姿勢候補を生成することを特徴とする。
【００３８】
請求項９の本発明の位置姿勢認識装置は、（１）前記姿勢選択手段が、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた姿勢候補を、最適姿勢候補と定める（２）前記姿勢候補群決定手段が、前記最適姿勢候補を基に新たな複数の前記姿勢候補を生成する（３）新たに生成された複数の前記姿勢候補を基に、前記姿勢選択手段が前記認識対象の画像に最も近い前記比較画像を判定する上記（１）、（２）、（３）の一連の処理を順次繰り返し実行し、かつ定められた時点において前記繰り返しを終了させる終了判定手段を備え、前記繰り返しの終了後、前記姿勢選択手段が、その最終の処理において、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた前記姿勢候補を、前記認識対象の画像中における前記物体の位置姿勢の認識結果として出力することを特徴とする。
【００３９】
請求項１０の本発明の位置姿勢認識装置は、前記姿勢選択手段が、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた前記姿勢候補を、前記認識対象の画像中における前記物体の位置姿勢の認識結果として出力することを特徴とする。
【００４０】
請求項１１の本発明の位置姿勢認識装置は、前記物体の３次元物体モデルを登録する登録部を備えることを特徴とする。
【００４１】
請求項１２の本発明の位置姿勢認識装置は、前記登録部は、前記物体の３次元形状と、当該物体表面上の各位置の色又は反射率に相当する画像データを測定する３次元形状・反射率測定手段と、前記物体の表面各位置の、様々な照明条件の下での輝度値をあらわす照明変動テクスチャ群を生成する照明変動テクスチャ生成手段と、前記照明変動テクスチャ群全体を近似する基底テクスチャ群を計算する基底テクスチャ計算手段を備え、前記物体の３次元形状及び前記基底テクスチャ群を、当該物体の３次元物体モデルとして登録することを特徴とする。
【００４２】
請求項１３の本発明の位置姿勢認識装置は、前記登録部は、前記物体表面上の特徴点の３次元位置情報を登録特徴点位置として記憶することを特徴とする。
【００４３】
請求項１４の本発明の３次元物体モデル登録装置は、物体の位置姿勢を登録する３次元物体モデル登録装置において、前記物体の３次元形状と、当該物体表面上の各位置の色又は反射率に相当する画像データを測定する３次元形状・反射率測定手段と、前記物体の表面各位置の、様々な照明条件の下での輝度値をあらわす照明変動テクスチャ群を生成する照明変動テクスチャ生成手段と、前記照明変動テクスチャ群全体を近似する基底テクスチャ群を計算する基底テクスチャ計算手段を備え、前記物体の３次元形状及び前記基底テクスチャ群を、当該物体の３次元物体モデルとして登録することを特徴とする。
【００４４】
請求項１５の本発明の３次元物体モデル登録装置は、前記物体表面上の特徴点の３次元位置情報を登録特徴点位置として記憶することを特徴とする。
【００４５】
請求項１６の本発明の位置姿勢認識方法は、認識対象の画像中から物体の位置姿勢を認識する位置姿勢認識方法において、前記物体の３次元形状と、当該物体表面の各位置の輝度を表すテクスチャの各要素を並べてベクトルとし、様々な照明条件の下でのテクスチャ群をベクトル群とし、前記ベクトル群の張る高次元線形空間の基底ベクトルとして算出された基底ベクトル群である基底テクスチャ群とから成る３次元物体モデルを生成し、前記３次元物体モデルの前記基底テクスチャ群に基づいて照明条件を再現した画像を生成する際に、当該再現画像と認識対象画像が合致するような姿勢を求めることにより、前記認識対象の画像中における前記物体の位置姿勢を認識することを特徴とする。
【００４６】
請求項１７の本発明の位置姿勢認識方法は、前記認識対象の画像中における前記物体の位置姿勢の候補である姿勢候補に基づいて、前記姿勢候補の位置姿勢に当該物体がある場合の画像の輝度値の照明条件による変動を表す照明変動空間を生成する照明変動空間生成ステップと、前記姿勢候補の位置姿勢に当該物体がありかつ照明条件が前記認識対象の画像と同等である場合に得られる画像である比較画像を、前記３次元物体モデル及び前記照明変動空間に基づいて生成する比較画像生成ステップと、複数の前記姿勢候補のそれぞれに基づいて生成された各前記比較画像を、前記認識対象の画像と比較して、前記認識対象の画像に最も近い前記比較画像を判定する姿勢選択ステップを備えることを特徴とする。
【００４７】
請求項１８の本発明の位置姿勢認識方法は、前記物体の位置姿勢を示すパラメタの各値を、指定された範囲内において標本化することにより、複数の前記姿勢候補を生成する姿勢候補群決定ステップを備え、生成された複数の前記姿勢候補の中から、前記認識対象の画像に最も近い前記比較画像を判定することを特徴とする。
【００４８】
請求項１９の本発明の位置姿勢認識方法は、前記物体の位置姿勢を示す与えられたパラメタの各値を、指定された増減を行なうことにより、複数の前記姿勢候補を生成する姿勢候補群決定ステップを備え、生成された複数の前記姿勢候補の中から、前記認識対象の画像に最も近い前記比較画像を判定することを特徴とする。
【００４９】
請求項２０の本発明の位置姿勢認識方法は、認識対象の画像中の特徴点の位置を入力画像特徴点位置として抽出する特徴点位置抽出ステップを備え、前記姿勢候補群決定ステップは、前記物体の前記特徴点の位置の情報と、前記入力画像特徴点位置の情報とに基づいて、複数の前記姿勢候補を生成することを特徴とする。
【００５０】
請求項２１の本発明の位置姿勢認識方法は、前記特徴点位置抽出ステップにおいて抽出した前記入力画像特徴点位置の一部の特徴点を選択した組を、特徴点群として一つ又は複数生成し、前記姿勢候補群決定ステップは、前記物体の前記特徴点の位置の情報と、前記入力画像特徴点位置の当該特徴点組群において選択された前記特徴点とに基づいて、一つ又は複数の前記姿勢候補を生成することを特徴とする。
【００５１】
請求項２２の本発明の位置姿勢認識方法は、前記特徴点位置抽出ステップにおいて抽出した前記入力画像特徴点位置のデータを、指定された増減を行なうことにより一つ又は複数の新たな前記入力画像特徴点位置を生成することを特徴とする。
【００５２】
請求項２３の本発明の位置姿勢認識方法は、前記姿勢候補群決定ステップは、定められた前記入力画像特徴点位置に含まれる誤差の範囲である特徴点誤差範囲に基づいて、前記特徴点位置抽出ステップにおいて抽出した前記入力画像特徴点位置のデータを、前記特徴点誤差範囲内において標本化することにより、一つ又は複数の前記姿勢候補を生成することを特徴とする。
【００５３】
請求項２４の本発明の位置姿勢認識方法は、（１）前記姿勢選択ステップにおいて、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた姿勢候補を、最適姿勢候補と定める（２）前記姿勢候補群決定ステップにより、前記最適姿勢候補を基に新たな複数の前記姿勢候補を生成する（３）新たに生成された複数の前記姿勢候補を基に、前記姿勢選択ステップにより、前記認識対象の画像に最も近い前記比較画像を判定する上記（１）、（２）、（３）の一連の処理を順次繰り返し実行し、かつ定められた時点において前記繰り返しを終了させる終了判定ステップを備え、前記繰り返しの終了後、前記姿勢選択ステップが、その最終の処理において、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた前記姿勢候補を、前記認識対象の画像中における前記物体の位置姿勢の認識結果として出力することを特徴とする。
【００５４】
請求項２５の本発明の位置姿勢認識方法は、前記姿勢選択ステップが、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた前記姿勢候補を、前記認識対象の画像中における前記物体の位置姿勢の認識結果として出力することを特徴とする。
【００５５】
請求項２６の本発明の位置姿勢認識方法は、前記物体の３次元物体モデルの情報を登録する登録ステップを備えることを特徴とする。
【００５６】
請求項２７の本発明の位置姿勢認識方法は、前記登録ステップでは、前記物体の３次元形状と、当該物体表面上の各位置の色又は反射率に相当する画像データを測定する３次元形状・反射率測定ステップと、前記物体の表面各位置の、様々な照明条件の下での輝度値をあらわす照明変動テクスチャ群を生成する照明変動テクスチャ生成ステップと、前記照明変動テクスチャ群全体を近似する基底テクスチャ群を計算する基底テクスチャ計算ステップを備え、前記物体の３次元形状及び前記基底テクスチャ群を、当該物体の３次元物体モデルとして登録することを特徴とする。
【００５７】
請求項２８の本発明の位置姿勢認識方法は、前記登録ステップでは、前記物体表面上の特徴点の３次元位置情報を登録特徴点位置として記憶することを特徴とする。
【００５８】
請求項２９の本発明の位置姿勢認識プログラムは、コンピュータを制御することにより、認識対象の画像中から物体の位置姿勢を認識する位置姿勢認識プログラムであって、コンピュータに、物体の３次元形状と、当該物体表面の各位置の輝度を表すテクスチャの各要素を並べてベクトルとし、様々な照明条件の下でのテクスチャ群をベクトル群とし、ベクトル群の張る高次元線形空間の基底ベクトルとして算出された基底ベクトル群である基底テクスチャ群とから成る３次元物体モデルを生成し、３次元物体モデルの基底テクスチャ群に基づいて照明条件を再現した画像を生成する際に、当該再現画像と認識対象画像が合致するような姿勢を求めることにより、認識対象の画像中における物体の位置姿勢を認識する処理を実行させることを特徴とする。
【００５９】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
【００６０】
従来の技術では、認識対象の画像（入力画像）から、特徴的な文様や物体形状のエッジその交点といった画像中の物体の特徴点の位置情報（入力画像特徴点位置）を抽出し、３次元物体モデルから計算した特徴点の位置が前記入力画像特徴点位置に最も近くなるような姿勢パラメタを最適な姿勢として求めていた。
【００６１】
これに対し、本発明では、対象物体が剛体又は準剛体とみなすことができて変形がない場合には、物体の画像の変動要因は姿勢と照明条件の変動だけであり、正しい姿勢パラメタを用いて照明条件による陰影の変動の補正を行って生成した比較画像は、その輝度値が認識対象の画像に一致することを利用する。
【００６２】
すなわち、従来の技術と比べて本発明は、複数の姿勢候補の中から最適の姿勢を選ぶときに、認識対象の画像から抽出された特徴点の位置情報を基準にするのではなく、画像の輝度値を直接比較する点、及び、それを可能にするために認識対象の画像の撮影時の照明条件の変化による陰影の変動を補正する点、が大きく異なっている。
【００６３】
本発明では、特徴抽出を行わずに画像の輝度情報を直接比較して、姿勢候補から最適の姿勢を選択することにより、従来の技術のように特徴点位置の抽出誤差に影響されることなく、正しい位置姿勢を認識することができる。
【００６４】
第１の実施の形態
図１は、本発明の第１の実施の形態による位置姿勢認識装置１００の構成を示すブロック図であり、図２は、本実施の形態による位置姿勢認識装置１００の処理の概略を示す図であり、図３は、本実施の形態による位置姿勢認識装置１００の構成の概略を示すブロック図であり、図４は、本実施の形態の位置姿勢認識の処理を説明するためのフローチャートである。
【００６５】
本実施の形態の位置姿勢認識装置１００は、プログラム制御されるＣＰＵ等で実現され、図１、図３に示すように、位置や姿勢を認識しようとする対象物体に関するデータを予め記憶しておくための登録部１０と、実際に撮影された画像から物体の位置や姿勢を認識する認識部２０を備える。
【００６６】
登録部１０は、物体の３次元形状、及び、物体表面の色や反射率を測定する３次元形状・反射率測定部１１と、照明条件の変動による物体表面各位置の陰影を表す照明変動テクスチャを生成する照明変動テクスチャ生成部１２と、テクスチャの照明変動全体を縮約表現するための基底テクスチャ群を計算する基底テクスチャ計算部１３と、前記物体の３次元形状と前記基底テクスチャ群をまとめて３次元物体モデルとして記憶する物体モデル記憶部１４を備える。
【００６７】
３次元形状・反射率測定部１１は、物体の３次元形状と、物体の表面の反射率を測定する（ステップ１１０）。
【００６８】
３次元形状・反射率測定部１１による物体の３次元形状と、物体の表面の反射率の測定方法には、様々な測定装置や手法を用いることができる。例えば一例として、物体の３次元形状を、文献７（特願平１１−１２３６８７号）記載の３次元形状測定装置の技術を用いて測定することができ、またこの他にも様々な３次元形状測定装置や手法を適用することができる。また、物体表面の反射率においては、前記文献７の３次元形状測定装置が測定するテクスチャ画像をそのまま代用することができる。
【００６９】
照明変動テクスチャ生成部１２は、前記３次元形状を用いて物体表面上の各点Ｐ（ｘ，ｙ，ｚ）に対応するテクスチャ座標系（ｓ，ｔ）を定義する（ステップ１２０）。照明変動テクスチャ生成部１２による、該テクスチャ座標系の設定方法には様々な手法が利用可能である。その一例として本実施の形態においては、図１６に示すように、物体の重心を中心として物体を覆う球を考え、物体表面上の各点Ｐを、重心を中心として前記球表面上へ投影し、投影された点Ｑの緯度経度（ｓ，ｔ）をテクスチャ座標とする手法を利用する。しかし、この他にも様々な装置や手法が利用可能である。
【００７０】
ここで、本実施の形態の照明変動テクスチャ生成部１２の、テクスチャ座標系の設定処理を詳細に説明する。
【００７１】
本実施の形態の照明変動テクスチャ生成部１２は、各点Ｐ（ｓ，ｔ）の画像上での輝度値を表すテクスチャＴ（ｓ，ｔ）を、照明条件ｊを様々に変化させながら多数生成し、これを照明変動テクスチャ群｛Ｔ_ｊ（ｓ，ｔ）｝として出力する。ここで、輝度値の計算には様々なコンピュータグラフィックスの手法を応用して適用することが可能であるが、一例として物体表面の反射特性をLambertianモデルで近似し、照明が無限に遠くにあると仮定した以下のような手法を用いる。
【００７２】
まず、前記３次元形状データを用い、物体表面の各点Ｐ（ｓ，ｔ）の法線ベクトルを計算する。そして、各点Ｐ（ｓ，ｔ）の法線ベクトルと反射率ｄ（ｓ，ｔ）とを用いて、指定された方向（緯度、経度）の点光源を受けた場合の、そのＰ（ｓ，ｔ）の点の輝度値Ｔ（ｓ，ｔ）を次の数１の式により求める。
【数１】

ここで、ｅ（ｓ，ｔ）は、点Ｐ（ｓ，ｔ）が影になるかどうかで０か１の値をとる関数とする。影の判定は、点Ｐから光源ベクトルの方向への半直線が物体と交差するかどうかを、光線追跡法の技術などを用いて判定すればよい。
【００７３】
基底テクスチャ計算部１３は、前記照明変動テクスチャ群｛Ｔ_ｊ｝を用いて、任意の照明条件でのテクスチャを包含する部分空間の基底である基底テクスチャ群｛Ｇ_ｉ｝を計算する（ステップ１３０）。
【００７４】
各基底テクスチャＧ_ｉの計算は、数２に示すように、照明変動テクスチャ群｛Ｔ_ｊ｝の各画素の輝度値を並べた縦ベクトルを横に並べた行列の共分散行列の、固有ベクトルと固有値を求める。
【数２】

ここで、固有値｛λ_ｉ｝は、その値の大きい順にｉ＝１，２，３，…，Ｎとする。
【００７５】
そして、求められた固有ベクトルの内で必要な数ｎ個を取り、これを基底テクスチャ群｛Ｇ_ｉ｝（ｉ＝１，２，３，…，ｎ）として出力する。取り出す個数“ｎ”の決定には、例えば、固有値の累積寄与率Ｒとして０．９９（９９％）などの値を設定して、次の数３の式を満たすようにｎを設定する等の方法を用いることができる。
【数３】

【００７６】
物体モデル記憶部１４では、前記３次元形状と、前記基底テクスチャ群｛Ｇ_ｉ｝を記憶しておく（ステップ１４０）。
【００７７】
認識部２０では、カメラ等の撮像装置を用いて撮影された位置や姿勢を認識しようとする物体の２次元画像である入力画像と、物体の位置姿勢の候補として与えられる姿勢候補群を入力とし、前記入力画像中に写っている物体の位置として最も正しい姿勢候補である最適姿勢候補を、位置姿勢の認識結果として出力する。
【００７８】
認識部２０は、前記姿勢候補群を入力とし、物体モデル記憶部１４から物体の３次元物体モデルを読み込み、与えられた姿勢候補の位置姿勢に物体があるときの画像の輝度値の照明条件による変動を表す照明変動空間を生成する照明変動空間生成部２１と、各照明変動空間を用いて入力画像に最も近い画像として比較画像を生成する比較画像生成部２２と、前記比較画像群の中で最も入力画像に近い比較画像を選択し該画像を生成する姿勢候補を最適姿勢候補として出力する姿勢選択部２３を備える。
【００７９】
まず、与えられた姿勢候補群のそれぞれの姿勢候補に対して、照明変動空間生成部２１、及び比較画像生成部２２が処理を行う（ステップ２１０、２２０）。
【００８０】
図５は、本実施の形態の照明変動空間生成部２１の構成を示すブロック図であり、図６は、本実施の形態の照明変動空間生成の処理を説明するためのフローチャートである。本実施の形態の照明変動空間生成部２１は、図５に示すように投影変換決定部２１−１と、基底テクスチャ投影部２１−２を備えている。
【００８１】
投影変換決定部２１−１は、前記姿勢候補の位置姿勢に物体がある場合の物体表面の各点Ｐ（ｓ，ｔ）の画像上での座標（ｕ，ｖ）を計算し、画像座標（ｕ，ｖ）からテクスチャ座標（ｓ，ｔ）への変換ｆ：（ｕ，ｖ）→（ｓ，ｔ）を求め、座標変換として出力する（ステップ６０３）。当然ながら、この変換は画像の画素の内物体の領域である画素についてのみ求めればよい。
【００８２】
この処理には様々な手法を用いることができるが、一例として次のような手法を用いることができる。物体の３次元形状データと、表面の色情報、及び位置姿勢が決まれば、一般的なコンピュータのグラフィクス標準機能を用いて該位置姿勢での物体の画像を描画することができる。
【００８３】
ここで、物体表面各点の色を、その点のテクスチャ座標（ｓ，ｔ）と１対１で対応するように設定し、描画を行えば、描画された画像の各画素（ｕ，ｖ）の色から（ｕ，ｖ）→（ｓ，ｔ）対応関係を求めることができる。この方法はあくまで一例であり、その他様々な手法が適用可能であることはいうまでもない。
【００８４】
基底テクスチャ投影部２１−２は、前記座標変換を用いて基底画像Ｂ_ｉ（ｕ，ｖ）を次式によって計算する（ステップ６０４）。
Ｂ_ｉ（ｕ，ｖ）＝Ｇ_ｉ（ｆ（ｕ，ｖ））、（ｉ＝１，２，３，…，ｎ）
計算された基底画像群｛Ｂ_ｉ｝をまとめて照明変動空間Ｓとして出力する。
【００８５】
比較画像生成部２２は、前記照明変動空間Ｓを用いて、比較画像を、照明変動空間Ｓ内にありかつ入力画像に最も近い画像として生成する（ステップ２２０）。この照明変動空間Ｓ内にある入力画像に最も近い比較画像を生成する方法には、例えば数４に示すように、比較画像を示す係数｛ａ_ｉ｝の値を最小二乗法によって求める等の方法を用いることができる。
【数４】

【００８６】
姿勢選択部２３は、前記姿勢候補群の中の各姿勢候補ｊについて生成した前記比較画像の中で、最も入力画像との類似度の高い比較画像Ｃｊに対応する姿勢候補ｊを、最適姿勢候補として出力する（ステップ２３０）。
【００８７】
入力画像Ｉ_ｑと各比較画像との類似度は、画像の輝度値を比較することにより数５で計算するｄ_ｊの値を用いて、判定することができる。数５の場合においては、ｄ_ｊの値が小さいほど類似度が高いことになるので、ｄ_ｊの値の最も値の小さい比較画像を生成する姿勢候補ｊを最適姿勢候補とする。
【数５】

【００８８】
この類似度の計算方法はあくまで一例であり、この他に、類似度として画像の相関値を用いたり、比較画像と入力画像をそれぞれぼかしたりエッジを強調するなどの特徴抽出や画像処理を加えた後で類似度を計算するなど、様々な方法が適用可能である。
【００８９】
そして、本実施の形態においては、姿勢選択部２３において最適姿勢候補として選択された姿勢を、入力画像中の物体の姿勢の認識結果として出力する（ステップ２９０）。
【００９０】
以上説明したように、本実施の形態によれば、画像の輝度値を直接比較して物体の正しい位置姿勢を判定することができる。このため、入力画像における物体の位置姿勢や照明条件が大きく変動したり、物体の形状や色に明確な特徴がない場合等における、入力画像から十分な数の特徴点を抽出できなかったり、特徴点の位置を正確に抽出することができない場合においても、正しい位置姿勢を認識することができる。
【００９１】
第２の実施の形態
図７は、本発明の第２の実施の形態による位置姿勢認識装置１００ａの構成を示すブロック図であり、図８は、本実施の形態の位置姿勢認識の処理を説明するためのフローチャートである。
【００９２】
本実施の形態は、姿勢候補が複数の候補として離散的に与えられるのではなく、与えられた姿勢とその誤差あるいは変動の範囲として指定されたり、あるいは位置と姿勢の各パラメタの指定された範囲として指定するように、一つ又は複数の連続的な領域として姿勢候補が与えられた場合に、その該姿勢候補領域内で最適な姿勢を求める実施の形態である。
【００９３】
このため本実施の形態では、第１の実施の形態の位置姿勢認識装置１００の構成に加えて、認識部２０ａに姿勢候補群決定部２６を備えている。
【００９４】
姿勢候補群決定部２６は、姿勢候補として、位置姿勢を示すパラメタの値とその位置姿勢からの誤差あるいは変動の範囲が与えられた場合には、その指定された範囲内で、姿勢候補の各パラメタを変動させることにより得られる複数の姿勢候補を生成し、姿勢候補群として出力する（ステップ２６０）。
【００９５】
また、姿勢候補として、位置姿勢を示すパラメタの範囲が与えられた場合には、その指定された範囲内で、位置姿勢の各パラメタをランダムに、又は、適当な間隔で標本化することにより得られる複数の姿勢候補を生成し、姿勢候補群として出力する（ステップ２６０）。
【００９６】
本実施の形態の他の処理は、全て第１の実施の形態と同様である。
【００９７】
以上説明したように、本実施の形態によれば、第１の実施の形態の効果に加えて、連続的な領域として姿勢候補が与えられた場合にも対応し、その指定された姿勢候補の範囲の中から、最適の姿勢候補を選択し、入力画像中の物体の姿勢の認識結果として出力することができる。
【００９８】
第３の実施の形態
図９は、本発明の第３の実施の形態による位置姿勢認識装置１００ｂの構成を示すブロック図であり、図１０は、本実施の形態の位置姿勢認識の処理を説明するためのフローチャートである。
【００９９】
本実施の形態は、第２の実施の形態と同様に、一つの姿勢候補とその誤差あるいは変動の範囲、あるいは、位置姿勢を示す各パラメタの範囲というように一つ又は複数の連続的な領域として与えられた場合に、該姿勢候補領域内で最適な姿勢を求める実施の形態である。
【０１００】
しかし、第２の実施の形態では、正確な姿勢パラメタを求めるためには、誤差範囲全体をできるだけ細かく区切って標本化したり、多数の候補を計算する必要があった。これは、与えられた誤差範囲が大きい場合には、計算量が多くなるという問題がある。
【０１０１】
そこで、本実施の形態では、姿勢候補の各パラメタを予め決めた少しの量ずつ変動させて複数の姿勢候補を生成し、その中から最適な候補を選択し、その最適姿勢候補を再び姿勢候補として認識処理を繰り返すことにより、徐々により最適な姿勢候補を求めていくことを特徴とする。
【０１０２】
この最適な姿勢候補を繰り返し求めていく処理は、予め定められた適当な回数の繰り返しを終えた段階や、どのパラメタを変動させても姿勢候補より良い姿勢パラメタが得られなくなった時点等において、その処理を打ち切ることとする。
【０１０３】
本実施の形態では、第２の実施の形態の認識部２０が、始めに与えられた初期の姿勢候補を基に認識結果として出力する最適姿勢候補を、これを再び初期の姿勢候補に置き換えて認識処理を繰り返すことを特徴とする。このため、第２の実施の形態の構成に加えて、認識処理の繰り返しの終了を判定する終了判定部２８を備えている。
【０１０４】
終了判定部２８は、適当な回数の繰り返しを終えた段階、あるいいは、どのパラメタを変動させても姿勢候補より良い姿勢パラメタが得られなくなった時点で認識処理の繰り返しを打ち切る（ステップ２８０）。また、それ以外の場合には、最適姿勢候補を姿勢候補として置き換えて、姿勢候補群決定部２６以下の処理を繰り返し行う。
【０１０５】
この他の処理は全て第２の実施の形態と同様である。
【０１０６】
以上説明したように、本実施の形態によれば、第２の実施の形態の効果に加えて、認識結果として出力する最適姿勢候補を再び姿勢候補に置き換えて認識処理を繰り返すことができるため、より精度の高い認識結果を得ることができる。
【０１０７】
第４の実施の形態
図１１は、本発明の第４の実施の形態による位置姿勢認識装置１００ｃの構成を示すブロック図であり、図１２は、本実施の形態の位置姿勢認識の処理を説明するためのフローチャートである。
【０１０８】
本実施の形態では、画像の濃淡等の輝度値の情報のみではなく、位置や姿勢を物体の特徴的な見え方をする部位（特徴点）の位置情報も、参照する。しかし、従来の技術とは異なり、最適な姿勢解の選択・決定は、特徴点位置ではなく、画像の濃淡情報をそのまま比較することにより行う。
【０１０９】
本実施の形態では、第１の実施の形態の構成に加えて、登録部１０ｃに、物体の特徴的な部位である物体特徴点の３次元位置を入力する特徴点３次元位置入力部１５と、該特徴点３次元位置を記憶する特徴点３次元位置記憶部１６を備えている。
【０１１０】
なお、３次元形状・反射率測定部１１、照明変動テクスチャ生成部１２、基底テクスチャ計算部１３、物体モデル記憶部１４の処理は、第１の実施の形態と全く同様である。
【０１１１】
特徴点３次元位置入力部１５では、測定した前記３次元形状と反射率を参照し、物体表面上で形状や表面の反射率が急激に変化している部位や、特徴的な形状・文様がある部位を特徴点とし、その３次元の位置座標を入力する（ステップ１５０）。
【０１１２】
この特徴点としては、エッジの交点や曲率の最大点、円弧の中心などの位置はもちろん、直線の傾きと位置など様々な位置特徴量を用いることが可能である。
この特徴点の位置の入力は、ユーザがコンピュータを用いて画面に表示された物体を見ながら手動で位置を指示して行うこともできるし、自動的に行う様々な手法を利用することももちろん可能である。
【０１１３】
特徴点３次元位置記憶部１６は、前記入力された特徴点３次元位置を記憶する（ステップ１６０）。
【０１１４】
本実施の形態の認識部２０ｃは、第１の実施の形態の構成に加えて、入力画像における前記物体特徴点の位置を抽出する特徴点位置抽出部２４と、該入力画像特徴点位置と前記特徴点３次元位置を用いて物体の姿勢の候補を計算する姿勢計算部２５を備えている。
【０１１５】
なお、照明変動空間生成部２１、比較画像生成部２２、姿勢選択部２３の処理は、第１の実施の形態と全く同様である。
【０１１６】
特徴点位置抽出部２４では、特徴点３次元位置記憶部１６に記憶されている各物体特徴点の入力画像における位置を抽出し、入力画像特徴点位置として出力する（ステップ２４０）。この物体特徴点の位置の入力は、ユーザがコンピュータを用いて画面に表示された入力画像を見ながら手動で位置を指示して行うこともできるし、自動的に行う様々な技術を適用可能である。
【０１１７】
姿勢計算部２５では、特徴点３次元位置記憶部１６から特徴点３次元位置を読み込み、前記入力画像特徴点位置に前記特徴点３次元位置にある物体特徴点が投影されるような、位置姿勢のパラメタを計算し、計算された位置姿勢パラメタ群を姿勢候補群として出力する（ステップ２５０）。
【０１１８】
この処理には、前記透視ｎ点問題の様々な技術を利用することが可能である。
物体特徴点の位置が、３点について抽出できた場合、また、４点以上抽出できる場合でも同一平面上にあったり３次元的に特別な配置にある場合、最大４つの姿勢候補が計算される。そこで、この最大４つの姿勢候補を姿勢候補群として出力する。
【０１１９】
上述したように、本実施の形態によれば、特徴点の位置情報だけではこれらの解の内どれが正解であるかを判定できない場合においても、本発明を用いることでどれが正解であるかを決定することができる。また、第１の実施の形態の効果に加えて、更に特徴点の位置情報をも位置姿勢の認識のために用いることにより、より精度の高い認識結果を得ることができる。
【０１２０】
第５の実施の形態
図１３は、本発明の第５の実施の形態による位置姿勢認識装置１００ｄの構成を示すブロック図であり、図１４は、本実施の形態の位置姿勢認識の処理を説明するためのフローチャートである。
【０１２１】
本発明の第５の実施の形態は、第２の実施の形態において更に、姿勢候補の計算を入力画像の特徴点の位置に基づいて行う点と、及び姿勢候補の誤差の範囲を、入力画像からの特徴点位置の抽出誤差に基づいて決定する点を特徴とする。
【０１２２】
登録部１０ｄには、第２の実施の形態の構成に加えて、物体の特徴的な部位である物体特徴点の３次元位置を入力する特徴点３次元位置入力部１５と、該特徴点３次元位置を記憶する特徴点３次元位置記憶部１６を備えている。また、本実施の形態の登録部１０ｄの構成とその処理は、第４の実施の形態と全く同様である。
【０１２３】
本実施の形態の位置姿勢認識装置１００ｄは、第２の実施の形態の構成に加えて、認識部２０ｄに、入力画像における前記物体特徴点の位置を抽出すると共にその抽出誤差の範囲を出力する特徴点位置抽出部２４と、前記特徴点位置と抽出誤差を用いて計算される姿勢の誤差範囲を決定する姿勢範囲決定部２７を備えることを特徴とする。
【０１２４】
特徴点位置抽出部２４は、特徴点３次元位置記憶部１６に記憶されている各物体特徴点の入力画像における位置又はその存在範囲を抽出し、入力画像特徴点位置として出力する（ステップ２４０）。また同時に、抽出した特徴点の位置の誤差の範囲を特徴点誤差範囲として出力する
ここで、物体特徴点の位置の入力処理は、ユーザがコンピュータを用いて画面に表示された入力画像を見ながら手動で位置又は範囲を指示して行う方式や、自動的に特徴点を検出する様々な技術を適用することが可能である。これにも様々な手法が適用可能であるが、前記の手動による入力作業を繰り返し行って誤差の範囲を求めたり、事前に評価実験を行ってどの程度の誤差が生じるかを予め求めておいたり、入力画像のノイズやぼけの量、各物体特徴点のエッジの明確さや特徴として用いている形状の大きさなどから決定することもできる。
【０１２５】
姿勢範囲決定部２７は、前記特徴点誤差範囲を用いて、前記姿勢計算部２５で用いたのと同様に透視ｎ点問題の技術などを利用して計算される姿勢候補のパラメタが、誤差として変動する可能性のある範囲を推定し、姿勢候補範囲として出力する（ステップ２７０）。
【０１２６】
この処理には様々な手法が適用可能であるが、一例として数値シミュレーションを用いる手法が利用可能である。これは、前記特徴点誤差範囲内で前記入力画像特徴点位置を変化させながら多数の姿勢候補を計算し、その存在範囲を求めるものである。この他にも、姿勢の計算に用いる計算式を解析して誤差範囲を求めたり、様々な手法が適用可能である。
【０１２７】
また、姿勢候補群決定部２６以下の処理（ステップ２６０〜２９０）は、全て第２の実施の形態と同様である。
【０１２８】
次に、本発明の様々な実施例を説明する。
【０１２９】
第１の実施例
図１に示した第１の実施の形態を適応した第１の実施例について、その処理例である図１６、図１７を参照して説明する。なお、本実施例では、姿勢を認識する対象物体として人間の顔を対象とする例について説明するが、任意の物体に適用可能であることはいうまでもない。
【０１３０】
図１に示されるように、登録部１０には、予め物体の３次元形状と基底テクスチャ群を３次元モデルとして記憶しておく。登録部１０では、例えば、ビデオカメラ等の撮像装置を用いて２次元の画像を撮影し、姿勢認識処理を行う処理装置に取り込む。
【０１３１】
本実施例の登録部１０は、前述のように３次元形状・反射率測定部１１と、照明変動テクスチャ生成部１２と、基底テクスチャ計算部１３と、物体モデル記憶部１４を備えており、本実施例では、特に照明変動テクスチャ生成部１２と、基底テクスチャ計算部１３の処理の実施例を説明する。
【０１３２】
照明変動テクスチャ生成部１２は、前記３次元形状を用いて物体表面上の各点Ｐ（ｘ，ｙ，ｚ）に対応するテクスチャ座標系（ｓ，ｔ）を定義する。
【０１３３】
本実施例では、テクスチャ座標系の設定方法として、図１６に示すように、顔の３次元形状データの重心を中心として顔全体を覆う適当な大きさの球を考え、物体表面上の各点Ｐを、重心を中心として前記球表面上へ投影し、投影された点Ｑの緯度経度（ｓ，ｔ）をテクスチャ座標とする手法を用いる。
【０１３４】
本実施例の場合においては、顔の後ろ側の頭部の形状データを利用しないこととし、（ｓ，ｔ）＝（０，０）を顔の正面の方向であるように設定し、ｓ、ｔはそれぞれ−９０°から９０°までの範囲であるとする。
【０１３５】
照明変動テクスチャ生成部１２は、各点Ｐ（ｓ，ｔ）の画像上での輝度値を表すテクスチャＴ（ｓ，ｔ）を、照明条件を様々に変化させながらＮ枚生成し、照明変動テクスチャ群Ｔ_ｋ（ｓ，ｔ）として出力する。例えば、無限遠にある一つの点光源を考え、図１７に示すような物体を中心とした球面の経度、緯度をあらわす（θ，φ）の角度で光源の方向を示すとし、θとφを１０°おきに−９０°から９０°まで変化させ、Ｎ＝３６１種類の照明条件群を設定する。この光源の種類、照明方向の設定間隔や範囲の決め方は一例であり、より均一に方向を決めるために種々変更することも可能である。
【０１３６】
輝度値の計算には、様々なコンピュータグラフィックスの手法を応用して適用することが可能であり、本実施例では、物体表面の反射特性をLambertianモデルで近似し、照明が無限に遠くにあると仮定した以下のような手法を用いる。
【０１３７】
まず、前記３次元形状データを用い、物体表面の各点Ｐ（ｓ，ｔ）の法線ベクトルを計算する。そして、各点Ｐ（ｓ，ｔ）の法線ベクトルと反射率ｄ（ｓ，ｔ）とを用いて、指定された方向（緯度、経度）の点光源を受けた場合の、そのＰ（ｓ，ｔ）の点の輝度値Ｔ_ｋ（ｓ，ｔ）を、数１の式と同様にして、次の数６の式により求める。数６では、Ｎ種類（ｋ＝１，２，…，Ｎ）の、球の中心から各方向への方向を表すベクトルを用いている。
【数６】

ここで、ｅ_ｋ（ｓ，ｔ）は、点Ｐ（ｓ，ｔ）が影になるかどうかで０か１の値をとる関数とする。
【０１３８】
基底テクスチャ計算部１３は、前記照明変動テクスチャ群｛Ｔ_ｊ｝を用いて、任意の照明条件でのテクスチャを包含する部分空間の基底である基底テクスチャ群｛Ｇ_ｉ｝を計算する。各基底テクスチャＧ_ｉの計算は、数７に示すように、照明変動テクスチャ群｛Ｔ_ｊ｝の各画素の輝度値を並べた縦ベクトルを横に並べた行列の共分散行列の、固有ベクトルと固有値を求める。
【数７】

ここで、固有値｛λ_ｉ｝は、その値の大きい順にｉ＝１，２，３，…，Ｎとする。
【０１３９】
そして、求められた固有ベクトルの内で必要な数ｎ個を取り、これを基底テクスチャ群｛Ｇ_ｉ｝（ｉ＝１，２，３，…，ｎ）として出力する。取り出す個数“ｎ”の決定には、例えば、固有値の累積寄与率Ｒとして０．９９（９９％）などの値を設定して、（数３の式と同様にして）次の数８の式を満たすようにｎを設定する。
【数８】

【０１４０】
このように、取り出された固有ベクトルの各要素の値を、その要素と対応する画素の輝度値として持つテクスチャを基底テクスチャＧ_ｉとして出力する。
【０１４１】
次に、認識部２０の実施例を説明する。認識部２０は、前述のように照明変動空間生成部２１と、比較画像生成部２２と、姿勢選択部２３を備えており、本実施例では、特に、照明変動空間生成部２１の処理の実施例を説明する。
【０１４２】
本実施例では、位置と姿勢のパラメタとしては、平行移動量を表すＴｘ，Ｔｙ，Ｔｚ及び、回転を表すＲｘ，Ｒｙ，Ｒｚを用いることとする。
【０１４３】
照明変動空間生成部２１は、前述のように投影変換決定部２１−１と、基底テクスチャ投影部２１−２を備えている。
【０１４４】
投影変換決定部２１−１は、前記姿勢候補の位置姿勢に物体がある場合の物体表面の各点Ｐ（ｓ，ｔ）の画像上での座標（ｕ，ｖ）を計算し、画像座標（ｕ，ｖ）からテクスチャ座標（ｓ，ｔ）への変換ｆ：（ｕ，ｖ）→（ｓ，ｔ）を求め、座標変換として出力する。
【０１４５】
本実施例では、変換ｆを求める処理として次の手法を用いる。
【０１４６】
ここで、物体表面各点の色を、その点のテクスチャ座標（ｓ，ｔ）と１対１で対応するように設定し、描画を行えば、描画された画像の各画素（ｕ，ｖ）の色から（ｕ，ｖ）→（ｓ，ｔ）の対応関係を求める。例えば、色の赤、緑、青成分を表すＲＧＢ値はフルカラー表示が可能なコンピュータでは０から２５５の値が設定でき、テクスチャ座標（ｓ，ｔ）は，本実施例では−９０から９０の範囲の値である。
【０１４７】
そこで、テクスチャ座標が（ｓ，ｔ）である点に次の色を設定する。
Ｒ＝（ｓ＋９０）＊２５５／１８０
Ｇ＝（ｔ＋９０）＊２５５／１８０
このようにして生成された画像の各画素（ｕ，ｖ）の色から、上式を逆に用いてテクスチャ座標（ｓ，ｔ）を計算する。
【０１４８】
この方法はあくまで一例であり、その他様々な手法が適用可能であることはいうまでもない。
【０１４９】
そして、基底テクスチャ投影部２１−２は、前記座標変換を用いて基底画像Ｂ_ｉ（ｕ，ｖ）を計算し、計算された基底画像群｛Ｂ_ｉ｝をまとめて照明変動空間Ｓとして出力する。
【０１５０】
第２の実施例
図７に示した第２の実施の形態を適応した第２の実施例について説明する。本実施例は、姿勢候補が複数の候補として離散的に与えられるのではなく、ある姿勢とその誤差あるいは変動の指定された範囲、あるいは位置と姿勢を示すの各パラメタの指定された範囲というように、一つ又は複数の連続的な領域として与えられた場合に、該姿勢候補領域内で最適な姿勢を求める実施例である。
【０１５１】
本実施例では、物体の概略の位置と向きがＴｘ＝０ｍｍ，Ｔｙ＝５０ｍｍ，Ｔｚ＝１００ｍｍ，Ｒｘ＝０°，Ｒｙ＝２０°，Ｒｚ＝４０°であることがわかっており、その誤差が平行移動量で１０ｍｍ、回転で５°以下であるとわかっている場合を例に説明する。
【０１５２】
認識部２０の姿勢候補群決定部２６は、入力された誤差範囲内で、姿勢候補の各パラメタを変動させることにより得られる複数の姿勢候補を生成し、姿勢候補群として出力する。
【０１５３】
本実施例では、例えば一例として、ｘが−１０から１０、ｙが４０から６０、ｚが９０から１１０、Ｒｘが−５から５、Ｒｙが１５から２５、Ｒｚが３５から４５の範囲で、各Ｔｘ，Ｔｙ，Ｔｚは５ｍｍ、Ｒｘ，Ｒｙ，Ｒｚは５°間隔に値を設定して、合計５^３×３^３＝３３７５個の姿勢候補を生成する。この他の処理は、全て第１の実施例と同様である。
【０１５４】
第３の実施例
図９に示した第３の実施の形態を適応した第３の実施例について説明する。本実施例では、第２の実施例の認識部の認識結果である最適姿勢候補を初期の姿勢候補に置き換えて認識処理を繰り返すことを特徴とする。
【０１５５】
また、本実施例の姿勢候補群決定部２６は、姿勢候補の各パラメタを予め決めた少しの量ずつ変動させて複数の姿勢候補を生成し、その中から最適な候補を選択し、最適姿勢候補を再び姿勢候補として処理を繰り返していくことにより、徐々に最適な姿勢候補を求めていく。これにより、より計算量を減らして効率よく最適姿勢候補を求めることができる。
【０１５６】
ここでは一例として、物体の概略の位置と向きがＴｘ＝０ｍｍ，Ｔｙ＝５０ｍｍ，Ｔｚ＝１００ｍｍ，Ｒｘ＝０°，Ｒｙ＝２０°，Ｒｚ＝４０°であることがわかっており、ｘ，ｙ，ｚの変化量を１ｍｍ、Ｒｘ，Ｒｙ，Ｒｚの変化量を１°とする。
【０１５７】
まず、姿勢候補群決定部２６ｂは、Ｔｘ，Ｔｙ，Ｔｚ，Ｒｘ，Ｒｙ，Ｒｚの６つのパラメタの中からそれぞれ一つを選んでＴｘ，Ｔｙ，Ｔｚなら１ｍｍを、Ｒｘ，Ｒｙ，Ｒｚなら１°を増加又は減少させた姿勢候補をそれぞれ生成する。すなわち、合計で２×６＝１２個の姿勢候補を生成し、姿勢候補群として出力する。
【０１５８】
照明変動空間生成部２１から姿勢選択部２３の処理（ステップ２１０〜２３０）は、全て第２の実施の形態と同様である。１２個の各姿勢候補に対し、比較画像を生成し、最も入力画像に近い画像を生成した姿勢候補を選択して最適姿勢候補として出力する。
【０１５９】
終了判定部２８は、前回の最適姿勢候補から生成された比較画像と、入力画像の類似度を記憶しておき、現在の最適姿勢候補から生成された比較画像と入力画像の類似度と比較する。この類似度が高くなっていない場合、処理を打ち切る。
類似度が高くなっている場合には、現在の最適姿勢候補を姿勢候補として置き換え、姿勢候補群決定部２６以下の処理（ステップ２６０〜ステップ２８０）を繰り返し行う。この他の処理は、全て第２の実施例と同様である。
【０１６０】
第４の実施例
図１１に示した第４の実施の形態を適応した第４の実施例について、その処理例である図１８を参照して説明する。本実施例は、位置や姿勢を物体の特徴的な見え方をする部位の位置情報に基づいて決定するが、従来の技術と異なり、最適な姿勢解の選択・決定は、特徴点位置ではなく、入力画像と比較画像の濃淡情報をそのまま比較することにより行う。本実施例では、一例として人間の顔を対象物体として用い、図１８の１２個の特徴点を用いる場合について述べる。
【０１６１】
本実施例の登録部１０ｃは、前述のように第１の実施の形態の構成に加えて、特徴点３次元位置入力部１５と、特徴点３次元位置記憶部１６を備えている。
【０１６２】
特徴点３次元位置入力部１５は、測定した前記３次元形状と反射率を参照し、目尻の位置など図１８に示す１２個の特徴点の位置を入力する。この特徴点の位置の入力は、ユーザがコンピュータを用いて画面に表示された物体を見ながら手動で位置を指示して行うこともできるし、自動的に行う様々な手法を利用することももちろん可能である。一例として、図１６の右図に示したようなテクスチャ画像をコンピュータの画面に表示し、ユーザが各特徴点の位置を画面上で指示していくという方法が利用可能である。
【０１６３】
特徴点３次元位置記憶部１６は、前記入力された１２個の特徴点の、３次元座標を記憶する。
【０１６４】
また本実施例の認識部２０ｃは、前述のように第１の実施の形態の構成に加えて、特徴点位置抽出部２４と、姿勢計算部２５を備えている。
【０１６５】
特徴点位置抽出部２４は、図１８の１２個の特徴点の入力画像における位置を抽出し、入力画像特徴点位置として出力する。この物体特徴点の位置の入力は、ユーザがコンピュータを用いて画面に表示された入力画像を見ながら手動で位置を指示して行うこともできるし、自動的に行う様々な技術を適用可能である。本実施例では、一例として、入力画像が不鮮明であったために、１２個の特徴点の内、両目と口中央の位置である図１８の１、４、１０の３点の位置しか入力できなかった例を説明する。
【０１６６】
姿勢計算部２５は、特徴点３次元位置記憶部１６から特徴点３次元位置を読み込み、前記入力画像特徴点位置に前記特徴点３次元位置にある物体特徴点が投影されるような、位置姿勢のパラメタを計算し、計算された位置姿勢パラメタ群を姿勢候補群として出力する。
【０１６７】
例えば、従来の透視ｎ点問題の技術を用いることにより、３点の特徴点の入力画像上の位置と３次元座標が得られているので、最大４つの姿勢候補が計算できる。これらの姿勢候補を姿勢候補群として出力する。
【０１６８】
この他の処理は、全て第１の実施例と同様である。
【０１６９】
第５の実施例
図１２に示した第５の実施の形態を適応した第５の実施例について、その処理例である図１２、図１３を参照して説明する。本実施例は、第２の実施例において更に、姿勢候補の計算を入力画像の特徴点の位置に基づいて行う点、及び、姿勢候補の誤差の範囲を、入力画像からの特徴点位置の抽出誤差に基づいて決定する点が異なる。また、本実施例でも、第４の実施例と同様に人間の顔を対象物体とする例を説明する。
【０１７０】
本実施例では、前述のように第２の実施の形態の構成に加えて、認識部２０ｄに、特徴点位置抽出部２４と、姿勢範囲決定部２７を備えている。
【０１７１】
特徴点位置抽出部２４は、図１８の１２の物体特徴点の入力画像における位置を抽出し、入力画像特徴点位置として出力する。この物体特徴点の位置の入力は、ユーザがコンピュータを用いて画面に表示された入力画像を見ながら手動で位置又は範囲を指示して行うこともできるし、自動的に行う様々な技術を適用可能である。また同時に、抽出した特徴点の位置の誤差の範囲を特徴点誤差範囲として出力する。一例として、図１８の１２個の特徴点の内１、４、１０の３つの特徴点のみが入力されており、それぞれの特徴点誤差範囲が５画素以下であると推定されている場合を説明する。
【０１７２】
姿勢範囲決定部２７は、前記特徴点誤差範囲を用いて、前記姿勢計算部２５で用いたのと同様に透視ｎ点問題の技術などを利用して計算される姿勢候補のパラメタが、誤差として変動する可能性のある範囲を推定し、姿勢候補範囲として出力する。これには様々な手法が適用可能であるが、一例として数値シミュレーションを用いる次のような手法が利用可能である。
【０１７３】
本実施例では図１８の特徴点１、４、１０が入力されており、それぞれ誤差が５画素以内と推定されている。したがって、各特徴点の位置を入力された位置を中心とする半径５画素の円内でランダムに変動させて、多数の姿勢候補を計算する。例えば、１００回の特徴点位置を変動させる試行を繰り返し、１００個の姿勢候補を計算する。そして、各姿勢候補の姿勢パラメタＴｘ，Ｔｙ，Ｔｚ，Ｒｘ，Ｒｙ，Ｒｚの値を調べ、それぞれのパラメタの分布領域を調べる。該分布領域を姿勢解候補範囲として出力する。
【０１７４】
上記の姿勢候補範囲の推定方法は一例であり、この他にも姿勢の計算に用いる計算式を解析して誤差範囲を求めたり、様々な手法が適用可能である。
【０１７５】
姿勢候補群決定部２６以下の処理は、全て第２の実施の形態と同様である。
【０１７６】
また、本発明の位置姿勢認識装置は、上述の各実施の形態及び実施例のように装置内に登録部と認識部の双方を備える方式に限らず、図１５に示すように、位置姿勢認識装置１００ｅ内には認識部２０のみを備えて、登録部１０を備える外部の３次元物体モデル登録装置３００から、物体の３次元モデルのデータの入力を受け付ける方式も同様にして実施することができる。
【０１７７】
また、上記各実施の形態及び実施例は、互いに様々に組み合わせて実施することができる。
【０１７８】
なお、本実施の形態の位置姿勢認識装置１００、１００ａ、１００ｂ、１００ｃ、１００ｄ、１００ｅや、３次元物体モデル登録装置３００は、登録部１０、１０ｃ、１０ｄにおける形状・反射率測定部１１、照明変動テクスチャ生成部１２、基底テクスチャ計算部１３、特徴点３次元位置入力部１５の機能や、認識部２０、２０ａ、２０ｂ、２０ｃ、２０ｄにおける照明変動空間生成部２１、投影変換決定部２１−１、基底テクスチャ投影部２１−２、比較画像生成部２２、姿勢選択部２３、特徴点位置抽出部２４、姿勢計算部２５、姿勢候補群決定部２６、姿勢範囲決定部２７、終了判定部２８の機能や、その他の機能をハードウェア的に実現することは勿論として、各機能を備えるコンピュータプログラムである位置姿勢認識プログラムを、コンピュータ処理装置のメモリにロードされることで実現することができる。この位置姿勢認識プログラムは、磁気ディスク、半導体メモリその他の記録媒体９０、９１、９２、９３、９４、９５、９９に格納される。そして、その記録媒体からコンピュータ処理装置にロードされ、コンピュータ処理装置の動作を制御することにより、上述した各機能を実現する。
【０１７９】
以上好ましい実施の形態及び実施例をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び実施例に限定されるものではなく、その技術的思想の範囲内において様々に変形して実施することができる。
【０１８０】
【発明の効果】
以上説明したように本発明の位置姿勢認識装置とその位置姿勢認識方法、及び位置姿勢認識プログラムによれば、以下のような効果が達成される。
【０１８１】
第１に、本発明によれば、様々な位置姿勢、照明条件の下で撮影された認識対象の画像に対して、正しい物体の位置姿勢を決定することができる。特に、認識対象の画像と物体の３次元モデルの間の特徴点の対応が利用できない場合にも、正しい物体の位置姿勢を決定することができる。
【０１８２】
第２に、本発明によれば、認識対象の画像から特徴点の位置を抽出して画像中の物体の位置姿勢を計算する場合に、入力された特徴点位置が誤差を含んでいても、正しい位置姿勢を認識することができる。
【０１８３】
第３に、本発明によれば、特徴点が３点しか抽出できなかったり、特徴点が特別な配置にあって位置姿勢が一意に計算できない場合にも、本発明の技術を用いることで正しい位置姿勢を認識することができる。
【図面の簡単な説明】
【図１】本発明の第１の実施の形態による位置姿勢認識装置の構成を示すブロック図である。
【図２】本発明の第１の実施の形態による位置姿勢認識装置の処理の概略を示す図である。
【図３】本発明の第１の実施の形態による位置姿勢認識装置の構成の概略を示すブロック図である。
【図４】本発明の第１の実施の形態の位置姿勢認識の処理を説明するためのフローチャートである。
【図５】本発明の第１の実施の形態の照明変動空間生成部の構成を示すブロック図である。
【図６】本発明の第１の実施の形態の照明変動空間生成の処理を説明するためのフローチャートである。
【図７】本発明の第２の実施の形態による位置姿勢認識装置の構成を示すブロック図である。
【図８】本発明の第２の実施の形態の位置姿勢認識の処理を説明するためのフローチャートである。
【図９】本発明の第３の実施の形態による位置姿勢認識装置の構成を示すブロック図である。
【図１０】本発明の第３の実施の形態の位置姿勢認識の処理を説明するためのフローチャートである。
【図１１】本発明の第４の実施の形態による位置姿勢認識装置の構成を示すブロック図である。
【図１２】本発明の第４の実施の形態の位置姿勢認識の処理を説明するためのフローチャートである。
【図１３】本発明の第５の実施の形態による位置姿勢認識装置の構成を示すブロック図である。
【図１４】本発明の第５の実施の形態の位置姿勢認識の処理を説明するためのフローチャートである。
【図１５】本発明のその他の実施の形態による位置姿勢認識装置と３次元物体モデル登録装置の構成を示すブロック図である。
【図１６】テクスチャ座標の定義方法の一例を説明する図である。
【図１７】物体に対する光源の方向の定義の一例を説明する図である。
【図１８】顔を対象物体にするときに用いる特徴点の位置の一例を説明する図である。
【図１９】従来の技術の、透視ｎ点問題を解く技術の処理の流れを説明する図である。
【図２０】従来の技術の、文献３の技術の処理の流れを説明する図である。
【符号の説明】
１００、１００ａ、１００ｂ、１００ｃ、１００ｄ、１００ｅ位置姿勢認識装置
３００３次元物体モデル登録装置
１０、１０ｃ、１０ｄ登録部
１１形状・反射率測定部
１２照明変動テクスチャ生成部
１３基底テクスチャ計算部
１４物体モデル記憶部
１５特徴点３次元位置入力部
１６特徴点３次元位置記憶部
２０、２０ａ、２０ｂ、２０ｃ、２０ｄ認識部
２１照明変動空間生成部
２１−１投影変換決定部
２１−２基底テクスチャ投影部
２２比較画像生成部
２３姿勢選択部
２４特徴点位置抽出部
２５姿勢計算部
２６姿勢候補群決定部
２７姿勢範囲決定部
２８終了判定部
９０、９１、９２、９３、９４、９５、９９記録媒体

Claims

認識対象の画像から物体の位置姿勢を認識する位置姿勢認識装置において、
前記物体の３次元形状と、当該物体表面の各位置の輝度を表すテクスチャの各要素を並べてベクトルとし、様々な照明条件の下でのテクスチャ群をベクトル群とし、前記ベクトル群の張る高次元線形空間の基底ベクトルとして算出された基底ベクトル群である基底テクスチャ群とから成る３次元物体モデルを生成し、前記３次元物体モデルの前記基底テクスチャ群に基づいて照明条件を再現した画像を生成する際に、当該再現画像と認識対象画像が合致するような姿勢を求めることにより、前記認識対象の画像中における前記物体の位置姿勢を認識することを特徴とする位置姿勢認識装置。
前記認識対象の画像中における前記物体の位置姿勢の候補である姿勢候補に基づいて、前記姿勢候補の位置姿勢に当該物体がある場合の画像の輝度値の照明条件による変動を表す照明変動空間を生成する照明変動空間生成手段と、
前記姿勢候補の位置姿勢に当該物体がありかつ照明条件が前記認識対象の画像と同等である場合に得られる画像である比較画像を、前記３次元物体モデル及び前記照明変動空間に基づいて生成する比較画像生成手段と、
複数の前記姿勢候補のそれぞれに基づいて生成された各前記比較画像を、前記認識対象の画像と比較して、前記認識対象の画像に最も近い前記比較画像を判定する姿勢選択手段を備えることを特徴とする請求項１に記載の位置姿勢認識装置。
前記物体の位置姿勢を示すパラメタの各値を、指定された範囲内において標本化することにより、複数の前記姿勢候補を生成する姿勢候補群決定手段を備え、
前記姿勢候補群決定手段が生成した複数の前記姿勢候補の中から、前記認識対象の画像に最も近い前記比較画像を判定することを特徴とする請求項２に記載の位置姿勢認識装置。
前記物体の位置姿勢を示す与えられたパラメタの各値を、指定された増減を行なうことにより、複数の前記姿勢候補を生成する姿勢候補群決定手段を備え、
前記姿勢候補群決定手段が生成した複数の前記姿勢候補の中から、前記認識対象の画像に最も近い前記比較画像を判定することを特徴とする請求項２に記載の位置姿勢認識装置。
認識対象の画像中の特徴点の位置を入力画像特徴点位置として抽出する特徴点位置抽出手段を備え、
前記姿勢候補群決定手段は、
前記物体の前記特徴点の位置の情報と、前記入力画像特徴点位置の情報とに基づいて、複数の前記姿勢候補を生成することを特徴とする請求項３又は請求項４に記載の位置姿勢認識装置。
前記特徴点位置抽出手段が抽出した前記入力画像特徴点位置の一部の特徴点を選択した組を、特徴点群として一つ又は複数生成し、
前記姿勢候補群決定手段は、
前記物体の前記特徴点の位置の情報と、前記入力画像特徴点位置の当該特徴点組群において選択された前記特徴点とに基づいて、一つ又は複数の前記姿勢候補を生成することを特徴とする請求項５に記載の位置姿勢認識装置。
前記特徴点位置抽出手段が抽出した前記入力画像特徴点位置のデータを、指定された増減を行なうことにより一つ又は複数の新たな前記入力画像特徴点位置を生成することを特徴とする請求項５又は請求項６に記載の位置姿勢認識装置。
前記姿勢候補群決定手段は、
定められた前記入力画像特徴点位置に含まれる誤差の範囲である特徴点誤差範囲に基づいて、前記特徴点位置抽出手段が抽出した前記入力画像特徴点位置のデータを、前記特徴点誤差範囲内において標本化することにより、一つ又は複数の前記姿勢候補を生成することを特徴とする請求項３から請求項７のいずれか１つに記載の位置姿勢認識装置。
（１）前記姿勢選択手段が、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた姿勢候補を、最適姿勢候補と定める
（２）前記姿勢候補群決定手段が、前記最適姿勢候補を基に新たな複数の前記姿勢候補を生成する
（３）新たに生成された複数の前記姿勢候補を基に、前記姿勢選択手段が前記認識対象の画像に最も近い前記比較画像を判定する
上記（１）、（２）、（３）の一連の処理を順次繰り返し実行し、かつ定められた時点において前記繰り返しを終了させる終了判定手段を備え、
前記繰り返しの終了後、前記姿勢選択手段が、その最終の処理において、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた前記姿勢候補を、前記認識対象の画像中における前記物体の位置姿勢の認識結果として出力することを特徴とする請求項３から請求項８のいずれか１つに記載の位置姿勢認識装置。
前記姿勢選択手段が、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた前記姿勢候補を、前記認識対象の画像中における前記物体の位置姿勢の認識結果として出力することを特徴とする請求項２から請求項８のいずれか１つに記載の位置姿勢認識装置。
前記物体の３次元物体モデルを登録する登録部を備えることを特徴とする請求項１から請求項１０のいずれか１つに記載の位置姿勢認識装置。
前記登録部は、
前記物体の３次元形状と、当該物体表面上の各位置の色又は反射率に相当する画像データを測定する３次元形状・反射率測定手段と、
前記物体の表面各位置の、様々な照明条件の下での輝度値をあらわす照明変動テクスチャ群を生成する照明変動テクスチャ生成手段と、
前記照明変動テクスチャ群全体を近似する基底テクスチャ群を計算する基底テクスチャ計算手段を備え、
前記物体の３次元形状及び前記基底テクスチャ群を、当該物体の３次元物体モデルとして登録することを特徴とする請求項１１に記載の位置姿勢認識装置。
前記登録部は、
前記物体表面上の特徴点の３次元位置情報を登録特徴点位置として記憶することを特徴とする請求項１２に記載の位置姿勢認識装置。
物体の位置姿勢を登録する３次元物体モデル登録装置において、
前記物体の３次元形状と、当該物体表面上の各位置の色又は反射率に相当する画像データを測定する３次元形状・反射率測定手段と、
前記物体の表面各位置の、様々な照明条件の下での輝度値をあらわす照明変動テクスチャ群を生成する照明変動テクスチャ生成手段と、
前記照明変動テクスチャ群全体を近似する基底テクスチャ群を計算する基底テクスチャ計算手段を備え、
前記物体の３次元形状及び前記基底テクスチャ群を、当該物体の３次元物体モデルとして登録することを特徴とする３次元物体モデル登録装置。
前記物体表面上の特徴点の３次元位置情報を登録特徴点位置として記憶することを特徴とする請求項１４に記載の３次元物体モデル登録装置。
認識対象の画像中から物体の位置姿勢を認識する位置姿勢認識方法において、
前記物体の３次元形状と、当該物体表面の各位置の輝度を表すテクスチャの各要素を並べてベクトルとし、様々な照明条件の下でのテクスチャ群をベクトル群とし、前記ベクトル群の張る高次元線形空間の基底ベクトルとして算出された基底ベクトル群である基底テクスチャ群とから成る３次元物体モデルを生成し、前記３次元物体モデルの前記基底テクスチャ群に基づいて照明条件を再現した画像を生成する際に、当該再現画像と認識対象画像が合致するような姿勢を求めることにより、前記認識対象の画像中における前記物体の位置姿勢を認識することを特徴とする位置姿勢認識方法。
前記認識対象の画像中における前記物体の位置姿勢の候補である姿勢候補に基づいて、前記姿勢候補の位置姿勢に当該物体がある場合の画像の輝度値の照明条件による変動を表す照明変動空間を生成する照明変動空間生成ステップと、
前記姿勢候補の位置姿勢に当該物体がありかつ照明条件が前記認識対象の画像と同等である場合に得られる画像である比較画像を、前記３次元物体モデル及び前記照明変動空間に基づいて生成する比較画像生成ステップと、
複数の前記姿勢候補のそれぞれに基づいて生成された各前記比較画像を、前記認識対象の画像と比較して、前記認識対象の画像に最も近い前記比較画像を判定する姿勢選択ステップを備えることを特徴とする請求項１６に記載の位置姿勢認識方法。
前記物体の位置姿勢を示すパラメタの各値を、指定された範囲内において標本化することにより、複数の前記姿勢候補を生成する姿勢候補群決定ステップを備え、
生成された複数の前記姿勢候補の中から、前記認識対象の画像に最も近い前記比較画像を判定することを特徴とする請求項１７に記載の位置姿勢認識方法。
前記物体の位置姿勢を示す与えられたパラメタの各値を、指定された増減を行なうことにより、複数の前記姿勢候補を生成する姿勢候補群決定ステップを備え、
生成された複数の前記姿勢候補の中から、前記認識対象の画像に最も近い前記比較画像を判定することを特徴とする請求項１７に記載の位置姿勢認識方法。
認識対象の画像中の特徴点の位置を入力画像特徴点位置として抽出する特徴点位置抽出ステップを備え、
前記姿勢候補群決定ステップは、
前記物体の前記特徴点の位置の情報と、前記入力画像特徴点位置の情報とに基づいて、複数の前記姿勢候補を生成することを特徴とする請求項１８又は請求項１９に記載の位置姿勢認識方法。
前記特徴点位置抽出ステップにおいて抽出した前記入力画像特徴点位置の一部の特徴点を選択した組を、特徴点群として一つ又は複数生成し、
前記姿勢候補群決定ステップは、
前記物体の前記特徴点の位置の情報と、前記入力画像特徴点位置の当該特徴点組群において選択された前記特徴点とに基づいて、一つ又は複数の前記姿勢候補を生成することを特徴とする請求項２０に記載の位置姿勢認識方法。
前記特徴点位置抽出ステップにおいて抽出した前記入力画像特徴点位置のデータを、指定された増減を行なうことにより一つ又は複数の新たな前記入力画像特徴点位置を生成することを特徴とする請求項２０又は請求項２１に記載の位置姿勢認識方法。
前記姿勢候補群決定ステップは、
定められた前記入力画像特徴点位置に含まれる誤差の範囲である特徴点誤差範囲に基づいて、前記特徴点位置抽出ステップにおいて抽出した前記入力画像特徴点位置のデータを、前記特徴点誤差範囲内において標本化することにより、一つ又は複数の前記姿勢候補を生成することを特徴とする請求項１８から請求項２２のいずれか１つに記載の位置姿勢認識方法。
（１）前記姿勢選択ステップにおいて、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた姿勢候補を、最適姿勢候補と定める
（２）前記姿勢候補群決定ステップにより、前記最適姿勢候補を基に新たな複数の前記姿勢候補を生成する
（３）新たに生成された複数の前記姿勢候補を基に、前記姿勢選択ステップにより、前記認識対象の画像に最も近い前記比較画像を判定する
上記（１）、（２）、（３）の一連の処理を順次繰り返し実行し、かつ定められた時点において前記繰り返しを終了させる終了判定ステップを備え、
前記繰り返しの終了後、前記姿勢選択ステップが、その最終の処理において、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた前記姿勢候補を、前記認識対象の画像中における前記物体の位置姿勢の認識結果として出力することを特徴とする請求項１８から請求項２３のいずれか１つに記載の位置姿勢認識方法。
前記姿勢選択ステップが、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた前記姿勢候補を、前記認識対象の画像中における前記物体の位置姿勢の認識結果として出力することを特徴とする請求項１７から請求項２３のいずれか１つに記載の位置姿勢認識方法。
前記物体の３次元物体モデルの情報を登録する登録ステップを備えることを特徴とする請求項２６から請求項２５のいずれか１つに記載の位置姿勢認識方法。
前記登録ステップでは、
前記物体の３次元形状と、当該物体表面上の各位置の色又は反射率に相当する画像データを測定する３次元形状・反射率測定ステップと、
前記物体の表面各位置の、様々な照明条件の下での輝度値をあらわす照明変動テクスチャ群を生成する照明変動テクスチャ生成ステップと、
前記照明変動テクスチャ群全体を近似する基底テクスチャ群を計算する基底テクスチャ計算ステップを備え、
前記物体の３次元形状及び前記基底テクスチャ群を、当該物体の３次元物体モデルとして登録することを特徴とする請求項２６に記載の位置姿勢認識方法。
前記登録ステップでは、
前記物体表面上の特徴点の３次元位置情報を登録特徴点位置として記憶することを特徴とする請求項２７に記載の位置姿勢認識方法。
コンピュータを制御することにより、認識対象の画像中から物体の位置姿勢を認識する位置姿勢認識プログラムであって、
前記コンピュータに、
前記物体の３次元形状と、当該物体表面の各位置の輝度を表すテクスチャの各要素を並べてベクトルとし、様々な照明条件の下でのテクスチャ群をベクトル群とし、前記ベクトル群の張る高次元線形空間の基底ベクトルとして算出された基底ベクトル群である基底テクスチャ群とから成る３次元物体モデルを生成し、前記３次元物体モデルの前記基底テクスチャ群に基づいて照明条件を再現した画像を生成する際に、当該再現画像と認識対象画像が合致するような姿勢を求めることにより、前記認識対象の画像中における前記物体の位置姿勢を認識する処理を実行させることを特徴とする位置姿勢認識プログラム。
前記コンピュータに、
前記認識対象の画像中における前記物体の位置姿勢の候補である姿勢候補に基づいて、前記姿勢候補の位置姿勢に当該物体がある場合の画像の輝度値の照明条件による変動を表す照明変動空間を生成する照明変動空間生成処理と、
前記姿勢候補の位置姿勢に当該物体がありかつ照明条件が前記認識対象の画像と同等である場合に得られる画像である比較画像を、前記３次元物体モデル及び前記照明変動空間に基づいて生成する比較画像生成処理と、
複数の前記姿勢候補のそれぞれに基づいて生成された各前記比較画像を、前記認識対象の画像と比較して、前記認識対象の画像に最も近い前記比較画像を判定する姿勢選択処理を実行させることを特徴とする請求項２９に記載の位置姿勢認識プログラム。
前記コンピュータに、
前記物体の位置姿勢を示すパラメタの各値を、指定された範囲内において標本化することにより、複数の前記姿勢候補を生成する姿勢候補群決定処理と、
生成された複数の前記姿勢候補の中から、前記認識対象の画像に最も近い前記比較画像を判定する処理を実行させることを特徴とする請求項３０に記載の位置姿勢認識プログラム。
前記コンピュータに、
前記物体の位置姿勢を示す与えられたパラメタの各値を、指定された増減を行なうことにより、複数の前記姿勢候補を生成する姿勢候補群決定処理と、
生成された複数の前記姿勢候補の中から、前記認識対象の画像に最も近い前記比較画像を判定する処理を実行させることを特徴とする請求項３０に記載の位置姿勢認識プログラム。
前記コンピュータに、
認識対象の画像中の特徴点の位置を入力画像特徴点位置として抽出する特徴点位置抽出処理を実行させ、
前記姿勢候補群決定処理においては、
前記物体の前記特徴点の位置の情報と、前記入力画像特徴点位置の情報とに基づいて、複数の前記姿勢候補を生成する処理を実行させることを特徴とする請求項３１又は請求項３２に記載の位置姿勢認識プログラム。
前記コンピュータに、
前記特徴点位置抽出処理において抽出した前記入力画像特徴点位置の一部の特徴点を選択した組を、特徴点群として一つ又は複数生成する処理を実行させ、
前記姿勢候補群決定処理においては、
前記物体の前記特徴点の位置の情報と、前記入力画像特徴点位置の当該特徴点組群において選択された前記特徴点とに基づいて、一つ又は複数の前記姿勢候補を生成する処理を実行させることを特徴とする請求項３３に記載の位置姿勢認識プログラム。
前記コンピュータに、
前記特徴点位置抽出処理において抽出した前記入力画像特徴点位置のデータを、指定された増減を行なうことにより一つ又は複数の新たな前記入力画像特徴点位置を生成する処理を実行させることを特徴とする請求項３３又は請求項３４に記載の位置姿勢認識プログラム。
前記姿勢候補群決定処理は、
定められた前記入力画像特徴点位置に含まれる誤差の範囲である特徴点誤差範囲に基づいて、前記特徴点位置抽出処理において抽出した前記入力画像特徴点位置のデータを、前記特徴点誤差範囲内において標本化することにより、一つ又は複数の前記姿勢候補を生成することを特徴とする請求項３１から請求項３５のいずれか１つに記載の位置姿勢認識プログラム。
（１）前記姿勢選択処理において、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた姿勢候補を、最適姿勢候補と定める
（２）前記姿勢候補群決定処理により、前記最適姿勢候補を基に新たな複数の前記姿勢候補を生成する
（３）新たに生成された複数の前記姿勢候補を基に、前記姿勢選択処理により、前記認識対象の画像に最も近い前記比較画像を判定する
前記コンピュータに、
上記（１）、（２）、（３）の一連の処理を順次繰り返し実行し、かつ定められた時点において前記繰り返しを終了させる終了判定処理を実行させ、
前記繰り返しの終了後、前記姿勢選択処理の最終の処理において、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた前記姿勢候補を、前記認識対象の画像中における前記物体の位置姿勢の認識結果として出力する処理を実行させることを特徴とする請求項３１から請求項３６のいずれか１つに記載の位置姿勢認識プログラム。
前記姿勢選択処理が、前記認識対象の画像に最も近いと判定した前記比較画像の生成に用いた前記姿勢候補を、前記認識対象の画像中における前記物体の位置姿勢の認識結果として出力することを特徴とする請求項３０から請求項３６のいずれか１つに記載の位置姿勢認識プログラム。
前記コンピュータに、
前記物体の３次元物体モデルの情報を登録する登録処理を実行させることを特徴とする請求項２９から請求項３８のいずれか１つに記載の位置姿勢認識プログラム。
前記登録処理においては、
前記物体の３次元形状と、当該物体表面上の各位置の色又は反射率に相当する画像データを測定する３次元形状・反射率測定処理と、
前記物体の表面各位置の、様々な照明条件の下での輝度値をあらわす照明変動テクスチャ群を生成する照明変動テクスチャ生成処理と、
前記照明変動テクスチャ群全体を近似する基底テクスチャ群を計算する基底テクスチャ計算処理と、
前記物体の３次元形状及び前記基底テクスチャ群を、当該物体の３次元物体モデルとして登録する処理を実行させることを特徴とする請求項３９に記載の位置姿勢認識プログラム。
前記登録処理においては、
前記物体表面上の特徴点の３次元位置情報を登録特徴点位置として記憶する処理を実行させることを特徴とする請求項４０に記載の位置姿勢認識プログラム。