JP2014056464A - 物体認識装置、物体認識方法及び物体認識プログラム - Google Patents

物体認識装置、物体認識方法及び物体認識プログラム Download PDF

Info

Publication number
JP2014056464A
JP2014056464A JP2012201465A JP2012201465A JP2014056464A JP 2014056464 A JP2014056464 A JP 2014056464A JP 2012201465 A JP2012201465 A JP 2012201465A JP 2012201465 A JP2012201465 A JP 2012201465A JP 2014056464 A JP2014056464 A JP 2014056464A
Authority
JP
Japan
Prior art keywords
plane
template image
edge element
target model
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012201465A
Other languages
English (en)
Other versions
JP5937469B2 (ja
Inventor
Kimitoshi Yamazaki
公俊 山崎
Masayuki Inaba
雅幸 稲葉
Kiyohiro Sogen
清宏 宗玄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tokyo NUC
Toyota Motor Corp
Original Assignee
University of Tokyo NUC
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Tokyo NUC, Toyota Motor Corp filed Critical University of Tokyo NUC
Priority to JP2012201465A priority Critical patent/JP5937469B2/ja
Publication of JP2014056464A publication Critical patent/JP2014056464A/ja
Application granted granted Critical
Publication of JP5937469B2 publication Critical patent/JP5937469B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】物体認識の処理効率を向上させること。
【解決手段】物体認識装置は、対象物の距離点データを取得する距離点取得手段と、距離点データから対象物に含まれる平面を検出する平面検出手段と、距離点データから対象物に含まれるエッジ素を検出するエッジ素検出手段と、対象モデルに含まれる平面及びエッジ素と平面を所定角度ステップで回転させて生成した参照テンプレート画像群と対象モデルの基準座標に対する各平面の同次変換行列とを記憶する記憶手段と、対象モデルの中から検出された平面と略同一面積の平面を検出する類似面検出手段と、対象物の入力テンプレート画像を生成するテンプレート生成手段と、入力テンプレート画像の平面に対応する対象モデルの参照テンプレート画像の平面を検出し対応付けるマッチング手段と、対象モデル全体を対象物の座標系に再配置する再配置手段と、再配置された対象モデルを評価する評価手段と、を備える。
【選択図】図1

Description

本発明は、対象物とその対象モデルとのマッチングを行うことで物体認識を行う物体認識装置、物体認識方法及び物体認識プログラムに関するものである。
近年、家庭内のサービスロボットなどにおいて様々な対象物の認識が行われている。この場合、対象物とセンサとの相対位置関係は多様であり探索空間が膨大となることが想定され、より効率的に物体認識を行うことが要望される。
これに対し、例えば、対象物の距離データから対象物の平面部分とエッジを抽出し、抽出された複数の平面部分から任意の平面部分を選択してその方程式を算出し、算出した平面にエッジ部分を投影してエッジ画像を生成し、予めデータベースに記憶したモデルデータを順次回転させマッチングすることで対象物の位置姿勢を特定する物体検出装置が知られている(特許文献1参照)。
国際公開第2009/028489号
しかしながら、上記特許文献1に係る物体検出装置においては、上記マッチングを行う際にモデルデータ全体を回転させる必要があるため、処理効率が低下する虞がある。
本発明は、このような問題点を解決するためになされたものであり、物体認識の処理効率を向上させた物体認識装置、物体認識方法及び物体認識プログラムを提供することを主たる目的とする。
上記目的を達成するための本発明の一態様は、対象物の距離点データを取得する距離点取得手段と、前記距離点取得手段により取得された前記距離点データに基いて、前記対象物に含まれる平面を検出する平面検出手段と、前記距離点取得手段により取得された前記距離点データに基いて、前記対象物に含まれるエッジ素を検出するエッジ素検出手段と、対象モデルに含まれる平面及びエッジ素と、前記平面を所定角度ステップで回転させて生成した複数のテンプレート画像からなる参照テンプレート画像群と、対象モデルの基準座標に対する各平面の同次変換行列と、を記憶する記憶手段と、前記記憶手段に記憶された対象モデルに含まれる平面の中から、前記平面検出手段により検出された平面と略同一面積の平面を検出する類似面検出手段と、前記類似面検出手段により検出された平面と、前記エッジ素検出手段により検出されたエッジ素と、に基づいて、前記対象物の入力テンプレート画像を生成するテンプレート生成手段と、前記記憶手段に記憶された対象モデルの参照テンプレート画像群と、前記テンプレート生成手段により生成された前記対象物の入力テンプレート画像と、を比較して、該入力テンプレート画像の平面に対応する前記対象モデルの参照テンプレート画像の平面を検出し対応付けるマッチング手段と、前記記憶手段に記憶された各平面の同次変換行列を用いて、前記マッチング手段により検出された参照テンプレート画像の平面と、対応するテンプレート画像の平面と、の間の同次変換行列を算出し、該算出した同次変換行列に基いて前記対象モデル全体を対象物の座標系に再配置する再配置手段と、前記再配置手段により再配置された対象モデルを評価する評価手段と、を備えることを特徴とする物体認識装置である。
この一態様において、前記類似面検出手段により検出された平面に属する距離点群に対して主成分分析を行い、分散が最大となる方向の第1主成分ベクトルと、分散が2番目に大きくなる方向の第2主成分ベクトルと、を含む平面に近似する平面近似手段を更に備えていてもよい。
この一態様において、前記類似面検出手段により検出された平面と、該平面との距離が所定閾値以下となる前記エッジ素検出手段により検出されたエッジ素と、を対応付けるエッジ素対応付手段を更に備えていてもよい。
この一態様において、前記エッジ素対応付手段により各平面に対応付けされた各エッジ素を、前記平面近似手段により近似された平面へ正射影し、該正射影した平面上に各エッジ素を配置する正射影処理手段を更に備えていてもよい。
この一態様において、前記テンプレート生成手段は、前記正射影処理手段により各エッジ素が配置された各平面に対する前記テンプレート画像を2値化画像として生成してもよい。
この一態様において、前記テンプレート生成手段により生成されたテンプレート画像を、前記平面近似手段により近似された平面の法線周りに所定角度ステップで回転させた、複数の前記テンプレート画像からなる前記参照テンプレート画像群を生成する参照テンプレート群生成手段を更に備えていてもよい。
この一態様において、前記評価手段は、前記再配置手段により再配置された対象モデル全体の平面及びエッジ素と、前記平面検出手段により検出された平面及びエッジ素検出手段により検出されたエッジ素と、をマッチングして評価値を算出し、算出した評価値を所定閾値以上であるか否かを判定してもよい。
この一態様において、前記記憶手段は、前記平面検出手段により検出された前記対象モデルの平面と、前記エッジ素検出手段により検出された対象モデルのエッジ素と、前記参照テンプレート群生成手段により生成された対象モデルの参照テンプレート画像群と、対象モデルの基準座標に対する各平面の同次変換行列と、を記憶してもよい。
この一態様において、前記平面検出手段は、前記距離点取得手段により取得された前記距離点データにおいて、法線の類似度を評価することで同一面に属する距離点群を平面として検出してもよい。
この一態様において、前記エッジ素検出手段は、前記距離点取得手段により取得された前記距離点データにおいて、エッジ検出フィルタを用いてエッジと判定したピクセルに対応する距離点群をエッジ素として検出してもよい。
他方、上記目的を達成するための本発明の一態様は、対象物の距離点データを取得するステップと、前記取得された前記距離点データに基いて、前記対象物に含まれる平面を検出するステップと、前記取得された前記距離点データに基いて、前記対象物に含まれるエッジ素を検出するステップと、対象モデルに含まれる平面及びエッジ素と、前記平面を所定角度ステップで回転させて生成した複数のテンプレート画像からなる参照テンプレート画像群と、対象モデルの基準座標に対する各平面の同次変換行列と、を記憶するステップと、前記記憶された対象モデルに含まれる平面の中から、前記検出された平面と略同一面積の平面を検出するステップと、前記検出された略同一面積の平面と、前記検出されたエッジ素と、に基づいて、前記対象物の入力テンプレート画像を生成するステップと、前記記憶された対象モデルの参照テンプレート画像群と、前記生成された対象物の入力テンプレート画像と、を比較して、該入力テンプレート画像の平面に対応する前記対象モデルの参照テンプレート画像の平面を検出し対応付けるステップと、前記記憶手段に記憶された同次変換行列を用いて、前記検出された参照テンプレート画像の平面と、対応するテンプレート画像の平面と、の間の同次変換行列を算出し、該算出した同次変換行列に基いて前記対象モデル全体を対象物の座標系に再配置するステップと、前記再配置された対象モデルを評価するステップと、を含むことを特徴とする物体認識方法であってもよい。
この一態様において、対象物モデルの距離点データを取得するステップと、前記取得された前記距離点データに基いて、前記対象物モデルに含まれる平面を検出するステップと、前記取得された前記距離点データに基いて、前記対象物モデルに含まれるエッジ素を検出するステップと、前記検出された対象モデルの平面と、前記エッジ素検出手段により検出された対象モデルのエッジ素と、を対応付けるステップと、前記検出された対象モデルの各平面に属する距離点群に対して平面近似を行うステップと、前記各平面に対応付けされた各エッジ素を、前記近似された平面へ正射影し近似平面上に各エッジ素を配置するステップと、前記各エッジ素が配置された各平面に基いて、テンプレート画像を夫々生成するステップと、前記生成された各テンプレート画像を、前記近似された平面の法線周りに所定角度ステップで回転させた、複数のテンプレート画像からなる参照テンプレート画像群を生成するステップと、前記検出された各平面における基準座標系を夫々設定し、前記対象モデルにおけるモデル基準座標から見た各平面の同次変換行列を算出するステップと、前記検出された対象モデルに含まれる平面及びエッジ素と、前記生成した参照テンプレート画像群と、前記算出した同次変換行列と、を記憶するステップと、を更に含んでいてもよい。
また、上記目的を達成するための本発明の一態様は、取得された対象物の距離点データに基いて、前記対象物に含まれる平面を検出する処理と、前記取得された対象物の距離点データに基いて、前記対象物に含まれるエッジ素を検出する処理と、対象モデルに含まれる平面の中から、前記検出された平面と略同一面積の平面を検出する処理と、前記検出された略同一面積の平面と、前記検出されたエッジ素と、に基づいて、前記対象物の入力テンプレート画像を生成する処理と、対象モデルに含まれる平面を所定角度ステップで回転させて生成した複数のテンプレート画像からなる参照テンプレート画像群と、前記生成された対象物の入力テンプレート画像と、を比較して、該入力テンプレート画像の平面に対応する前記対象モデルの参照テンプレート画像の平面を検出し対応付ける処理と、前記検出された参照テンプレート画像の平面と、対応するテンプレート画像の平面と、の間の同次変換行列を算出し、該算出した同次変換行列を用いて前記対象モデル全体を対象物の座標系に再配置する処理と、前記再配置された対象モデルを評価する処理と、をコンピュータに実行させること特徴とする物体認識プログラムであってもよい。
本発明によれば、物体認識の処理効率を向上させた物体認識装置、物体認識方法及び物体認識プログラムを提供することができる。
本発明の一実施の形態に係る物体認識装置の概略的なシステム構成を示すブロック図である。 本発明の一実施の形態に係る物体認識装置による物体認識方法において対象モデルを認識するフローを示すフローチャートである。 エッジ素検出部により検出されるエッジ素の一例を示す図である。 テンプレート画像生成部により生成される入力テンプレート画像の一例を示す図である。 参照テンプレート群生成部により生成される参照テンプレート画像群の一例を示す図である。 同次変換行列算出部により設定されるモデル基準座標系の一例を示す図である。 本発明の一実施の形態に係る物体認識方法における対象物の認識方法のフローを示すフローチャートである。 ガウシアンフィルタ画像と入力テンプレート画像とラスタ走査の座標値との関係の一例を示す図である。 参照テンプレート画像の座標系から見た入力テンプレート画像の回転ずれ、および位置ずれを示す図である。 設定される座標系の一例を示す図である。
以下、図面を参照して本発明の実施の形態について説明する。
本発明の一実施の形態に係る物体認識装置は、例えば、特徴的な絵柄模様や特徴的な形状も無く無地で単純な直方体形状(冷蔵庫、タンス、棚など)物体でも高精度に認識することができるものである。
図1は、本発明の一実施の形態に係る物体認識装置の概略的なシステム構成を示すブロック図である。本実施の形態に係る物体認識装置1は、対象物及び対象モデルの距離点データを取得する距離画像センサ2と、対象物及び対象モデルを構成する平面を検出する平面検出部3と、対象物及び対象モデルを構成するエッジ素を検出するエッジ素検出部4と、エッジ素と平面とを対応付けるエッジ素対応付部5と、平面を近似する平面近似部6と、エッジ素を平面に正射影し配置する正射影処理部7と、対象物の入力テンプレート画像を生成するテンプレート画像生成部8と、参照テンプレート画像群を生成する参照テンプレート群生成部9と、平面の同次変換行列を算出する同次変換行列算出部10と、対象モデルの情報を記憶するモデル記憶部11と、対象モデルの平面と類似する平面を検出する類似面検出部12と、入力テンプレート画像と参照テンプレート画像群とのマッチングを行うテンプレートマッチング部13と、対象モデルの各平面及びエッジ素を再配置するモデル再配置部14と、マッチングの評価値を算出する面エッジ素マッチング部15と、マッチングの評価値を評価するマッチング評価部16と、を備えている。
物体認識装置1は、例えば、演算処理等と行うCPU(Central Processing Unit)、CPUによって実行される演算プログラム等が記憶されたROM(Read Only Memory)やRAM(Random Access Memory)からなるメモリ、外部と信号の入出力を行うインターフェイス部(I/F)、などからなるマイクロコンピュータを中心にして、ハードウェア構成されている。CPU、メモリ、及びインターフェイス部は、データバスなどを介して相互に接続されている。
ところで、従来の物体認識装置において、対象物のエッジ画像と対象モデルのテンプレート画像とのマッチングを行う場合、対象モデルのテンプレート画像全体を回転および位置移動させてマッチングを行っている。
これに対し、本実施の形態に係る物体認識装置1においては、対象モデルを複数の平面(平面は低曲率面を含む)及びエッジ素の集合として表現し、対象モデルにおける各平面の同次変換行列(位置関係)を予め算出し記憶する。そして、対象モデルの各平面と対象物の各平面とマッチングして類似する平面を検出し、算出した同次変換行列に基いて対象モデル内の平面及びエッジ素を再配置する。最後に再配置した対象モデル全体と対象物全体とをマッチングし評価を行う。これにより、物体認識の処理効率を向上させることができる。
物体認識装置1は、最初に、認識する対象物の対象モデルを予め認識し、その認識した対象モデルの情報をモデル記憶部11に予め記憶させる。そして、物体認識装置1は、モデル記憶部11に記憶された対象モデルの情報を用いて、実際の対象物を認識する。
図2は、本実施の形態に係る物体認識装置による物体認識方法において対象モデルを認識するフローを示すフローチャートである。
距離画像センサ2は、距離点取得手段の一具体例であり、対象モデルとなる家具などの対象物を計測し、対象モデルの参照データ(距離点群)を取得する(ステップS101)。距離画像センサ2としては、例えば、カメラなどを用いて1ピクセルのRGB(カラー)及び距離値が検出できる、Kinect(登録商標)などの距離センサが用いられているが、これに限らず、任意の距離センサを用いることが可能である。
平面検出部3は、平面検出手段の一具体例であり、距離画像センサ2により取得された参照データにおいて、同一平面に属する距離点群(3次元距離情報の集合)をラベリング(グルーピング)して対象モデルに含まれる平面を検出する(ステップS102)。
平面検出部3は、距離画像センサ2により取得された距離点群の中から、例えば、Region Growing手法に基いた(1)式を用いて法線の類似度を評価することで、同一面に属する距離点群に同一ラベルを付与する。ここで、Region Growing手法とは、例えば、ある点を始点とし、ある点と近傍点との関係が閾値以上の類似性を有する場合、それらの近傍点に対して、ある点と同一ラベルを付与して領域を拡張していく手法である。
なお、上記(1)式において、nはある点の法線ベクトルであり、nは近傍点の法線ベクトルであり、CThresholdは類似度の閾値である。
エッジ素検出部4は、エッジ素検出手段の一具体例であり、距離画像センサ2により取得された参照データにおいて、エッジ素を検出し、各エッジ素の3次元中心位置xと3次元方向ベクトルnとを夫々算出する(図3)(ステップS103)。
エッジ素検出部4は、距離画像センサ2により取得された参照データにおいて、例えば、Sobelフィルタ(空間1次微分を計算し輪郭を検出するフィルタ)などのエッジ検出フィルタを用いて、エッジ素を検出する。エッジ素検出部4は、エッジ検出フィルタによりエッジと判定したピクセルに対応する距離点群を、エッジ点群として検出する。
エッジ素検出部4は、例えば、エッジ点群を含む空間をボクセルで区切り、ボクセルで区切られたエッジ点群の平均をそのエッジ素の3次元中心位置xとして算出する。また、エッジ素検出部4は、ボクセルで区切られたエッジ点群に対して主成分分析を行い、第1主成分(分散が最大となる方向)を、そのエッジ素の3次元方向ベクトルnとして算出する。
エッジ素対応付部5は、エッジ素対応付手段の一具体例であり、平面検出部3により検出された平面と、その平面の内部もしくは周囲にありエッジ素検出部4により検出されたエッジ素と、を対応付ける(ステップS104)。エッジ素対応付部5は、例えば、ある平面に属する距離点群とあるエッジ素の3次元中心位置xとの距離が所定閾値以下の場合、その平面とエッジ素とを対応付ける。
平面近似部6は、平面近似手段の一具体例であり、平面検出部3により検出された各平面に属する距離点群に対して平面近似を行い、その近似した平面の平面方程式(ax+by+cz+d=0)を導出する(ステップS105)。
平面近似部6は、例えば、平面検出部3により検出された各平面に属する距離点群に対して主成分分析を行い、第1主成分ベクトル(距離点群の分散が最大となる方向のベクトル)と第2主成分ベクトル(距離点群の分散が2番目に大きい方向のベクトル)とを含む平面に近似する。
正射影処理部7は、正射影処理手段の一具体例であり、エッジ素対応付部5により各平面に対応付けされた各エッジ素を、平面近似部6により近似された平面へ正射影し、正射影した近似平面上に各エッジ素を配置する(ステップS106)。
テンプレート画像生成部8は、テンプレート生成手段の一具体例であり、正射影処理部7により各エッジ素が配置された各平面からテンプレート画像を夫々生成する(ステップS107)。テンプレート画像生成部8は、例えば、図4に示すように、椅子の背凭れ部の平面におけるエッジ素の部分を「1」とし、その他の部分を「0」とした2値化画像をテンプレート画像として生成する。
参照テンプレート群生成部9は、参照テンプレート群生成手段の一具体例であり、テンプレート画像生成部8により生成された各テンプレート画像を、平面近似部6により近似された平面の法線周りに所定角度ステップで回転させた、複数のテンプレート画像からなる参照テンプレート画像群を生成する(ステップS108)。参照テンプレート群生成部9は、例えば、図4に示すようなテンプレート画像を、その平面の法線軸周りに回転変換し、図5に示すような複数の参照テンプレート画像群を生成する。
同次変換行列算出部10は、平面検出部3により検出された各平面におけるモデル基準座標系を夫々設定する。そして、同次変換行列算出部10は、対象モデルにおけるモデル基準座標(対象モデルの原点)から見た各平面の相対的位置関係を示す同次変換行列を算出する(ステップS109)。ここで、例えば、各平面に属する距離点群の平均を各平面のモデル基準座標系の原点位置とする。また、各平面のモデル基準座標系の姿勢として、例えば、各平面の近似平面の法線方向がモデル基準座標系のZ軸方向と一致し、X軸及びY軸が成す平面が近似平面と一致している。
例えば、同次変換行列算出部10は、図6に示すように、対象モデルの椅子に対して、平面検出部3により検出された各平面(座面、背凭れ面)において、モデル基準座標系Cms1、Cms2を夫々設定し、モデル基準座標Cmoに対する各平面の同次変換行列を算出する。
モデル記憶部11は、記憶手段の一具体例であり、平面検出部3により検出された各平面と、エッジ素検出部4により検出された各エッジ素と、同次変換行列算出部10により算出された各平面の同次変換行列と、参照テンプレート群生成部9により生成された各平面の参照テンプレート画像群と、を対応付けて対象モデル毎に記憶する(ステップS110)。モデル記憶部11は、例えば、磁気ディスク装置、光ディスク装置、RAMなどで構成されている。
次に、物体認識装置1は、上述のようにしてモデル記憶部11に予め記憶した対象モデルの各平面、各エッジ素、各平面の同次変換行列、各平面の参照テンプレート画像群、を用いて実際の対象物の認識を行う。図7は、本実施の形態に係る物体認識方法における対象物の認識方法のフローを示すフローチャートである。
距離画像センサ2は、周辺環境を計測し、対象物の入力データ(距離点群)を取得する(ステップS201)。
平面検出部3は、Region Growing手法などを用いて、距離画像センサ2により取得された対象物の入力データにおいて、同一平面に属する距離点群をラベリングして対象物に含まれる平面を検出する(ステップS202)。
エッジ素検出部4は、距離画像センサ2により取得された対象物の入力データにおいて、エッジ検出フィルタを用いてエッジと判定したピクセルに対応する距離点群をエッジ素として検出する(ステップS203)。
類似面検出部12は、類似面検出手段の一具体例であり、モデル記憶部11に記憶された対象モデルに含まれる各平面と略同一面積の平面のみを、平面検出部3により検出された複数の平面の中から検出する(ステップS204)。このように類似する平面のみを検出することで、探索空間を低減でき処理速度を向上させることができる。類似面検出部12は、例えば、距離点群を含むバウンティングボックス(bounding box)と略同一面積の平面を類似平面として検出してもよい。
エッジ素対応付部5は、類似面検出部12により検出された平面と、その平面の内部もしくは周囲にありエッジ素検出部4により検出されたエッジ素と、を対応付ける(ステップS205)。
平面近似部6は、類似面検出部12により検出された各平面に属する距離点群に対して主成分分析を行い、その各平面を第1主成分ベクトルと第2主成分ベクトルとを含む平面に近似する(ステップS206)。
正射影処理部7は、エッジ素対応付部5により各平面に対応付けされた各エッジ素を、平面近似部6により近似された各平面へ正射影し、その正射影した各平面に各エッジ素を配置する(ステップS207)。
テンプレート画像生成部8は、正射影処理部7により各エッジ素が配置された各平面を含む入力テンプレート画像を夫々生成する(ステップS208)。
テンプレートマッチング部13は、マッチング手段の一具体例であり、モデル記憶部11に記憶された対象モデルの参照テンプレート画像群と、テンプレート画像生成部8により生成された入力テンプレート画像と、をマッチングして、対象物の入力テンプレート画像の平面に対応する対象モデルの参照テンプレート画像の平面を検出し対応付ける(ステップS209)。
テンプレートマッチング部13は、例えば、ガウシアンフィルタを含む下記(2)式に基いて、入力テンプレート画像に類似する参照テンプレート画像を検出する。なお、下記(2)式において、入力テンプレート画像をTとし、参照テンプレート画像群のうちk番目の参照プレート画像にガウシアンフィルタを適用した画像をrefとし、各画像の幅をMとし、各画像の高さをNとし、画素値をu=(u、v)とし、ラスタ走査の探索座標をu=(u、v)とする。
テンプレートマッチング部13は、上記(2)式において、評価値Eを最大化するk(何番目の参照テンプレート画像)と、ラスタ走査の探索座標uと、を下記(3)式に基いて算出する。
例えば、k番目のガウシアンフィルタ画像kGrefと、入力テンプレート画像Tと、ラスタ走査の座標値uと、の関係は、図8に示すようになっている。テンプレートマッチング部13は、評価値Eを最大化するk番目の参照テンプレート画像を、入力テンプレート画像に対応する参照テンプレート画像として検出する。
モデル再配置部14は、再配置手段の一具体例であり、テンプレートマッチング部13により検出された参照テンプレート画像の平面と対応する入力テンプレート画像の平面との間の同次変換行列を算出する。そして、モデル再配置部14は、算出した同次変換行列を用いて、全平面及びエッジ素を含む対象モデル全体を入力データの基準座標系(以下、入力データ座標系と称す)に再配置する(ステップS210)。
モデル再配置部14は、例えば、参照テンプレート画像の座標系から見た入力テンプレート画像の回転ずれθと、位置ずれudiffと、を算出する(図9)。また、モデル再配置部14は、算出した入力テンプレート画像の位置ずれudiffに対応するピクセル数で距離値を算出し、算出した距離値に基いて3次元空間の位置ずれpdiffを算出する。
ここで、各テンプレート画像を所定角度ステップで回転させて参照テンプレート画像群を生成しているため、モデル再配置部14は、入力テンプレート画像の回転ずれθを上記所定角度(刻み角度)に基いて離散的に算出することができる。なお、所定角度の離散化を無視できる位に細かくする方法も考えられるが、その分、参照テンプレート画像が多くなりマッチングに時間が掛かる。そこで、上記算出した入力データ座標系から見た対象モデルの同次変換行列を初期値として用い、例えば、ICP(Iterative Closest Point)法で詳細に位置合せを行う方法も考えられる。ICP法で詳細に位置合せを行うことで、参照テンプレート画像を生成するときの刻み角度を粗くすることができる。
モデル再配置部14は、モデル記憶部11に記憶された同次変換行列に上記算出した回転ずれθと位置ずれpdiffとを適用する。これにより、モデル再配置部14は、下記(4)式に示すように、入力データ座標系(ワールド座標系)から見た対象モデルのモデル基準座標系の同次変換行列(mo R、mo t)を算出できる。
なお、上記(4)式におけるmo、ms、w、isの座標系Cmo、Cms、C、Cisは、例えば図10に示すように設定される。モデル再配置部14は、モデル基準座標系の同次変換行列(mo R、mo t)を対象モデルに含まれる平面のモデル基準座標系と、エッジ素のモデル基準座標系とに適用することで、対象モデル全体を入力データ座標系に再配置することができる。
面エッジ素マッチング部15は、評価手段の一具体例であり、モデル再配置部14により再配置された対象モデル全体の平面及びエッジ素と、入力データの平面及びエッジ素とをマッチングして評価値を算出する(ステップS211)。面エッジ素マッチング部15は、例えば、下記(5)式を用いて、モデル再配置部14により再配置された対象モデル全体の平面及びエッジ素と、入力データの平面及びエッジ素とのマッチング評価値Cを算出する。
C=αCsurface+βCedgel (5)式
なお、上記(5)式において、Csurfaceは平面のマッチング評価値であり、Cedgelはエッジ素のマッチング評価値であり、α及びβは重み係数である。一般に、エッジ素の数は平面の数よりも多くなる為、平面のマッチング評価値Csurfaceの重み係数αをエッジ素のマッチング評価値Cedgelの重み係数βよりも大きく設定している。
上記(5)式におけるは平面のマッチング評価値Csurfaceおよびエッジ素のマッチング評価値Cedgelを、下記(6)式を用いて算出することができる。
なお、上記(6)式において、平面のマッチング評価値Csurfaceを算出する場合は、nを平面の法線、xを対象モデルの平面の中心座標、xinputを入力データ(対象物)の平面の中心座標、Xinputを入力データの平面の集合、nを対象モデルの平面の法線、ninputを入力データのdを最小にするxinputに対応する平面の法線とする。
一方、上記(6)式において、エッジ素のマッチング評価値Cedgelを算出する場合は、nをエッジ素検出部4により算出されたエッジ素の3次元方向ベクトル、xをエッジ素検出部4により算出された対象モデルのエッジ素の中心座標、xinputを入力データ(対象物)のエッジ素の中心座標、Xinputを入力データのエッジ素の集合、nを対象モデルのエッジ素の方向、ninputを入力データのdを最小にするxinputに対応するエッジ素の方向、とする。
マッチング評価部16は、評価手段の一具体例であり、面エッジ素マッチング部により算出されたマッチング評価値と所定閾値とを比較する。そして、マッチング評価部16は、算出されたマッチング評価値が所定閾値以上の場合、対象物に対する対象モデルを発見したと判定する。
以上、本実施の形態に係る物体認識装置1において、最初に入力データの平面及びエッジ素と対象モデルの平面及びエッジ素とのマッチングを行う。そして、そのマッチング結果を用いて入力データ全体と対象モデル全体とのマッチングを行う。これにより、例えば、従来、平面の外枠の強いエッジに起因した誤ったマッチングを防止することができる。したがって、物体の認識精度を向上し物体認識の処理効率を向上させることができる。
また、従来、ヒンジ部の開閉を認識するためにドアの開き角度に応じて複数のモデルテンプレートが必要となっていた。これに対し、本実施の形態に係る物体認識装置1によれば、ヒンジ部の拘束情報を対象モデルに含めることができ、モデル再配置の時に、例えばヒンジ角度(ドア開閉角度)を変化させてマッチングさせるなど、可動部の情報を有効に用いてマッチングを行うことも可能となる。したがって、探索空間を低減でき処理速度を向上させることができる。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
また、本発明は、例えば、図2及び図7に示す処理を、CPUにコンピュータプログラムを実行させることにより実現することも可能である。
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。
また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
1 物体認識装置
2 距離画像センサ
3 平面検出部
4 エッジ素検出部
5 エッジ素対応付部
6 平面近似部
7 正射影処理部
8 テンプレート画像生成部
9 参照テンプレート群生成部
10 同次変換行列算出部
11 モデル記憶部
12 類似面検出部
13 テンプレートマッチング部
14 モデル再配置部
15 面エッジ素マッチング部
16 マッチング評価部

Claims (13)

  1. 対象物の距離点データを取得する距離点取得手段と、
    前記距離点取得手段により取得された前記距離点データに基いて、前記対象物に含まれる平面を検出する平面検出手段と、
    前記距離点取得手段により取得された前記距離点データに基いて、前記対象物に含まれるエッジ素を検出するエッジ素検出手段と、
    対象モデルに含まれる平面及びエッジ素と、前記平面を所定角度ステップで回転させて生成した複数のテンプレート画像からなる参照テンプレート画像群と、対象モデルの基準座標に対する各平面の同次変換行列と、を記憶する記憶手段と、
    前記記憶手段に記憶された対象モデルに含まれる平面の中から、前記平面検出手段により検出された平面と略同一面積の平面を検出する類似面検出手段と、
    前記類似面検出手段により検出された平面と、前記エッジ素検出手段により検出されたエッジ素と、に基づいて、前記対象物の入力テンプレート画像を生成するテンプレート生成手段と、
    前記記憶手段に記憶された対象モデルの参照テンプレート画像群と、前記テンプレート生成手段により生成された前記対象物の入力テンプレート画像と、を比較して、該入力テンプレート画像の平面に対応する前記対象モデルの参照テンプレート画像の平面を検出し対応付けるマッチング手段と、
    前記記憶手段に記憶された各平面の同次変換行列を用いて、前記マッチング手段により検出された参照テンプレート画像の平面と、対応するテンプレート画像の平面と、の間の同次変換行列を算出し、該算出した同次変換行列に基いて前記対象モデル全体を対象物の座標系に再配置する再配置手段と、
    前記再配置手段により再配置された対象モデルを評価する評価手段と、
    を備えることを特徴とする物体認識装置。
  2. 請求項1記載の物体認識装置であって、
    前記類似面検出手段により検出された平面に属する距離点群に対して主成分分析を行い、分散が最大となる方向の第1主成分ベクトルと、分散が2番目に大きくなる方向の第2主成分ベクトルと、を含む平面に近似する平面近似手段を更に備えることを特徴とする物体認識装置。
  3. 請求項2記載の物体認識装置であって、
    前記類似面検出手段により検出された平面と、該平面との距離が所定閾値以下となる前記エッジ素検出手段により検出されたエッジ素と、を対応付けるエッジ素対応付手段を更に備えることを特徴とする物体認識装置。
  4. 請求項3記載の物体認識装置であって、
    前記エッジ素対応付手段により各平面に対応付けされた各エッジ素を、前記平面近似手段により近似された平面へ正射影し、該正射影した平面上に各エッジ素を配置する正射影処理手段を更に備えることを特徴とする物体認識装置。
  5. 請求項4記載の物体認識装置であって、
    前記テンプレート生成手段は、前記正射影処理手段により各エッジ素が配置された各平面に対する前記テンプレート画像を2値化画像として生成することを特徴する物体認識装置。
  6. 請求項2乃至5のうちいずれか1項記載の物体認識装置であって、
    前記テンプレート生成手段により生成されたテンプレート画像を、前記平面近似手段により近似された平面の法線周りに所定角度ステップで回転させた、複数の前記テンプレート画像からなる前記参照テンプレート画像群を生成する参照テンプレート群生成手段を更に備えることを特徴とする物体認識装置。
  7. 請求項1乃至6のうちいずれか1項記載の物体認識装置であって、
    前記評価手段は、前記再配置手段により再配置された対象モデル全体の平面及びエッジ素と、前記平面検出手段により検出された平面及びエッジ素検出手段により検出されたエッジ素と、をマッチングして評価値を算出し、算出した評価値を所定閾値以上であるか否かを判定することを特徴とする物体認識装置。
  8. 請求項1乃至7のうちいずれか1項記載の物体認識装置であって、
    前記記憶手段は、前記平面検出手段により検出された前記対象モデルの平面と、前記エッジ素検出手段により検出された対象モデルのエッジ素と、前記参照テンプレート群生成手段により生成された対象モデルの参照テンプレート画像群と、対象モデルの基準座標に対する各平面の同次変換行列と、を記憶することを特徴とする物体認識装置。
  9. 請求項1乃至8のうちいずれか1項記載の物体認識装置であって、
    前記平面検出手段は、前記距離点取得手段により取得された前記距離点データにおいて、法線の類似度を評価することで同一面に属する距離点群を平面として検出することを特徴とする物体認識装置。
  10. 請求項1乃至9のうちいずれか1項記載の物体認識装置であって、
    前記エッジ素検出手段は、前記距離点取得手段により取得された前記距離点データにおいて、エッジ検出フィルタを用いてエッジと判定したピクセルに対応する距離点群をエッジ素として検出することを特徴とする物体認識装置。
  11. 対象物の距離点データを取得するステップと、
    前記取得された前記距離点データに基いて、前記対象物に含まれる平面を検出するステップと、
    前記取得された前記距離点データに基いて、前記対象物に含まれるエッジ素を検出するステップと、
    対象モデルに含まれる平面及びエッジ素と、前記平面を所定角度ステップで回転させて生成した複数のテンプレート画像からなる参照テンプレート画像群と、対象モデルの基準座標に対する各平面の同次変換行列と、を記憶するステップと、
    前記記憶された対象モデルに含まれる平面の中から、前記検出された平面と略同一面積の平面を検出するステップと、
    前記検出された略同一面積の平面と、前記検出されたエッジ素と、に基づいて、前記対象物の入力テンプレート画像を生成するステップと、
    前記記憶された対象モデルの参照テンプレート画像群と、前記生成された対象物の入力テンプレート画像と、を比較して、該入力テンプレート画像の平面に対応する前記対象モデルの参照テンプレート画像の平面を検出し対応付けるステップと、
    前記記憶手段に記憶された同次変換行列を用いて、前記検出された参照テンプレート画像の平面と、対応するテンプレート画像の平面と、の間の同次変換行列を算出し、該算出した同次変換行列に基いて前記対象モデル全体を対象物の座標系に再配置するステップと、
    前記再配置された対象モデルを評価するステップと、
    を含むことを特徴とする物体認識方法。
  12. 請求項11記載の物体認識方法であって、
    対象物モデルの距離点データを取得するステップと、
    前記取得された前記距離点データに基いて、前記対象物モデルに含まれる平面を検出するステップと、
    前記取得された前記距離点データに基いて、前記対象物モデルに含まれるエッジ素を検出するステップと、
    前記検出された対象モデルの平面と、前記エッジ素検出手段により検出された対象モデルのエッジ素と、を対応付けるステップと、
    前記検出された対象モデルの各平面に属する距離点群に対して平面近似を行うステップと、
    前記各平面に対応付けされた各エッジ素を、前記近似された平面へ正射影し近似平面上に各エッジ素を配置するステップと、
    前記各エッジ素が配置された各平面に基いて、テンプレート画像を夫々生成するステップと、
    前記生成された各テンプレート画像を、前記近似された平面の法線周りに所定角度ステップで回転させた、複数のテンプレート画像からなる参照テンプレート画像群を生成するステップと、
    前記検出された各平面における基準座標系を夫々設定し、前記対象モデルにおけるモデル基準座標から見た各平面の同次変換行列を算出するステップと、
    前記検出された対象モデルに含まれる平面及びエッジ素と、前記生成した参照テンプレート画像群と、前記算出した同次変換行列と、を記憶するステップと、
    を更に含むことを特徴とする物体認識方法。
  13. 取得された対象物の距離点データに基いて、前記対象物に含まれる平面を検出する処理と、
    前記取得された対象物の距離点データに基いて、前記対象物に含まれるエッジ素を検出する処理と、
    対象モデルに含まれる平面の中から、前記検出された平面と略同一面積の平面を検出する処理と、
    前記検出された略同一面積の平面と、前記検出されたエッジ素と、に基づいて、前記対象物の入力テンプレート画像を生成する処理と、
    対象モデルに含まれる平面を所定角度ステップで回転させて生成した複数のテンプレート画像からなる参照テンプレート画像群と、前記生成された対象物の入力テンプレート画像と、を比較して、該入力テンプレート画像の平面に対応する前記対象モデルの参照テンプレート画像の平面を検出し対応付ける処理と、
    前記検出された参照テンプレート画像の平面と、対応するテンプレート画像の平面と、の間の同次変換行列を算出し、該算出した同次変換行列を用いて前記対象モデル全体を対象物の座標系に再配置する処理と、
    前記再配置された対象モデルを評価する処理と、
    をコンピュータに実行させること特徴とする物体認識プログラム。
JP2012201465A 2012-09-13 2012-09-13 物体認識装置、物体認識方法及び物体認識プログラム Active JP5937469B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012201465A JP5937469B2 (ja) 2012-09-13 2012-09-13 物体認識装置、物体認識方法及び物体認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012201465A JP5937469B2 (ja) 2012-09-13 2012-09-13 物体認識装置、物体認識方法及び物体認識プログラム

Publications (2)

Publication Number Publication Date
JP2014056464A true JP2014056464A (ja) 2014-03-27
JP5937469B2 JP5937469B2 (ja) 2016-06-22

Family

ID=50613718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012201465A Active JP5937469B2 (ja) 2012-09-13 2012-09-13 物体認識装置、物体認識方法及び物体認識プログラム

Country Status (1)

Country Link
JP (1) JP5937469B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016200858A (ja) * 2015-04-07 2016-12-01 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP2017049737A (ja) * 2015-09-01 2017-03-09 日立造船株式会社 立体構造物のエッジ決定方法および立体構造物の外面決定方法
JP2017172316A (ja) * 2016-03-16 2017-09-28 住友重機械工業株式会社 ショベル
CN111652292A (zh) * 2020-05-20 2020-09-11 贵州电网有限责任公司 一种基于ncs、ms的相似物体实时检测方法及系统
CN111881859A (zh) * 2020-07-31 2020-11-03 北京融链科技有限公司 模板生成方法和装置
CN111899352A (zh) * 2020-06-19 2020-11-06 广州明珞汽车装备有限公司 一种基于catia的零件模型处理方法、系统、设备及存储介质
JP2020197979A (ja) * 2019-06-04 2020-12-10 田中 成典 三次元点群データに基づく三次元モデル生成装置
CN112101411A (zh) * 2020-08-05 2020-12-18 复旦大学 一种基于模板匹配与分布特征的焊点识别与定位方法
CN114527880A (zh) * 2022-02-25 2022-05-24 歌尔科技有限公司 空间位置识别方法、装置、设备及存储介质
JP7502641B2 (ja) 2020-11-17 2024-06-19 株式会社デンソーウェーブ 認識システム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009028489A1 (ja) * 2007-08-30 2009-03-05 Kabushiki Kaisha Yaskawa Denki 物体検出方法と物体検出装置およびロボットシステム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009028489A1 (ja) * 2007-08-30 2009-03-05 Kabushiki Kaisha Yaskawa Denki 物体検出方法と物体検出装置およびロボットシステム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6016013995; 坪井 一菜: 'デプスカメラにより取得される部分形状テンプレートのマッチングによる3次元物体のリアルタイムトラッキン' 情報処理学会研究報告 2012(平成24)年度, 20120615, p.1〜6, 一般社団法人情報処理学会 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016200858A (ja) * 2015-04-07 2016-12-01 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP2017049737A (ja) * 2015-09-01 2017-03-09 日立造船株式会社 立体構造物のエッジ決定方法および立体構造物の外面決定方法
JP2017172316A (ja) * 2016-03-16 2017-09-28 住友重機械工業株式会社 ショベル
JP2020197979A (ja) * 2019-06-04 2020-12-10 田中 成典 三次元点群データに基づく三次元モデル生成装置
JP7424573B2 (ja) 2019-06-04 2024-01-30 成典 田中 三次元点群データに基づく三次元モデル生成装置
CN111652292A (zh) * 2020-05-20 2020-09-11 贵州电网有限责任公司 一种基于ncs、ms的相似物体实时检测方法及系统
CN111899352A (zh) * 2020-06-19 2020-11-06 广州明珞汽车装备有限公司 一种基于catia的零件模型处理方法、系统、设备及存储介质
CN111881859A (zh) * 2020-07-31 2020-11-03 北京融链科技有限公司 模板生成方法和装置
CN112101411A (zh) * 2020-08-05 2020-12-18 复旦大学 一种基于模板匹配与分布特征的焊点识别与定位方法
CN112101411B (zh) * 2020-08-05 2022-08-19 复旦大学 一种基于模板匹配与分布特征的焊点识别与定位方法
JP7502641B2 (ja) 2020-11-17 2024-06-19 株式会社デンソーウェーブ 認識システム
CN114527880A (zh) * 2022-02-25 2022-05-24 歌尔科技有限公司 空间位置识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP5937469B2 (ja) 2016-06-22

Similar Documents

Publication Publication Date Title
JP5937469B2 (ja) 物体認識装置、物体認識方法及び物体認識プログラム
CN107507167B (zh) 一种基于点云平面轮廓匹配的货物托盘检测方法及系统
CN104573614B (zh) 用于跟踪人脸的设备和方法
Aldoma et al. Multimodal cue integration through hypotheses verification for rgb-d object recognition and 6dof pose estimation
KR101798041B1 (ko) 3차원 물체 인식 및 자세 추정 장치 및 그 방법
Tazir et al. CICP: Cluster Iterative Closest Point for sparse–dense point cloud registration
JP2020119550A (ja) 拡張現実、仮想現実、ロボティクスに適したグラフィカルな基準マーカ識別
US9704248B2 (en) Position and orientation measuring apparatus, information processing apparatus and information processing method
US8571274B2 (en) Person-judging device, method, and program
JP2012226745A (ja) 奥行き画像内の物体を検出する方法およびシステム
US10380767B2 (en) System and method for automatic selection of 3D alignment algorithms in a vision system
CN106022210A (zh) 一种静脉轮廓三维点云匹配的身份识别方法及装置
JP6172432B2 (ja) 被写体識別装置、被写体識別方法および被写体識別プログラム
JP2012083855A (ja) 物体認識装置及び物体認識方法
CN108717527A (zh) 基于姿态先验的人脸对齐方法
CN109255801B (zh) 视频中三维物体边缘追踪的方法、装置、设备及存储介质
US20190310348A1 (en) Recording medium recording information processing program, information processing apparatus, and information processing method
US20120155748A1 (en) Apparatus and method for processing stereo image
Kang et al. An efficient planar feature fitting method using point cloud simplification and threshold-independent BaySAC
Zhu et al. Robust 3d morphable model fitting by sparse sift flow
Bormann et al. Fast and accurate normal estimation by efficient 3d edge detection
JP2014197342A (ja) 物体位置検出装置、物体位置検出方法、及びプログラム
Cociaş et al. Multiple-superquadrics based object surface estimation for grasping in service robotics
JP2015045919A (ja) 画像認識方法及びロボット
TW201701190A (zh) 街景影像之文字區域偵測系統及裝置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160419

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160512

R150 Certificate of patent or registration of utility model

Ref document number: 5937469

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250