JP7003455B2 - テンプレート作成装置、物体認識処理装置、テンプレート作成方法及びプログラム - Google Patents

テンプレート作成装置、物体認識処理装置、テンプレート作成方法及びプログラム Download PDF

Info

Publication number
JP7003455B2
JP7003455B2 JP2017117615A JP2017117615A JP7003455B2 JP 7003455 B2 JP7003455 B2 JP 7003455B2 JP 2017117615 A JP2017117615 A JP 2017117615A JP 2017117615 A JP2017117615 A JP 2017117615A JP 7003455 B2 JP7003455 B2 JP 7003455B2
Authority
JP
Japan
Prior art keywords
viewpoint
template
approximate sphere
approximate
viewpoint position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017117615A
Other languages
English (en)
Other versions
JP2019003407A (ja
Inventor
嘉典 小西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2017117615A priority Critical patent/JP7003455B2/ja
Priority to CN201810430347.8A priority patent/CN109145935B/zh
Priority to EP18171525.1A priority patent/EP3416097B1/en
Priority to US15/982,528 priority patent/US10706319B2/en
Publication of JP2019003407A publication Critical patent/JP2019003407A/ja
Application granted granted Critical
Publication of JP7003455B2 publication Critical patent/JP7003455B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Graphics (AREA)
  • Software Systems (AREA)
  • Geometry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Description

本発明は、テンプレートマッチングによる物体認識で用いられるテンプレートを作成する技術に関する。
物体認識画像から対象物体を検出する方法の一つとしてテンプレートマッチングがある。テンプレートマッチングは、検出対象となる物体のモデル(テンプレート)を予め用意しておき、入力画像とモデルのあいだの画像特徴の一致度を評価することで、入力画像に含まれる物体の2次元位置や姿勢を検出するというものである。テンプレートマッチングによる物体検出は、FA(Factory Automation)における検査やピッキング、ロボット・ビジョン、監視カメラなど多岐にわたる分野で利用されている。特に、近時のテンプレートマッチングにおいては、2次元計測を利用した対象物体の位置・姿勢の検出から、3次元計測を利用した対象物体の位置・姿勢の検出へ応用する技術に注目が集まっている。
3次元計測を利用したテンプレートマッチングとして、対象物体を様々な視点から見た姿勢ごとに個別のテンプレートを用意し、それらのテンプレートに対して総当たりでマッチングを行う探索処理方法が提案されているが、2次元計測を利用した場合に比べて用意しなければならないテンプレートの数が非常に多くなり、テンプレートを用いたマッチングのための処理時間の増大が問題となる。
このような問題への対応策として、粗密探索によるテンプレートマッチングが知られている。粗密探索は、テンプレートマッチングによる探索処理を高速化する技術の一つであり、解像度を段階的に異ならせた画像群(いわゆる、画像ピラミッド)を用意し、低解像度の画像で粗い探索を行い、探索結果をもとに探索範囲を絞り込み、絞り込んだ探索範囲について高解像度の画像でさらに探索を行う、という処理を繰り返し行い、最終的に元の解像度における対象物体の位置・姿勢を検出(物体の位置・姿勢を認識;以下、単に「物体認識」と略称)するといったものである。
ここで、図10は、画像ピラミッドを利用した粗密探索の基本概念を示す図である。
図10に示すように、粗密探索では、解像度を段階的に異ならせた第1層から第k層(k≧2以上の整数)のk枚の画像群(画像ピラミッド)を用いる。第1層の解像度が最も解像度が低く、第2層、…、第k層の順位で解像度が高くなる。図10は、k=3の例であり、第3層が元画像に対応しており、第2層、第1層の順で解像度が低くなっている。
粗密探索では、最初に最も低解像度の第1層画像に対してテンプレートマッチング(照合)による探索処理が行われ、第1層のなかでの物体の存在位置(正解候補)が検出される(図10の第1層画像内に示す検出位置参照)。次に、第2層に対する探索処理では、第1層での検出位置に対応する第2層画像が探索範囲として設定され、その探索範囲に対する探索処理が行われる(図10の第2層画像内に示す検出位置参照)。同様に、第2層での検出結果に基づき第3層画像での探索範囲が設定され、その探索範囲に対する探索処理が行われ、最終的に第3層(元画像)内での物体位置が特定される(図10の第3層画像内に示す検出位置参照)。
通常のテンプレートマッチングであれば多くのテンプレートとのマッチングが必要となるが、粗密探索では低解像度の画像(以下、「低解像度画像」ともいう。)から高解像度の画像(以下、「高解像度画像」ともいう。)に向けて探索範囲を段階的に絞りこんでいくことで、テンプレートのマッチング回数を削減でき、処理時間を短縮することができる。
近時においては、粗密探索によるテンプレートマッチングの処理を高速化するため、テンプレートを作成する際、階層ごとに(解像度ごとに)、様々なカメラの位置(視点)からみた2次元投影後の画像どうしを比較し、それら画像の類似度に基づいて、似たような見え方となる視点をグルーピングし、マッチングに用いるテンプレート数を間引くことでマッチング処理の高速化を図る技術が提案されている(例えば、特許文献1参照)。
欧州特許第2048599号明細書
上記方法を採用した場合、似たような見え方をする視点が近くに集中している箇所では、視点のグルーピングによって間引くことができるテンプレートの数が多くなり、テンプレートを用いたマッチング処理を高速化することができる一方、似たような見え方をする視点が近くに集中していない箇所では、視点のグルーピングによって間引くことができるテンプレートの数は少なく、テンプレートを用いたマッチング処理を高速化することは難しい。このように、上記方法では、似たような見え方をする視点が近くに集中している場所と、似たような見え方をする視点が近くに集中していない場所との間に、マッチング処理にかかる時間に大きなばらつきが生じる。
また、上記方法では、テンプレートを作成する際に、似たような見え方をする視点があるか否かを逐次判別する必要があり、さらに、似たような見え方をする視点が見つかった場合には、これらをまとめてグルーピングしていかなければならず、テンプレートの作成に多くの時間を費やす必要があった。
本発明は、以上説明した事情を鑑みてなされたものであり、テンプレートマッチングによる物体認識で用いられるテンプレートの作成時間を短縮する技術を提供することを目的とする。
本発明の一態様に係るテンプレート作成装置は、テンプレートマッチングに利用される物体認識用の階層的なテンプレートを作成するテンプレート作成装置であって、各頂点の間隔が略均等、かつ、各頂点が各視点位置として設定される近似球形状を複数作成する作成部であり、作成する近似球形状ごとに、各視点位置の間隔が異なっている視点位置作成部と、近似球形状ごとに、設定された各視点位置から見た対象物体に対応する複数のテンプレートを作成するテンプレート作成部とを具備する。
上記構成によれば、各頂点の間隔が略均等、かつ、各頂点が各視点位置として設定される複数の近似球形状を利用して、テンプレートを作成する。ここで、近似球形状の頂点に設定される各視点位置の間隔は、近似球形状ごとに異なっている。視点位置の間隔が広い近似球形状(別言すれば、設定される視点の数が少ない近似球形状)については、各視点位置から見た対象物体の2次元投影後の画像に基づき、各視点に対応する低解像度用のテンプレートを作成する。一方、視点位置の間隔が狭い近似球形状(別言すれば、設定される視点の数が多い近似球形状)については、各視点位置から見た対象物体の2次元投影後の画像に基づき、各視点に対応する高解像度用のテンプレートを作成する。かかる構成によれば、従来技術のごとく、テンプレートを作成する際に、似たような見え方をする視点があるか否かを逐次判別する処理や、似たような見え方をする視点をまとめてグルーピングする処理を実施する必要はなく、従来技術に比べてテンプレートの作成時間を短縮することができる。
本発明の他の態様に係るテンプレート作成方法は、テンプレートマッチングに利用される物体認識用の階層的なテンプレートを作成するテンプレート作成方法であって、各頂点の間隔が略均等、かつ、各頂点が各視点位置として設定される近似球形状を複数作成するステップであり、作成する近似球形状ごとに、各視点位置の間隔が異なっている視点位置作成ステップと、近似球形状ごとに、設定された各視点位置から見た対象物体に対応する複数のテンプレートを作成するテンプレート作成ステップとを含む。
本発明の他の態様に係るプログラムは、コンピュータに、テンプレートマッチングに利用される物体認識用の階層的なテンプレートを作成させるためのプログラムであって、コンピュータに、各頂点の間隔が略均等、かつ、各頂点が各視点位置として設定される近似球形状を複数作成するステップであり、作成する近似球形状ごとに、各視点位置の間隔が異なっている視点位置作成ステップと、近似球形状ごとに、設定された各視点位置から見た対象物体に対応する複数のテンプレートを作成するテンプレート作成ステップとを実行させる。
本発明によれば、テンプレートマッチングによる物体認識で用いられるテンプレートの作成時間を短縮する技術を提供することが可能となる。
物体認識装置の全体構成を示す図である。 物体認識装置のハードウェア構成を示す図である。 画像処理装置の構成を示す図である。 視点位置の作成原理を示す図である。 近似球形状間の頂点の関連性を示す図である。 視点位置作成処理を示すフローチャートである。 テンプレート作成処理を示すフローチャートである。 物体認識処理を示すフローチャートである。 従来手法を用いた場合のテンプレートマッチングの処理時間を説明するための図である。 本願手法を用いた場合のテンプレートマッチングの処理時間を説明するための図である。 画像ピラミッドを利用した粗密探索の基本概念を示す図である。
以下、図面を参照して本発明の実施形態について詳細に説明する。なお、同一の要素には同一の符号を付し、重複する説明を省略する。また、以下の実施の形態は、本発明を説明するための例示であり、本発明をその実施の形態のみに限定する趣旨ではない。さらに、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。
A.本実施形態
A-1.(物体認識装置の全体構成)
図1を参照して、本発明の実施形態に係る物体認識装置の全体構成及び適用場面について説明する。
物体認識装置1は、ピッキングシステムを備えた生産ラインなどに設置され、カメラ11から取り込まれた画像を用いて、テンプレートマッチングによりトレイ3上の物体2の位置・姿勢を認識(3次元の物体認識)するシステムである。トレイ3上には、認識対象の物体(以下、「対象物体」ともいう。)2がバラ積みされている。物体認識装置1は、カメラ11から所定の時間間隔で画像を取り込み、画像処理装置10によって画像に含まれる各対象物体2の位置及び姿勢を認識する処理を実行し、その結果を例えばPLC(プログラマブルロジックコントローラ)4やディスプレイ12などに出力する。物体認識装置1の出力である認識結果は、例えば、ピッキング・ロボットの制御、加工装置や印字装置の制御、対象物体2の検査や計測などに利用される。
A-2.(ハードウェア構成)
図2を参照して、物体認識装置1のハードウェア構成を説明する。物体認識装置1は、概して、カメラ11と画像処理装置10から構成される。
カメラ11は、対象物体2のデジタル画像を画像処理装置10に取り込むための撮像デバイスであり、例えばCMOS(Complementary Metal-Oxide-Semiconductor)カメラやCCD(Charge-Coupled Device)カメラを好適に用いることができる。解像度、カラー/モノクロ、静止画像/動画、階調、データ形式などの入力画像の形式は任意であり、対象物体2の種類やセンシングの目的に合わせて適宜選択することができる。X線画像やサーモ画像など、可視光像以外の特殊な画像を物体認識や検査に利用する場合には、その画像に合わせたカメラを用いてもよい。
画像処理装置10は、CPU(中央演算処理装置)10aと、ワークメモリとして用いられるメインメモリ10bと、固定記憶部であるハードディスク10eと、カメラインターフェイス10cと、入力インターフェイス10fと、表示コントローラ10gと、PLCインターフェイス10hと、通信インターフェイス10iと、データリーダ/ライタ10jとを含む。これらの各部は、バス10kを介して、互いにデータ通信可能に接続されている。
カメラインターフェイス10cは、CPU10aとカメラ11との間のデータ伝送を仲介する部分であり、カメラ11からの画像データを一時的に蓄積するための画像バッファ10dを有していてもよい。入力インターフェイス10fは、CPU10aと入力部との間のデータ伝送を仲介する。入力部には、マウス13、キーボード、タッチパネル、ジョグコントローラなどが含まれていてもよい。表示コントローラ10gは、液晶モニタなどのディスプレイ12に接続され、当該ディスプレイでの表示を制御する。PLCインターフェイス10hは、CPU10aとPLC4との間のデータ伝送を仲介する。通信インターフェイス10iは、CPU10aとコンソール、あるいはパーソナルコンピュータやサーバ装置などとの間のデータ伝送を仲介する。データリーダ/ライタ10jは、CPU10aと記録媒体であるメモリカード14との間のデータ伝送を仲介する。
画像処理装置10は、汎用的なアーキテクチャを有するコンピュータで構成可能であり、CPU10aが、ハードディスク10e又はメモリカード14に格納されたプログラムを読み込むことで、各種処理を実行する。このようなプログラムは、メモリカード14や光ディスクなどのコンピュータ読取可能な記録媒体に格納された状態で流通するか、インターネットなどを通じて提供される。なお、本実施形態に係るプログラムは単体のアプリケーションプログラムとして提供されてもよいし、他のプログラムの一部に組み込まれるモジュールとして提供されてもよい。また、そのプログラムによって実行される処理の一部又は全部をASICなどの専用回路で実行してもよい。
A-3.(画像処理装置の構成)
図3に、画像処理装置10の構成を示す。画像処理装置10は、CPU10aが、ハードディスク10e等に格納されたプログラムを読み込み、実行することで、視点位置作成装置110、テンプレート作成装置120、物体認識処理部130として動作する。
視点位置作成装置110は、テンプレート作成に必要な全ての視点位置を作成(設定)し、視点位置関連パラメータ設定部111、視点位置作成部112、最適視点位置作成部113、視点位置情報出力部114を備える。
テンプレート作成装置120は、物体認識処理で利用するテンプレートを作成し、視点位置情報取得部121、3次元CADデータ取得部122、2次元投影画像作成部123、特徴抽出部124、テンプレート作成部125、テンプレート情報出力部126を備える。
物体認識処理装置130は、カメラ11から取り込まれた画像に対し、テンプレート作成装置120によって作成・記憶されたテンプレートを用いてテンプレートマッチングを実行することで、画像中の物体を認識する。物体認識処理装置130は、テンプレート情報取得部131、画像取得部132、画像ピラミッド生成部133、特徴抽出部134、テンプレートマッチング部135、認識結果出力部136を備える。視点位置作成装置110、テンプレート作成装置120及び物体認識処理装置130の詳細は、後述する。
A-4.(視点位置の作成原理)
A-4-1.(近似球形状の利用)
図4は、本実施形態に係る視点位置の作成原理を示す図である。
本実施形態では、視点間の距離が略均等となるように、多面体で構成された近似球形状AGの頂点を視点位置VPとして利用する(図4に示す近似球形状AG1参照)。そして、解像度の低いテンプレートを作成する場合から、解像度の高いテンプレートを作成する場合へと、作成するテンプレートが変化するのに合わせて視点の数(すなわち頂点数)が多くなる近似球形状AGを利用する。具体的には、最も解像度の低いテンプレート(以下、「第1テンプレート」ともいう。)の作成時に利用する近似球形状AGとして正20面体AG1(頂点数;12)を用い、第1テンプレートよりも解像度の高いテンプレート(以下、「第2テンプレート」ともいう。)の作成時に利用する近似球形状AGとして80面体AG2(頂点数;42)を用いる。同様に、第2テンプレートよりも解像度の高いテンプレート(以下、「第3テンプレート」ともいう。)の作成時に利用する近似球形状AGとして320面体AG3(頂点数;162)を用い、最も解像度の高いテンプレート(以下、「第4テンプレート」ともいう。)の作成時に利用する近似球形状AGとして1280面体AG4(頂点数;642)を用いる。なお、図4ではテンプレートの階層数が「4」である場合を例示するが、いかなる階層数とするかは任意に設定・変更可能である。また、近似球形状AGを求める方法として、オルタネート分割法やトリアコン分割法を用いたジオデシックドーム等が知られているが、本発明は複数の頂点を有する近似球形状であればよく、ジオデシックドームに限定する趣旨でないのはもちろんである。
ここで、各近似球形状AG1とAG2の間、各近似球形状AG2とAG3の間、各近似球形状AG3とAG4の間の頂点の関連性に言及すると、解像度が低い方のテンプレートに対応する近似球形状AGの各視点(以下、「親視点」ともいう。)に関連づけられる、解像度が高い方のテンプレートに対応する近似球形状AGの各視点(以下、「子視点」ともいう。)の数は、3または4個で略均等にできる。さらに、各近似球形状AGにおける親視点と、親視点に関連づけられる子視点との間の距離が近いものから3または4個選択して、親視点に対する子視点を設定することで、各視点からの見え方の変化は均等になりやすい。このように、近似球形状AGの各頂点を視点位置として利用する本実施形態では、従来技術のごとく、テンプレートを作成する際に、似たような見え方をする視点をまとめてグルーピングするといった処理等を行う必要がないため、テンプレートの作成時間を短縮することができる。
A-4-2.(近似球形状の角度の最適化)
図5は、近似球形状AG1と近似球形状AG2との間の頂点の関連性を示す図であり、αは回転させなかった場合の近似球形状AG2を示し、βは所定量だけ回転させた場合の近似球形状AG2を示す。なお、以下の説明では球の半径を「1」と仮定する。
αに示すように、近似球形状AG2を回転させなかった場合における、近似球形状AG1の親視点と近似球形状AG2の子視点との最大距離Lmaxは、「0.739」であるのに対し、βに示すように、近似球形状AG2を所定量(具体的には、X軸周り33度、Y軸周り29度、Z軸周り15度)だけ回転させたときの近似球形状AG1の親視点と近似球形状AG2の子視点との最大距離Lmaxは、「0.712」となる。
ここで、マッチング処理の対象物体の見え方の変化(相違)は、親視点から子視点までの距離が短いほど小さくなる。対象物体の見え方の変化が小さければ、粗密探索における高解像度テンプレートを用いたマッチング処理と低解像度テンプレートを用いたマッチング処理との間のギャップは小さくなり、認識精度の低下を抑制することができる。
以上を踏まえ、本実施形態では、まず、親視点に関連づけられる複数の子視点のうち、親視点からの距離が最も長くなる子視点について、親視点との間の距離(すなわち最大距離)Lmaxを求める。そして、親視点と関連づけられる子視点の最大距離Lmaxが最小となるように、さらには、親視点と関連づけられる子視点の数が略均等(本実施形態では3または4個)となるように、近似球形状AG2の回転角度を求め、求めた回転角度で近似球形状AG2を回転させる。このような回転を行うことで、親視点から関連づけられる各子視点までの距離は、回転させない場合と比較して短くなるため、マッチング処理の対象物体の見え方の変化は小さくなり、認識精度の低下を抑制することができる。なお、親視点と関連づけられる子視点の最大距離Lmaxを最小とする近似球形状AGの回転角度を求める代わりに、親視点と関連づけられる子視点の平均距離Laveを最小とする近似球形状AGの回転角度を求めるようにしてもよい。
A-5.(視点位置作成処理)
以下、図6のフローに従って、視点位置作成装置110によって実行される視点位置作成処理を説明する。
視点位置関連パラメータ設定部111は、視点位置を決定するために、いかなる近似球形状AGを利用するかを決定(設定)する(ステップS111)。一例として、ユーザが操作ボタン等を適宜操作することで、図4に示す正20面体AG1、80面体AG2などを利用する複数の近似球形状AGとして設定する。もっとも、利用する近似球形状AGの設定方法は、これに限る趣旨ではない。例えば、視点位置関連パラメータ設定部111は、入力される対象物体の大きさや形状に関する情報(対象物体情報)に基づき、対象物体に適した視点位置間隔などを自動計算し、求めた視点位置間隔などから利用すべき複数の近似球形状AGを設定してもよい。
視点位置作成部112は、視点位置関連パラメータ設定部111によって設定された複数の近似球形状AGに対し、各視点位置(すなわち各頂点)を作成する(ステップS112)。例えば、視点位置関連パラメータ設定部111によって、図4に示す正20面体AG1、80面体AG2などが設定されている場合には、視点位置作成部112は、正20面体AG1、80面体AG2などの各頂点に、各視点位置を作成(設定)する。視点位置作成部112は、視点位置間隔の広い近似球形状AG(例えば正20面体AG1)から視点位置間隔の狭い近似球形状AG(例えば1280面体AG4)まで各視点位置を作成すると、各近似球形状AGの視点位置を最適視点位置作成部113に出力する。
最適視点位置作成部113は、親視点に関連づけられる子視点の数が略均等、かつ、親視点に関連づけられる子視点の最大距離Lmax(又は親視点と関連づけられる子視点の平均距離Lave)が最小となる回転角度(以下、「最適回転角度」と略称する。)を算出する(ステップS113)。一例として、X軸、Y軸、Z軸のそれぞれの軸周りに所定角a、b、cだけ回転させた場合の上記最大距離Lmaxを求める。そして、最適視点位置作成部113は、各軸周りの所定角a、b、cの値を順次変化させ、そのときに得られる上記最大距離Lmaxから、所定角a、b、cと最大距離Lmaxとの相関を求め、上記最大距離Lmaxが最も小さくなるときの所定角a、b、cを、最適回転角度として算出する。その後、最適視点位置作成部113は、視点位置作成部112から出力される各近似球形状AGの視点位置に対し、算出した最適回転角度で回転させる処理を施すことで最適視点位置を算出する(ステップS114)。最適視点位置作成部113は、算出した最適視点位置を視点位置情報出力部114に出力する。
視点位置情報出力部114は、最適視点位置作成部113から供給される複数の最適視点位置について、最適視点位置をあらわす視点位置情報を生成し(ステップS115)、テンプレート作成装置120に出力する。
A-6.(テンプレート作成処理)
次に、図7のフローに従って、テンプレート作成装置(テンプレート作成部)120によって実行されるテンプレート作成処理を説明する。
視点位置情報取得部121は、視点位置作成装置110の視点位置情報出力部114から出力される各最適視点位置をあらわす視点位置情報を取得する(ステップ121)。
3次元CADデータ取得部122は、対象物体の3次元形状を表す3次元データを取得する(ステップS122)。3次元CADデータ取得部122は、対象物体を立体図形として認識可能な任意の3次元データを取得することができ、本実施形態では、3次元CADデータを取得するものとする。3次元CADデータ取得部122は、外部の3次元CADサーバ等から3次元CADデータを取得することもできるし、メモリ(図示略)から3次元CADデータを取得することもできる。
2次元投影画像作成部123は、視点位置情報取得部121が取得した視点位置情報及び3次元CADデータ取得部122が取得した3次元データを用いて、各最適視点から見た対象物体の投影画像(すなわち2D画像)を生成する(ステップS123)。
特徴抽出部124は、最適視点ごとの投影画像から複数の特徴点の特徴量を抽出する(ステップS124)。特徴量としては、例えば、ピクセル値(輝度)、輝度勾配方向、量子化勾配方向、Hog(Histograms of Oriented Gradients)、HAAR-Like、SIFT(Scale-Invariant Feature Transform)などを用いることができる。輝度勾配方向とは、特徴点を中心とする局所領域での輝度の勾配の方向(角度)を連続値で表すものであり、量子化勾配方向とは、特徴点を中心とする局所領域での輝度の勾配の方向を離散値で表す(例えば、8方向を0~7の1バイトの情報で保持する)ものである。
テンプレート作成部125は、特徴抽出部124によって抽出された最適視点ごとの投影画像の特徴量に基づき、複数のテンプレートを作成する(ステップS125)。ここで、テンプレートは、対象物体の画像特徴を表すデータであり、テンプレートには任意の形式を用いることができる。例えば、テンプレートとして投影画像中の特徴点の特徴量を記述した配列形式を用いることができる。
前述したように、本実施形態では、解像度が段階的に異なる各層の画像(画像ピラミッド)を用いた粗密探索を行うため、各層ごとのテンプレートを作成する必要がある。よって、テンプレート作成部125は、各層ごとに解像度が異なる複数のテンプレートを作成する。すなわち、テンプレート作成部125は、各層ごとに、対応する近似球形状AG(例えば正20面体)の頂点として設定されている各最適視点から見た各投影画像を用いて複数のテンプレートを作成する。
テンプレート情報出力部126は、最適視点ごとに、テンプレート作成部125が作成したテンプレートをテンプレート情報として物体認識処理装置130に出力する(ステップS126)。
A-7.(物体認識処理)
次に、図8のフローに従って、物体認識処理装置130によって実行される物体認識処理を説明する。
まず、テンプレート情報取得部131は、テンプレート作成装置120のテンプレート情報出力部126から出力されるテンプレート情報を取得し、テンプレートマッチング部135に供給する(ステップS131)。
画像取得部132は、カメラ11から入力画像を取り込む(ステップS132)。この画像には、任意の姿勢の対象物体が写っているものとする。
画像ピラミッド生成部133は、取り込まれた入力画像(元画像)から低解像度画像を生成し、画像ピラミッドを生成する(ステップS133)。例えば、第1層画像として160画素×120画素、第2層画像として320画素×240画素等で構成される画像ピラミッドを構成することができる。
特徴抽出部134は、画像ピラミッドを構成する各層画像に対し特徴抽出処理を施す(ステップS134)。抽出される特徴量は、テンプレートのものと同種の特徴量であり、例えば量子化勾配方向などが挙げられる。最上層である第1層画像(もっとも低解像度の画像)に対する特徴抽出処理の結果として、第1層画像と同じ解像度を有し、第1層画像の各画素位置で抽出された特徴量データを画素値としてもつ画像(以下、「第1層特徴画像」ともいう。)が得られる。同様に、第2層画像に対する特徴抽出処理の結果として第2層特徴画像が得られる。
テンプレートマッチング部135は、テンプレート情報取得部131から供給される最適視点ごとのテンプレート情報と、各テンプレート情報に対応する特徴抽出部134が算出した各特徴量とを用いてテンプレートマッチングを行う(ステップS135)。
詳述すると、テンプレートマッチング部135は、まず、第1層特徴画像と第1層用の最適視点ごとのテンプレートを用いてマッチング処理を行う。テンプレートマッチング部135は、第1層用の最適視点ごとのテンプレートを用いたマッチング処理の結果、正解候補となるテンプレートを検出すると、検出結果に基づき、第2層特徴画像の探索範囲を設定し、第2層特徴画像と第2層用の最適視点ごとのテンプレートを用いてマッチング処理を行う。第3層画像、第4層画像が存在する場合には、これらの層画像に対しても同様な処理が行われる。例えば、第3層画像が存在する場合、テンプレートマッチング部135は、第2層画像でのマッチング処理の結果に基づき、第3層特徴画像の探索範囲を設定し、第3層特徴画像と第3層用の最適視点ごとのテンプレートを用いてマッチング処理を行う。このような処理が行われる結果、最下層(この場合は第4層)における物体の存在位置を認識することが可能となる。
テンプレートマッチング部135は、対象物体の存在位置や姿勢などを認識すると、認識結果を示す認識情報を認識結果出力部136に出力する。認識結果出力部136は、テンプレートマッチング部135から供給される認識情報を、外部装置や液晶パネルなどに出力する(ステップS136)。認識情報は、例えば、対象物体の検査・計測や、ピッキング・ロボットの制御などに利用される。
ここで、図9Aは、従来手法を用いたテンプレートマッチングの処理時間を説明するための図であり、図9Bは、本願手法を用いたテンプレートマッチングの処理時間を説明するための図である。なお、図9A及び図9Bでは、第1層の解像度が最も低く、第2層は第1層の4倍、さらに、第3層は第2層の4倍の解像度を有しているものとする。また、各層用のテンプレートに含まれる特徴点の数は、上位層から下位層に進むにつれ4倍ずつ増えるため、テンプレートマッチングの処理時間も、上位層から下位層に進むにつれ4倍ずつ長くなるものと仮定する。すなわち、第1層での1テンプレートあたりの処理時間を「1」とすると、第2層での1テンプレートあたりの処理時間は「4」、第3層での1テンプレートあたりの処理時間は「16」となる。
従来手法は、テンプレート同士の類似度を求めて視点をグルーピングし、マッチング処理に用いるテンプレートの数を減らすことで処理の高速化を図っている。テンプレート同士の類似度を求めて視点をグルーピングする方法では、例えば図9Aに示すように、第2層においてテンプレート数が「3」の探索範囲に絞り込まれたとしても、第3層ではテンプレート数が「1」の探索範囲3A-1、テンプレート数が「5」の探索範囲3A-2、テンプレート数が「10」の探索範囲3A-3のそれぞれの範囲でテンプレートマッチングを行う必要がある。第3層での1テンプレートあたりの処理時間は「16」であるから、各探索範囲3A-1~3A-3の処理時間は、それぞれ16(=16×1)、80(=16×5)、160(=16×10)とあらわすことができる。このため、各探索範囲3A-1~3A-3でのトータルの処理時間(すなわち、第1層から第3層までのトータルの処理時間)は、それぞれ29(=16+12+1)、93(=80+12+1)、173(=160+12+1)となる。このように、従来手法を用いた場合には、テンプレートのマッチング(すなわち対象物体の位置や姿勢の認識)に要する処理時間は大きくばらつく。
一方、本願手法では、親視点に関連づけられる(すなわち、グルーピングされる)子視点の数が略3または4個で均等、かつ、各視点間の距離も略一定(等間隔)となるように各最適視点位置が定められ、最適視点ごとに作成されたテンプレートを用いてマッチング処理が行われる。したがって、図9Bに示すように、第2層においてテンプレート数が「4」の探索範囲に絞り込まれると、第3層ではテンプレート数がすべて同一(図9Bでは「4」)の探索範囲3B-1~3B-4でテンプレートマッチングが行われることになる。第3層での1テンプレートあたりの処理時間は「16」であるから、各探索範囲3B-1~3B-4の処理時間は、いずれも64(=16×4)とあらわすことができ、各探索範囲3A-1~3A-3のトータルの処理時間は、いずれも81(=64+16+1)となる。このように、本願手法を用いた場合には、テンプレートのマッチングに要する処理時間は略均等となる。
以上説明したように、本実施形態によれば、近似球形状AGの各頂点を視点位置として各解像度のテンプレートを作成する。このため、従来技術のごとく、テンプレートを作成する際に、各視点からの見え方の類似度を判定し、視点をグルーピングするといった処理を行う必要がなく、テンプレートの作成時間を短縮することができる。
また、本実施形態によれば、親視点に関連づけられる子視点の数は、3または4個で略均等になり、かつ、各視点間の距離も略一定となる。各探索範囲に割り当てられる視点の数は略均等になるため、各探索範囲でのテンプレートのマッチングに要する処理時間も略均等となる。
さらに、本実施形態によれば、親視点と関連づけられる子視点の最大距離Lmax(又は親視点と関連づけられる子視点fの平均距離Lave)が最小となるように、さらには、親視点と関連づけられる子視点の数が略均等となるように、近似球形状AG2の回転角度を求め、求めた回転角度で近似球形状AG2を回転させる。このような回転を行うことで、親視点から関連づけられる各子視点までの距離は、回転させない場合と比較して短くなるため、マッチング処理の対象物体の見え方の変化は小さくなり、認識精度の低下を抑制することができる。
B.その他
上記実施形態では、入力される対象物体の大きさや形状に関する対象物体情報に基づき、対象物体に適した視点位置間隔などを自動計算し、求めた視点位置間隔などから利用すべき複数の近似球形状AGを設定したが、対象物体にかかわらず、常に同一の近似球形状AGのセット(例えば、図4に示す近似球形状AG1~AG4)を利用してもよい。
本明細書において、「部」とは、単に物理的構成を意味するものではなく、その「部」が実行する処理をソフトウェアによって実現する場合も含む。また、1つの「部」や装置が実行する処理を2つ以上の物理的構成や装置により実現されても、2つ以上の「部」や装置が実行する処理を1つの物理的手段や装置により実現されてもよい。
本明細書において上述した各処理におけるステップは、処理内容に矛盾を生じない範囲で任意に順番を変更し、または並列に実行することができる。
本明細書において説明した各処理を実施するプログラムは、記録媒体に記憶させてもよい。この記録媒体を用いれば、画像処理装置10を構成する各装置に、上記プログラムをインストールすることができる。ここで、上記プログラムを記憶した記録媒体は、非一過性の記録媒体であっても良い。非一過性の記録媒体は特に限定されないが、例えば、CD-ROM等の記録媒体であっても良い。
(付記1)
少なくとも1つのメモリと前記メモリに接続された少なくとも1つのハードウェアプロセッサを備え、テンプレートマッチングに利用される物体認識用の階層的なテンプレートを作成するテンプレート作成装置であって、
前記ハードウェアプロセッサは、前記メモリに格納された所定のプログラムを実行することにより、
各頂点の間隔が略均等、かつ、前記各頂点が各視点位置として設定される近似球形状を複数作成する作成部であり、作成する前記近似球形状ごとに、前記各視点位置の間隔が異なっている視点位置作成部と、
前記近似球形状ごとに、設定された前記各視点位置から見た対象物体に対応する複数のテンプレートを作成するテンプレート作成部として処理を実行する、テンプレート作成装置。
(付記2)
少なくとも1つのハードウェアプロセッサによって、テンプレートマッチングに利用される物体認識用の階層的なテンプレートを作成するテンプレート作成方法であって、
前記ハードウェアプロセッサは、
各頂点の間隔が略均等、かつ、前記各頂点が各視点位置として設定される近似球形状を複数作成するステップであり、作成する前記近似球形状ごとに、前記各視点位置の間隔が異なっている視点位置作成ステップと、
前記近似球形状ごとに、設定された前記各視点位置から見た対象物体に対応する複数のテンプレートを作成するテンプレート作成ステップとを実行する、テンプレート作成方法。
1…物体認識装置、2…対象物体、3…トレイ、4…PLC、10…画像処理装置、11…カメラ、12…ディスプレイ、13…マウス、14…メモリカード、110…視点位置作成装置、111…視点位置関連パラメータ設定部、112…視点位置作成部、113…最適視点位置作成部、114…視点位置情報出力部、120…テンプレート作成装置、121…視点位置情報取得部、122…3次CADデータ取得部、123…2次元投影画像作成部、124…特徴抽出部、125…テンプレート作成部、126…テンプレート情報出力部、130…物体認識処理装置、131…テンプレート情報取得部、132…画像取得部、133…画像ピラミッド生成部、134…特徴抽出部、135…テンプレートマッチング部、136…認識結果出力部、AG,AG1,AG2,AG3,AG4…近似球形状、VP…視点位置。

Claims (7)

  1. テンプレートマッチングに利用される物体認識用の階層的なテンプレートを作成するテンプレート作成装置であって、
    各頂点の間隔が略均等、かつ、前記各頂点が各視点位置として設定される近似球形状を複数作成する作成部であり、作成する前記近似球形状ごとに、前記各視点位置の間隔が異なっている視点位置作成部と、
    前記近似球形状ごとに、設定された前記各視点位置から見た対象物体に対応する複数のテンプレートを作成するテンプレート作成部とを具備し、
    前記各頂点は、対応する前記近似球形状の球面上に設けられ、
    前記近似球形状ごとに、前記各視点位置の間隔が異なるとともに、前記視点位置の数が異なり、
    前記各視点位置の間隔が広い方の前記近似球形状の一つの視点に対し、前記各視点位置の間隔が狭い方の前記近似球形状の複数の視点を対応づけることで、前記一つの視点に対応づけられる前記複数の視点の数が略均等となっている、テンプレート作成装置。
  2. テンプレートマッチングに利用される物体認識用の階層的なテンプレートを作成するテンプレート作成装置であって、
    各頂点の間隔が略均等、かつ、前記各頂点が各視点位置として設定される近似球形状を複数作成する作成部であり、作成する前記近似球形状ごとに、前記各視点位置の間隔が異なっている視点位置作成部と、
    前記近似球形状ごとに、設定された前記各視点位置から見た対象物体に対応する複数のテンプレートを作成するテンプレート作成部とを具備し、
    前記間隔が広い方の前記近似球形状に設定された前記各視点位置を各親視点とし、前記間隔が狭い方の前記近似球形状に設定された前記各視点位置を各子視点とした場合、
    前記各親視点に関連づけられる前記各子視点の数が略均等、かつ、前記各親視点と関連づけられる前記各子視点との間の最大距離が、最小となる回転角度を算出し、算出した前記回転角度で前記各近似球形状を回転させる処理を施すことで、回転後の前記各視点位置に対応する各最適視点位置を算出する最適視点位置作成部をさらに備え、
    前記テンプレート作成部は、前記近似球形状ごとに、設定された前記各最適視点位置から見た前記対象物体に対応する複数のテンプレートを作成する、テンプレート作成装置。
  3. 対象物体の形状、大きさに適した視点位置の間隔を設定する視点位置関連パラメータ設定部をさらに備え、
    前記視点位置作成部は、設定された前記視点位置の間隔に基づき、前記近似球形状を複数作成する、請求項に記載のテンプレート作成装置。
  4. 請求項1に記載のテンプレート作成装置によって作成された前記複数のテンプレートを用いて、物体の認識を行う物体認識処理装置であって、
    前記対象物体の入力画像を取得する画像取得部と、
    前記テンプレート作成部によって作成された前記各視点位置から見た前記対象物体に対応する前記複数のテンプレートを用いて、前記対象物体の入力画像とのマッチングを行うテンプレートマッチング部と
    を具備する物体認識処理装置。
  5. 粗密探索におけるテンプレートマッチングにより前記対象物体の認識を行う、請求項に記載の物体認識処理装置。
  6. テンプレートマッチングに利用される物体認識用の階層的なテンプレートを作成するテンプレート作成方法であって、
    各頂点の間隔が略均等、かつ、前記各頂点が各視点位置として設定される近似球形状を複数作成するステップであり、作成する前記近似球形状ごとに、前記各視点位置の間隔が異なっている視点位置作成ステップと、
    前記近似球形状ごとに、設定された前記各視点位置から見た対象物体に対応する複数のテンプレートを作成するテンプレート作成ステップとを含み、
    前記各頂点は、対応する前記近似球形状の球面上に設けられ、
    前記近似球形状ごとに、前記各視点位置の間隔が異なるとともに、前記視点位置の数が異なり、
    前記各視点位置の間隔が広い方の前記近似球形状の一つの視点に対し、前記各視点位置の間隔が狭い方の前記近似球形状の複数の視点を対応づけることで、前記一つの視点に対応づけられる前記複数の視点の数が略均等となっている、テンプレート作成方法。
  7. コンピュータに、テンプレートマッチングに利用される物体認識用の階層的なテンプレートを作成させるためのプログラムであって、
    前記コンピュータに、
    各頂点の間隔が略均等、かつ、前記各頂点が各視点位置として設定される近似球形状を複数作成するステップであり、作成する前記近似球形状ごとに、前記各視点位置の間隔が異なっている視点位置作成ステップと、
    前記近似球形状ごとに、設定された前記各視点位置から見た対象物体に対応する複数のテンプレートを作成するテンプレート作成ステップとを実行させ、
    前記各頂点は、対応する前記近似球形状の球面上に設けられ、
    前記近似球形状ごとに、前記各視点位置の間隔が異なるとともに、前記視点位置の数が異なり、
    前記各視点位置の間隔が広い方の前記近似球形状の一つの視点に対し、前記各視点位置の間隔が狭い方の前記近似球形状の複数の視点を対応づけることで、前記一つの視点に対応づけられる前記複数の視点の数が略均等となっている、プログラム。
JP2017117615A 2017-06-15 2017-06-15 テンプレート作成装置、物体認識処理装置、テンプレート作成方法及びプログラム Active JP7003455B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017117615A JP7003455B2 (ja) 2017-06-15 2017-06-15 テンプレート作成装置、物体認識処理装置、テンプレート作成方法及びプログラム
CN201810430347.8A CN109145935B (zh) 2017-06-15 2018-05-08 模板制作装置及其方法、物体识别处理装置以及存储介质
EP18171525.1A EP3416097B1 (en) 2017-06-15 2018-05-09 Template creation apparatus, object recognition processing apparatus, template creation method, and program
US15/982,528 US10706319B2 (en) 2017-06-15 2018-05-17 Template creation apparatus, object recognition processing apparatus, template creation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017117615A JP7003455B2 (ja) 2017-06-15 2017-06-15 テンプレート作成装置、物体認識処理装置、テンプレート作成方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2019003407A JP2019003407A (ja) 2019-01-10
JP7003455B2 true JP7003455B2 (ja) 2022-01-20

Family

ID=62148200

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017117615A Active JP7003455B2 (ja) 2017-06-15 2017-06-15 テンプレート作成装置、物体認識処理装置、テンプレート作成方法及びプログラム

Country Status (4)

Country Link
US (1) US10706319B2 (ja)
EP (1) EP3416097B1 (ja)
JP (1) JP7003455B2 (ja)
CN (1) CN109145935B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020250348A1 (ja) * 2019-06-12 2020-12-17 オムロン株式会社 物体認識装置及び物体認識方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014199559A (ja) 2013-03-29 2014-10-23 Kddi株式会社 視点推定装置及びその分類器学習方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004081855A1 (en) * 2003-03-06 2004-09-23 Animetrics, Inc. Generation of image databases for multifeatured objects
US20100201786A1 (en) * 2006-05-11 2010-08-12 Koninklijke Philips Electronics N.V. Method and apparatus for reconstructing an image
DE602007003849D1 (de) * 2007-10-11 2010-01-28 Mvtec Software Gmbh System und Verfahren zur 3D-Objekterkennung
EP2284791B1 (en) * 2008-04-30 2014-01-01 Osaka Prefecture University Public Corporation Method of creating three-dimensional object identifying image database, processing apparatus and processing program
US8306314B2 (en) * 2009-12-28 2012-11-06 Mitsubishi Electric Research Laboratories, Inc. Method and system for determining poses of objects
US8315461B2 (en) * 2010-01-25 2012-11-20 Apple Inc. Light source detection from synthesized objects
EP2660781A1 (en) * 2012-05-03 2013-11-06 Alcatel Lucent Three-dimensional model generation
WO2015117904A1 (de) * 2014-02-04 2015-08-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Hough-prozessor

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014199559A (ja) 2013-03-29 2014-10-23 Kddi株式会社 視点推定装置及びその分類器学習方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Markus Ulrich et al,Combining Scale-Space and Similarity-Based Aspect Graphs for Fast 3D Object Recognition,IEEE Transactions on Pattern Analysis and Machine Intelligence,米国,IEEE,2011年12月27日,Volume: 34, Issue: 10,1902 - 1914,https://ieeexplore.ieee.org/document/6112769
Yuan-Luo et al,3D object recognition technique based on muti-resolution aspect graph,2005 International Conference on Neural Networks and Brain,米国,IEEE,2005年10月15日,1168 - 1172,https://ieeexplore.ieee.org/document/1614823
小西 嘉典 他,階層的統合モデル用いた単眼カメラからの高速3次元位置・姿勢認識,映像情報インダストリアル,日本,産業開発機構(株),2016年03月01日,第48巻 第3号,81~86

Also Published As

Publication number Publication date
JP2019003407A (ja) 2019-01-10
EP3416097A1 (en) 2018-12-19
CN109145935A (zh) 2019-01-04
CN109145935B (zh) 2022-05-10
EP3416097B1 (en) 2020-09-30
US20180365516A1 (en) 2018-12-20
US10706319B2 (en) 2020-07-07

Similar Documents

Publication Publication Date Title
CN108875133B (zh) 确定建筑布局
CN110411441B (zh) 用于多模态映射和定位的系统和方法
JP6732214B2 (ja) 画像処理装置、画像処理方法、テンプレート作成装置、物体認識処理装置及びプログラム
JP6554900B2 (ja) テンプレート作成装置及びテンプレート作成方法
US20180144458A1 (en) Multiple Hypotheses Segmentation-Guided 3D Object Detection and Pose Estimation
EP3376433B1 (en) Image processing apparatus, image processing method, and image processing program
US11654571B2 (en) Three-dimensional data generation device and robot control system
JP6054831B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP6984633B2 (ja) 対象物の位置姿勢を検出する装置、方法およびプログラム
JP6889865B2 (ja) テンプレート作成装置、物体認識処理装置、テンプレート作成方法及びプログラム
JP6836561B2 (ja) 画像処理装置及び画像処理方法
JP2015184054A (ja) 同定装置、方法及びプログラム
JP7003455B2 (ja) テンプレート作成装置、物体認識処理装置、テンプレート作成方法及びプログラム
JP5762099B2 (ja) 姿勢認識装置、作業ロボット、姿勢認識方法、プログラム及び記録媒体
JP7298687B2 (ja) 物体認識装置及び物体認識方法
JP5868005B2 (ja) 撮像装置、撮像条件設定方法、プログラム
JP7251631B2 (ja) テンプレート作成装置、物体認識処理装置、テンプレート作成方法、物体認識処理方法及びプログラム
Masuta et al. Unknown object extraction for robot partner using depth sensor
Mishra et al. Development and evaluation of a Kinect based Bin-Picking system
Lidholm et al. Validation of stereo matching for robot navigation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211213

R150 Certificate of patent or registration of utility model

Ref document number: 7003455

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150