JP2015210690A - 画像認識装置 - Google Patents

画像認識装置 Download PDF

Info

Publication number
JP2015210690A
JP2015210690A JP2014092294A JP2014092294A JP2015210690A JP 2015210690 A JP2015210690 A JP 2015210690A JP 2014092294 A JP2014092294 A JP 2014092294A JP 2014092294 A JP2014092294 A JP 2014092294A JP 2015210690 A JP2015210690 A JP 2015210690A
Authority
JP
Japan
Prior art keywords
image
edge
images
differential
predetermined number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014092294A
Other languages
English (en)
Other versions
JP5685665B1 (ja
Inventor
菅野 純一
Junichi Sugano
純一 菅野
足立 秀之
Hideyuki Adachi
秀之 足立
義信 滝沢
Yoshinobu Takizawa
義信 滝沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VISCO TECHNOLOGIES CORP
Original Assignee
VISCO TECHNOLOGIES CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by VISCO TECHNOLOGIES CORP filed Critical VISCO TECHNOLOGIES CORP
Priority to JP2014092294A priority Critical patent/JP5685665B1/ja
Application granted granted Critical
Publication of JP5685665B1 publication Critical patent/JP5685665B1/ja
Publication of JP2015210690A publication Critical patent/JP2015210690A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】探索対象画像内において背景や対象物に外観上の変化が発生しても、高い精度で認識を行うことを実現する。【解決手段】画像認識装置1は、入力画像を8つの微分方向のそれぞれで微分することにより8枚の微分画像を生成し、さらに該8枚の微分画像のそれぞれについて対応する微分方向での非極大抑制処理を行うことにより8枚の非極大抑制画像を生成する8方向エッジ検出部10と、基準画像が入力画像である場合に8方向エッジ検出部により生成される8枚の非極大抑制画像に基づいてテンプレートを生成するテンプレート生成部20と、探索対象画像が入力画像である場合に8方向エッジ検出部10により生成される8枚の非極大抑制画像のそれぞれに基づいて生成される8枚のエッジ距離画像と、上記テンプレートとに基づいて探索対象画像内における基準画像のポーズを示すポーズ情報を取得するマッチング処理部30とを備える。【選択図】図1

Description

本発明は画像認識装置に関し、特に、カメラ視野内における対象物の位置や向き(以下、「ポーズ」と称する)の認識処理を行う画像認識装置に関する。
工業用の計測,検査アプリケーションでは、本来の処理(計測や検査)を行なう前に、カメラ視野内における対象物のポーズを認識する必要がある。また、ロボットガイダンスアプリケーションでは、作業位置を認識するためにカメラを移動させて対象物を探す動作を行なうが、この動作では、対象物と背景(対象物以外の全て)を区別するとともに、対象物のポーズを正確かつ高速に認識することが必要となる。これらを実現する技術は、サーチあるいはマッチングと呼ばれ、コンピュータビジョンの中心的役割として認知されている。
マッチング技術では、認識の対象となる対象物を含む画像(以下、「テンプレート」と称する)が認識処理の開始前に予め用意される。画像認識装置は、カメラから出力される画像(以下、「探索対象画像」と称する)内におけるテンプレートのポーズを探索し、その結果見つかったポーズを示すポーズ情報を出力する。
マッチング技術の歴史は古く、1980年代から現在に至るまで研究が継続されている。当初開発された技術は、正規化相互相関演算による一致度評価法を画面全体に適用するというものであったが、処理コストの大きさが実用上の課題であった。その後、粗密探索法の一つであるピラミッドアルゴリズムという画像圧縮(ダウンサンプリング)手法を組み合わることで処理コストを劇的に削減することに成功し、それ以後、この組み合わせ技術(以下、「濃淡特徴テンプレートマッチング」と称する)がマッチング技術のスタンダードとなった。
濃淡特徴テンプレートマッチングの普及により画像処理の有用性は飛躍的に高まり、多くのアプリケーションに対して濃淡特徴テンプレートマッチングの適用が検討されたが、次第に濃淡特徴テンプレートマッチングでは対応できないニーズが生まれ始めた。その代表的な事例が、探索対象画像内における背景や対象物の外観上の変化への対応である。
例えば、対象物をロボットが吸着し、底面から見上げるように撮像する場合を考える。対象物の周囲は背景であるが、この背景に何が撮像されるかは不定であることが多い。工場の天井であるかもしれないし、工作機械の一部であるかもしれない。テンプレートには対象物だけでなく対象物の背景(通常は無地である)も含まれるため、このように背景が変化すると、濃淡特徴テンプレートマッチングによる対象物の認識は困難になる。また、対象物に工作機械の影が落ちるケースや対象物をフィルム越しに観測したいケースがあるが、この場合、影やフィルム上の鏡面反射の影響で対象物自身の濃淡分布が非線形に変化するため、やはり濃淡特徴テンプレートマッチングによる対象物の認識が困難になる。このように、濃淡特徴テンプレートマッチングには、探索対象画像内において背景や対象物に外観上の変化が発生した場合に、対象物のポーズを正しく認識することが困難になるという課題があった。
この課題を解決するために、テンプレートの全体ではなく、対象物の輪郭(エッジ)のみを頼りに対象物を認識する手法(以下、「エッジ特徴テンプレートマッチング」と称する)が2000年代に提案された。エッジ特徴テンプレートマッチングの具体的な例としては、例えばキャニーエッジ検出法と一般化ハフ変換を組み合わせて用いる方法が知られている。
この方法では、まず初めにテンプレートから複数のエッジ点(X,Y,φ)を抽出する。なお、X,Y,φはそれぞれ、X座標、Y座標、勾配方向φを表わしている。そして、任意の基準点oを設定し、抽出したエッジ点ごとに、そのエッジ点から基準点oに向かう特徴ベクトルの長さrと、該特徴ベクトルと水平線とのなす角αとを、表1に示すように、勾配方向φをインデックスとするテーブルに格納する。
Figure 2015210690
次に、探索対象画像から複数のエッジ点(X',Y',φ')を抽出する。そして、抽出したエッジ点ごとに、表1のテーブルにおいて勾配方向(φ'−θ)に対応して記憶されるすべての(r,α)の組み合わせについて、次の式(1)により基準点位置(Xt,Yt)を算出する。ここで、角度θはテンプレートの回転角であり、ここでは0゜から360°まで1°刻みで変更しながら、すべてのθについて式(1)の算出を行う。
Figure 2015210690
式(1)の算出を行うことにより、エッジ点(X',Y',φ')及び回転角θごとに基準点位置(Xt,Yt)が得られるので、この結果をX軸、Y軸、θ軸で特定される空間(投票空間)内の各座標に投票する。探索対象画像内にひとつだけテンプレートを認識すればよい場合であれば、こうして投票された各座標のうち最大の票数を得たものが、探索対象画像内でテンプレートが配置されている位置(基準点o)及びその傾きを表すことになる。
特許文献1には、一般化ハフ変換と同じ枠組みを採用しつつ、複数の勾配方向φ(特許文献1では「方向値φ」と称している。特許文献1の[0016]段落他を参照)に重複投票することで、勾配方向φのばらつきに対応する技術が開示されている。ただし、この技術には、多数の偽投票を行なうことになるために、対象の誤認識を誘発するとともに、処理コストが増大するという欠点がある。
特許文献2には、勾配方向を特徴量として濃淡特徴テンプレートマッチングの一致度(特許文献2では「類似度R」と称している。特許文献2の[0015]段落他を参照)を算出することにより、濃淡特徴テンプレートマッチングを用いながらも、背景の外観が変化した場合にも高い精度での認識を可能にする技術が開示されている。
特開平07−234939号公報 特開平09−054828号公報
しかしながら、上述したエッジ特徴テンプレートマッチングによっても、探索対象画像内における背景や対象物に上記のような外観上の変化があると、認識に失敗する場合がある。その原因は主として、キャニーエッジ検出法によって算出された勾配方向をパラメータ算出式に組み込んでいる点にある。以下、具体的に説明する。
キャニーエッジ検出法では、注目画素とX方向に隣接する2つの画素相互間、及び、注目画素とY方向に隣接する2つの画素相互間のそれぞれについて、明度の差分を算出する。これによりX方向の差分とY方向の差分が得られるので、これらに基づいて逆正接を算出することにより、注目画素における勾配方向を得る。そして、この勾配方向に見て注目画素が極大値となっていなければ、注目画素の明度をゼロにする(非極大抑制処理)。以上の処理を画像内のすべての画素について行うことにより、最終的に、エッジ点に相当する画素以外の明度がゼロになり、エッジ点のみが強調されたエッジ画像が得られる。
一般化ハフ変換では、このように算出されたエッジ点の座標および勾配方向を用いて、投票位置が算出される。しかしながら、勾配方向には背景や対象物の外観上の変化による誤差が生じやすいため、こうして算出された一般化ハフ変換の投票位置は、背景や対象物の外観上の変化がある場合には誤差を多く含むものとなりがちである。投票位置に誤差が含まれると明瞭なピークが形成されなくなるので、結果的に不正確な認識結果を生ずることになる。これが従来、エッジ特徴テンプレートマッチングによる認識に失敗する原因のひとつとなっていた。
したがって、本発明の目的の一つは、探索対象画像内において背景や対象物に外観上の変化が発生しても、高い精度での認識を実現できる画像認識装置を提供することにある。
また、対象物に生ずる外観上の変化としては、対象物のエッジの変形を伴うようなものも発生し得る。キャニーエッジ検出法により検出されるエッジ点は点情報であるため、対象物のエッジに変形が生ずると、算出される一致度が急激に小さくなる。つまり、エッジ特徴テンプレートマッチングは対象物のエッジの変形に対する冗長性が低く、これも認識に失敗する原因のひとつとなる。
したがって、本発明の目的の他の一つは、エッジの変形を伴うような対象物の外観上の変化が発生しても、高い精度での認識を実現できる画像認識装置を提供することにある。
さらに、上述したピラミッドアルゴリズムを用いる場合、解像度を低くしすぎると細い線状の対象物が消えてしまう場合がある。そこで従来、ピラミッドアルゴリズムにおけるピラミッドの階層をあまり深くすることはできず、その結果、対象物の認識に要する処理コストが大きくなっていた。
したがって、本発明の目的のさらに他の一つは、ピラミッドアルゴリズムを用いる場合の処理コストを低減できる画像認識装置を提供することにある。
本発明による画像認識装置は、基準画像の入力を受け付ける基準画像入力受付部と、探索対象画像の入力を受け付ける探索対象画像入力受付部と、入力画像を所定数の微分方向のそれぞれで微分することにより前記所定数の微分画像を生成し、さらに該所定数の微分画像のそれぞれについて対応する微分方向での非極大抑制処理を行うことにより前記所定数の非極大抑制画像を生成するエッジ検出部と、前記基準画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数の非極大抑制画像に基づいてテンプレートを生成するテンプレート生成部と、前記探索対象画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数の非極大抑制画像のそれぞれに基づいて生成される前記所定数の画像と、前記テンプレートとに基づいて前記探索対象画像内における前記基準画像のポーズを示すポーズ情報を取得するマッチング処理部とを備えることを特徴とする。
本発明によれば、勾配方向ではなく、所定数の微分方向のそれぞれに基づいてエッジ点を決定している(非極大抑制処理を行っている)ので、探索対象画像内において背景や対象物に外観上の変化が発生しても、高い精度で認識を行うことが可能になる。
上記画像認識装置において、前記エッジ検出部は、前記所定数の微分画像のそれぞれについて対応する微分方向での非極大抑制処理を行うことにより、前記所定数の仮非極大抑制画像を生成する非極大抑制処理部と、前記所定数の仮非極大抑制画像のそれぞれに含まれるエッジ点ごとに、対応する前記微分画像に基づき、対応する微分方向における該エッジ点の中心線と、該エッジ点に対応するエッジとの間の距離を示すサブピクセル変位量を算出し、各エッジ点について算出したサブピクセル変位量を前記所定数の仮非極大抑制画像のそれぞれに設定することにより、前記所定数の非極大抑制画像を生成するサブピクセル変位量算出部と、前記所定数の非極大抑制画像のそれぞれに含まれる1又は複数のエッジ点それぞれの近傍に位置する複数の画素ごとに、対応するエッジ点に設定された前記サブピクセル変位量に基づいて、該画素と対応するエッジとの間の距離を示すエッジ距離を算出し、対応する前記非極大抑制画像に設定することにより、前記所定数のエッジ距離画像を生成するエッジ距離画像生成部とを有し、前記所定数の画像は、前記所定数のエッジ距離画像であることとしてもよい。これによれば、エッジ距離画像では、エッジが通過する画素であるエッジ点だけでなく、エッジ点と微分方向に隣接する画素についても、認識に用いることが可能になる。したがって、エッジの変形を伴うような対象物の外観上の変化が発生しても、高い精度で認識を行うことが可能になる。
また、上記画像認識装置において、前記テンプレート生成部は、前記基準画像の解像度を複数段階にわたって落とすことにより、前記基準画像と、解像度ごとの濃淡画像とを含む複数の第1の濃淡画像を生成する第1の高解像度ピラミッド生成部と、解像度ごとに、前記第1の濃淡画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数の非極大抑制画像に基づいて前記テンプレートを生成する高解像度テンプレート生成部と、前記複数の第1の濃淡画像のうちの最も解像度が低いものが前記入力画像である場合に前記エッジ検出部により生成される前記所定数の微分画像それぞれの解像度を複数段階にわたって落とすことにより、解像度ごとの前記所定数の微分画像を含む複数の第1の微分画像を生成する第1の低解像度ピラミッド生成部と、解像度ごとに、前記所定数の第1の微分画像のそれぞれについて対応する微分方向での非極大抑制処理を行うことによって生成される前記所定数の非極大抑制画像に基づいて前記テンプレートを生成する低解像度テンプレート生成部とを有し、前記マッチング処理部は、前記探索対象画像の解像度を複数段階にわたって落とすことにより、前記探索対象画像と、解像度ごとの濃淡画像とを含む複数の第2の濃淡画像を生成する第2の高解像度ピラミッド生成部と、前記複数の第2の濃淡画像のうちの最も解像度が低いものが前記入力画像である場合に前記エッジ検出部により生成される前記所定数の微分画像それぞれの解像度を複数段階にわたって落とすことにより、解像度ごとの前記所定数の微分画像を含む複数の第2の微分画像を生成する第2の低解像度ピラミッド生成部と、前記複数の第2の微分画像のうち最も低い解像度に対応する前記所定数の第2の微分画像と、前記解像度ごとのテンプレートのうち最も低い解像度に対応する前記テンプレートとに基づいて、それぞれ前記ポーズ情報の候補である少なくとも1つのポーズ情報候補を取得する全探索処理部と、前記複数の第2の微分画像のうち最も低い解像度以外の解像度に対応するもの及び前記複数の第2の濃淡画像のそれぞれから前記少なくとも1つのポーズ情報候補のそれぞれに基づいて抽出される抽出画像と、前記解像度ごとのテンプレートのうち最も低い解像度以外の解像度に対応する複数の前記テンプレートとに基づいて、前記ポーズ情報を取得する周辺探索処理部とを有することとしてもよい。これによれば、解像度の低い場合に、濃淡画像ではなく、所定数の微分方向のそれぞれについて生成される微分画像を用いるので、ピラミッドアルゴリズムにおけるピラミッドの階層を従来より深くすることができる。したがって、ピラミッドアルゴリズムを用いる場合の処理コストを低減することが可能になる。
なお、この画像認識装置においてさらに、前記エッジ検出部は、前記所定数の微分画像のそれぞれについて対応する微分方向での非極大抑制処理を行うことにより、前記所定数の仮非極大抑制画像を生成する非極大抑制処理部と、前記所定数の仮非極大抑制画像のそれぞれに含まれるエッジ点ごとに、対応する前記微分画像に基づき、対応する微分方向における該エッジ点の中心線と、該エッジ点に対応するエッジとの間の距離を示すサブピクセル変位量を算出し、各エッジ点について算出したサブピクセル変位量を前記所定数の仮非極大抑制画像のそれぞれに設定することにより、前記所定数の非極大抑制画像を生成するサブピクセル変位量算出部と、前記所定数の非極大抑制画像のそれぞれに含まれる1又は複数のエッジ点それぞれの近傍に位置する複数の画素ごとに、対応するエッジ点に設定された前記サブピクセル変位量に基づいて、該画素と対応するエッジとの間の距離を示すエッジ距離を算出し、対応する前記非極大抑制画像に設定することにより、前記所定数のエッジ距離画像を生成するエッジ距離画像生成部とを有し、前記所定数の画像は、前記所定数のエッジ距離画像であり、前記周辺探索処理部は、解像度ごとに、該解像度に対応する前記抽出画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数のエッジ距離画像と、該解像度に対応する前記テンプレートとに基づいて、前記探索対象画像内における前記基準画像のポーズの候補である少なくとも1つのポーズ情報候補を取得するよう構成され、前記ポーズ情報は、最も高い解像度に対応して前記周辺探索処理部が取得する前記少なくとも1つのポーズ情報候補の中から選択されることとしてもよい。
また、上記画像認識装置において、前記テンプレート生成部は、前記基準画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数の微分画像のうちの少なくとも一部に基づいて、量子化された勾配方向が各画素に設定された微分方向画像を生成する勾配値取得部と、前記基準画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数の非極大抑制画像に含まれる複数のエッジ点それぞれについて前記微分方向画像から量子化された勾配方向を取得し、該複数のエッジ点それぞれの座標及び量子化された勾配方向を示すエッジ特徴点群を生成するエッジ特徴点群生成部とを有し、前記テンプレートは前記エッジ特徴点群を含んで構成されることとしてもよく、さらに、前記テンプレート生成部は、前記エッジ特徴点群に基づいて単位回転角を算出する単位回転角算出部と、前記単位回転角に基づいて前記エッジ特徴点群を回転させることにより、前記エッジ特徴点群を含む複数のエッジ特徴点群を取得する回転処理部とをさらに有し、前記テンプレートは前記複数のエッジ特徴点群を含んで構成されることとしてもよい。
また、上記各画像認識装置において、前記所定数の微分方向は、360°を8つに等分割することにより得られる8つの方向であることとしてもよい。
本発明によれば、勾配方向ではなく、所定数の微分方向のそれぞれに基づいてエッジ点を決定している(非極大抑制処理を行っている)ので、探索対象画像内において背景や対象物に外観上の変化が発生しても、高い精度で認識を行うことが可能になる。
また、エッジの変形を伴うような対象物の外観上の変化が発生しても高い精度で認識を行うことや、ピラミッドアルゴリズムを用いる場合の処理コストを低減することも可能になる。
本発明の実施の形態による画像認識装置1の機能ブロックを示す略ブロック図である。 図1に示した8方向エッジ検出部10の内部構成を示す略ブロック図である。 図1に示したテンプレート生成部20の内部構成を示す略ブロック図である。 図3に示した高解像度テンプレート生成部23の内部構成を示す略ブロック図である。 図3に示した低解像度テンプレート生成部25の内部構成を示す略ブロック図である。 図1に示したマッチング処理部30の内部構成を示す略ブロック図である。 図6に示した全探索処理部34の内部構成を示す略ブロック図である。 (a)(b)ともに、図6に示した周辺探索処理部35の内部構成を示す略ブロック図である。 図2に示したサブピクセル変位量算出部10cによるサブピクセル変位量算出の説明図である。 図7に示した全探索処理部34による一致度算出の説明図である。
以下、添付図面を参照しながら、本発明の好ましい実施の形態について詳細に説明する。
本実施の形態による画像認識装置1は、図1に示すように、機能的に、基準画像入力受付部2、設定値入力受付部3、探索対象画像入力受付部4、8方向エッジ検出部10、テンプレート生成部20、及びマッチング処理部30を備えて構成される。これらの機能は、パーソナルコンピュータなどの処理装置、記憶装置、及び入出力装置などを有するコンピュータにおいて、記憶装置に記憶されるプログラムを処理装置に実行させることによって実現されるものである。画像認識装置1は、工業用の計測,検査アプリケーションの一部を構成しており、本来の処理(計測や検査)を行なう前に、図示しないカメラの視野内における対象物のポーズを認識するために用いられる。
基準画像入力受付部2は、上述したテンプレートの一部を構成する基準画像の入力を受け付ける機能を有して構成される。具体的な例では、ユーザ操作により、対象物の写った写真から対象物を含む長方形の領域を切り出し、基準画像入力受付部2に入力する。なお、基準画像としては、影や対象物以外のものなどが写り込んでいない画像を使用することが好適である。基準画像入力受付部2が受け付けた基準画像は、テンプレート生成部20に供給される。
設定値入力受付部3は、後述するガウシアンフィルターの設定値である標準偏差値σ(以下、「σ値」という)、後述するガウシアンピラミッドの生成の際に方向別微分画像(後述)に基づく画像の生成を開始する階層n、及びエッジ点の変形許容量Vのそれぞれについて、ユーザによる設定値の入力を受け付ける機能を有して構成される。設定値入力受付部3は、σ値及び階層nをテンプレート生成部20及びマッチング処理部30のそれぞれに供給し、変形許容量Vを8方向エッジ検出部10に供給するよう構成される。
探索対象画像入力受付部4は、上述した探索対象画像の入力を受け付ける機能を有して構成される。探索対象画像は、通常、図示しないカメラが撮影した映像である。すなわち、探索対象画像入力受付部4はカメラと接続されており、このカメラによって撮影された画像が、探索対象画像として探索対象画像入力受付部4に入力される。カメラはスチルカメラでもビデオカメラでもよく、動画が入力された場合の探索対象画像入力受付部4は、その動画から静止画を切り出し、切り出した静止画を探索対象画像として受け付ける。探索対象画像入力受付部4が受け付けた探索対象画像は、マッチング処理部30に供給される。
ここで、カメラの視野内には、普通、認識の対象物だけでなく、計測器、搬送機などの種々の装置やこれらの影などが写り込む。したがって、探索対象画像内のテンプレートの自動認識を行うにあたってはこれらの影響をできるだけ除去する必要があるが、画像認識装置1によれば、背景や対象物に外観上の変化(エッジの変形を伴うような変化を含む)が発生した場合にも、高い精度での認識が実現される。
8方向エッジ検出部10は、テンプレート生成部20又はマッチング処理部30から供給される画像(入力画像)に基づいてそれぞれ8枚の微分画像及び非極大抑制画像を生成し、さらに生成した8枚の非極大抑制画像と設定値入力受付部3から供給される変形許容量Vとに基づいて8枚のエッジ距離画像を生成する機能を有して構成される。なお、本実施の形態では各画像の枚数を8枚としているが、この枚数は、後述する微分方向の数によって決定される。
図2を参照して、8方向エッジ検出部10の機能についてより詳しく説明する。8方向エッジ検出部10は、図2に示すように、方向別微分画像生成部10a、非極大抑制処理部10b、サブピクセル変位量算出部10c、及びエッジ距離画像生成部10dを有して構成される。
方向別微分画像生成部10aは、入力画像を所定数の微分方向のそれぞれで微分することにより、所定数の微分画像を生成するよう構成される。所定数の微分方向は360°を所定数かつ等間隔に分割してなる方向であり、本実施の形態ではこの所定数が8であることを前提として説明する。この場合、所定数の微分方向は、0°、45°、90°、135°、180°、215°、270°、315°の8つである。ただし、微分方向の数は必ずしも8でなくてもよく、好ましくは4の倍数であればよい。微分方向の数が多いほど認識精度が向上するが、一方で処理コストが大きくなるため、具体的な数は、要求される認識精度と許容される処理コストとを考慮して決定することが好適である。
方向別微分画像生成部10aが行う微分は一次微分(差分)であり、微分画像中の各画素の明度(微分値)は次の式(2)によって決定される。ただし、方向別微分画像生成部10aは、f(x+1)がf(x−1)より小さい場合(式(2)の右辺がマイナスとなる場合)には、式(2)によらず関数g(x)の値を0に固定するよう構成される。ここで、式(2)中のxは対応する微分方向における座標を示し、座標x−1,x+1はそれぞれ、対応する微分方向のマイナス側及びプラス側で、座標xにより示される画素と隣接する画素の座標である。また、関数f(x)は入力画像中の各画素の明度を示し、関数g(x)は微分画像中の各画素の明度(微分値)を示している。
Figure 2015210690
以上のようにして生成される8枚の微分画像<7:0>はそれぞれ、対応する微分方向に沿って暗から明に変化するエッジのみが強調された画像となる。なお、本明細書において、画像<a:b>と記述した場合、画像<b>から画像<a>までのa−b+1枚の画像を表す。生成された微分画像<7:0>は、図2に示すように、8方向エッジ検出部10の出力のひとつを構成する。
なお、方向別微分画像生成部10aが上記のようにして微分画像<7:0>の生成を行うのは、図2にも示すように、入力画像が濃淡画像である場合のみである。入力画像自体が8枚の微分画像<7:0>となっている場合があり、その場合には、入力画像がそのまま方向別微分画像生成部10aの出力画像となる。
非極大抑制処理部10bは、上記8枚の微分画像<7:0>のそれぞれについて対応する微分方向での非極大抑制処理を行うことにより、8枚の仮非極大抑制画像<7:0>を生成するよう構成される。仮非極大抑制画像<7:0>はそれぞれ、対応する微分画像内において対応する微分方向に並ぶ画素の間で明度が極大となる画素(両側に既定数ずつの隣接画素と自分自身との間で最も明度が大きくなる画素)に対応する画素(以下、「エッジ点」と称する)のみに255が設定され、エッジ点以外のすべての画素の値に0が設定された画像となる。
サブピクセル変位量算出部10cは、非極大抑制処理部10bによって生成された8枚の仮非極大抑制画像<7:0>それぞれに含まれるエッジ点ごとに、方向別微分画像生成部10aによって生成された8枚の微分画像<7:0>のうちの対応するものに基づき、対応する微分方向における該エッジ点の中心線と、該エッジ点に対応するエッジ(該エッジ点である画素内を通過するエッジ)との間の距離を示すサブピクセル変位量Δxを算出する機能部である。以下、図9も参照しながら、サブピクセル変位量Δxについて詳しく説明する。
図9には、微分方向であるx方向に並ぶ9つの画素P1〜P9を示している。同図に示すy軸の値は、各画素の明度(微分値)を示している。同図の例では画素P5がエッジ点であり、同図に示すように画素P5の中をエッジが通過している。また、同図では、画素P5のx座標(画素P5のx方向の中心線のx座標)をxとし、画素間距離(x方向の中心線間の距離)を1としている。さらに、同図では、画素P5の明度をd(0)とし、画素P5にx方向の両側で隣接する画素P4,P6の明度をそれぞれd(−1),d(+1)としている。画素P5がエッジ点であることから、d(0)≧d(−1)かつd(0)≧d(+1)となる。
図9に示すように、画素P4〜P6の明度は放物線によって近似することができる。すると、この放物線の頂点のx座標は必ずしもxになるとは限らず、むしろ通常、座標xから少し離れたところに位置する。これは、各画素のx座標が離散的であるためであり、放物線の頂点のx座標が実際のエッジの位置を示している。
サブピクセル変位量Δxは、図9に示すように、上記放物線の頂点のx座標(実際のエッジ位置に相当するx座標)と、エッジ点のx座標xとの距離である。具体的には、明度d(−1),d(0),d(+1)を用いて、次の式(3)により求められる。こうして算出されるサブピクセル変位量Δxは、−0.5以上0.5以下の範囲の値を取る。
Figure 2015210690
サブピクセル変位量算出部10cは、式(3)を用いて各エッジ点のサブピクセル変位量Δxを算出し、算出したサブピクセル変位量Δxを仮非極大抑制画像<7:0>の各エッジ点に格納することにより、非極大抑制画像<7:0>を生成するよう構成される。なお、サブピクセル変位量算出部10cは、エッジ点以外の画素(背景を構成する画素)には、0x7000などの非常に大きな値を設定する。こうして生成された非極大抑制画像<7:0>も、図2に示すように、8方向エッジ検出部10の出力のひとつを構成する。
エッジ距離画像生成部10dは、非極大抑制画像<7:0>のそれぞれに含まれる1又は複数のエッジ点それぞれの近傍に位置する複数の画素ごとに、対応するエッジ点に設定されたサブピクセル変位量Δxに基づいて、該画素と対応するエッジとの間の距離を示すエッジ距離EDを算出し、非極大抑制画像<7:0>のうちの対応するものに設定することにより、8枚のエッジ距離画像<7:0>を生成するよう構成される。
エッジ距離EDは、具体的には次の式(4)により算出される。ただし、PDは、エッジ点の座標(図9では座標x)からのピクセル変位量(画素間距離に方向性を付与したもの。例えば、図9の画素P4ではPD=−1、画素P6ではPD=+1となる)である。なお、図9には、画素P1〜P9のそれぞれについて、式(4)により算出されるエッジ距離EDも図示している。
Figure 2015210690
エッジ距離画像生成部10dは、式(4)により各エッジ点と対応する微分方向で隣接する各画素のエッジ距離EDを算出し、サブピクセル変位量算出部10cから供給される非極大抑制画像<7:0>に設定することにより、8枚のエッジ距離画像<7:0>を生成する。ただし、この場合において、エッジ距離画像生成部10dは、設定値入力受付部3から供給される変形許容量Vを参照し、各エッジ点から±Vの範囲内に位置する画素にのみエッジ距離EDを設定する。なお、図9にはV=3の場合の例を示している。また、1つの画素について複数のエッジ距離EDが算出される場合があり得るが、その場合には、小さい方の値を設定する。こうしてエッジ距離EDが設定された画素は、後に説明するマッチング処理部30での探索処理において、エッジの一部を構成し得る画素とみなされることになる。エッジ距離画像生成部10dにより生成されたエッジ距離画像<7:0>も、図2に示すように、8方向エッジ検出部10の出力のひとつを構成する。
図1に戻り、テンプレート生成部20は、基準画像入力受付部2から供給される基準画像を8方向エッジ検出部10に供給し、その結果として8方向エッジ検出部10から出力される非極大抑制画像<7:0>に基づき、テンプレートを生成する機能を有して構成される。詳しくは後述するが、テンプレートは、図1に示すエッジ特徴点群<1><m:0>〜<N><m:0>により表される。テンプレート生成部20は、ピラミッドアルゴリズムによる粗密探索及び回転テンプレートに対応しており、したがって、テンプレート生成部20によって実際に生成されるテンプレートは、解像度ごとかつ角度ごとのテンプレートを含んで構成される。
図3〜図5を参照して、テンプレート生成部20の機能についてより詳しく説明する。テンプレート生成部20は、図3に示すように、階層数算出部21、高解像度ピラミッド生成部22、高解像度テンプレート生成部23、低解像度ピラミッド生成部24、及び低解像度テンプレート生成部25を有して構成される。
階層数算出部21は、基準画像入力受付部2から供給される基準画像に基づいて、ピラミッドアルゴリズムの階層数Nを算出するよう構成される。この算出について具体的に説明すると、まず階層数算出部21は、長方形である基準画像の長辺と短辺それぞれの長さのうち小さい方を基準サイズとして取得する。基準画像が正方形である場合には、その一辺の長さを基準サイズとすればよい。また、階層数算出部21には、予めパタン最小サイズが設定される。このパタン最小サイズの設定値はピラミッドアルゴリズムで生成される最小画像のサイズを示しており、あまり小さくし過ぎると対象物の自動認識が困難になる。したがって、実際にパタン最小サイズを設定する際には、いくつかのパタン最小サイズを用いて画像認識処理1による認識処理を試行し、最適な結果が得られる値を選択することが好適である。
基準サイズを取得した階層数算出部21は、階層数Nに1を設定し、基準サイズを2で除算する。その結果得られた値が上記パタン最小サイズより小さかった場合、階層数算出部21は、階層数N=1を出力する。一方、得られた値が上記パタン最小サイズより大きかった場合、Nを1増加させてN=2とし、再度基準サイズを2で除算する。その結果得られた値が上記パタン最小サイズより小さかった場合、階層数算出部21は、階層数N=2を出力する。一方、得られた値が上記パタン最小サイズより大きかった場合、再度Nを増加させて、基準サイズを2で除算する。階層数算出部21は、このような処理を、除算の結果として得られる値が上記パタン最小サイズを下回るまで繰り返す。その結果、階層数算出部21からは、何らかの正整数の値が階層数Nとして出力されることになる。階層数算出部21から出力された階層数Nは、低解像度ピラミッド生成部24及びマッチング処理部30(図1)に供給される。
高解像度ピラミッド生成部22(第1の高解像度ピラミッド生成部)は、基準画像入力受付部2から供給される基準画像について、n−2段階(nは設定値入力受付部3から供給される値)にわたり、ガウシアンフィルターを適用しつつダウンサンプリング(低解像度化)を行い、さらに、各段階で得られるダウンサンプリング後の画像に差分フィルターを適用するように構成される。1段分のダウンサンプリングによる解像度の低下量は、画像の一辺のサイズが半分になる量に予め調節される。このダウンサンプリング及びフィルタリングにより、最終的に、基準画像そのものである濃淡画像<1>を含むn−1枚の濃淡画像<n−1:1>(複数の第1の濃淡画像)が生成される。ここで、2段階目以降のダウンサンプリングは、前段のダウンサンプリングの結果として得られた濃淡画像を入力画像として行われる。したがって、生成されるn−1枚の濃淡画像<n−1:1>の解像度は、濃淡画像<1>から順に低くなることになる。高解像度ピラミッド生成部22が生成した濃淡画像<n−1:1>は、高解像度テンプレート生成部23に供給される。
ここで、ダウンサンプリング前の画像にガウシアンフィルターを適用する目的について説明する。高解像度ピラミッド生成部22の出力である濃淡画像<n−1:1>は、後述する高解像度テンプレート生成部23において微分画像化されるが、画像認識装置1が好適な認識を行うためには、こうして得られる微分画像に、マッチングに適したエッジ特徴が現れている必要がある。なお、マッチングに適したエッジ特徴とは、対象物の輪郭を安定的に含みながら、背景領域に含まれるエッジを極力含まない、というものである。
従来の粗密検索では、画像のダウンサンプリングは、単に画像の解像度を落とすことによって行われていた。もしくは、エイリアシングの発生を防ぐ程度の小さなσ値を持つガウシアンフィルターを、原画像(基準画像入力受付部2から供給された基準画像)のみに適用していた。この状態では、解像度は低下するものの対象物以外のノイズによる高周波情報が十分に残っているため、画面がエッジで埋め尽くされた状態となり、エッジ特徴マッチングに適した画像とは言えない。
これに対し、画像認識装置1では、各段階でダウンサンプリング前の画像にガウシアンフィルターを適用するので、ノイズに代表される局所的なエッジを排除しつつ、対象物のエッジのような大局的なエッジを残すことが可能となっている。したがって、画像認識装置1では、マッチングに適したエッジ特徴が現れる微分画像を得ることが可能になる。
なお、ガウシアンフィルターがこのような効果を有するためには、ある程度大きなσ値を設定する必要がある。しかし一方で、ガウシアンフィルターにはσ値が大きいほど処理コストが大きくなるという特徴があるため、あまり大きなσ値を設定することは好ましくない。これに対し、画像認識装置1では、複数段階にわたって画像のダウンサンプリングを行い、その都度ガウシアンフィルターを適用していくことから、ダウンサンプリングの段階が進むにつれてσ値が累乗されることになる。このことは、最終的に得られる濃淡画像に関して、段階数分累乗されたσ値を有するガウシアンフィルターが適用された場合と同じフィルタリング効果が得られることを意味する。したがって、設定値としてのσ値はそれほど大きな値でなくとも、実質的に、大きなσ値を設定した場合と同様の効果が得られることになるので、画像認識装置1では、大きなσ値を設定することによるガウシアンフィルターの処理コストの問題はほぼ生じない。具体的なσ値の設定値は、生成されるテンプレートを目視で確認しながら、マッチングに適したエッジ特徴が現れるよう、適宜調節することが好適である。
高解像度テンプレート生成部23は、高解像度ピラミッド生成部22から供給される濃淡画像<k>(kは1からn−1の整数)を8方向エッジ検出部10に供給し、その結果として8方向エッジ検出部10から出力される非極大抑制画像<k><7:0>に基づき、濃淡画像<k>の解像度に対応するテンプレートを生成するよう構成される。高解像度テンプレート生成部23は、1からn−1のn−1個のkそれぞれについて、このテンプレートの生成を行うよう構成される。
高解像度テンプレート生成部23は、具体的には、図4に示すように、画像取得部23a、勾配値取得部23b、エッジ特徴点群生成部23c、単位回転角算出部23d、回転処理部23eを有して構成される。以下、これらの機能部の動作について説明しつつ、高解像度テンプレート生成部23によるテンプレート生成の具体的な手順について詳しく説明する。
以下、高解像度ピラミッド生成部22から濃淡画像<k>が供給された場合の動作を例に取って説明する。高解像度ピラミッド生成部22から濃淡画像<k>が供給されると、まず画像取得部23aにより、供給された濃淡画像<k>が8方向エッジ検出部10に供給され、その結果として8方向エッジ検出部10から出力される微分画像<k><7:0>及び非極大抑制画像<k><7:0>が取得される。画像取得部23aは、こうして取得した非極大抑制画像<k><7:0>のすべてをエッジ特徴点群生成部23cに供給するとともに、微分画像<k><7:0>のうちそれぞれ微分方向0°、90°、180°、270°に対応する微分画像<k><0>、微分画像<k><2>、微分画像<k><4>、微分画像<k><6>のみを勾配値取得部23bに供給する。以下では、この4つの微分画像をまとめて、図4にも示すように微分画像<k><0,2,4,6>と表記する。また、画像取得部23aは、k=n−1の場合に限り、微分画像<n−1><7:0>を図3に示す低解像度ピラミッド生成部24に供給する。
勾配値取得部23bは、微分画像<k><0,2,4,6>から画素ごとの勾配方向を取得し、この勾配方向が各画素に設定された勾配画像<k>を生成するとともに、取得した各画素の勾配方向を量子化することにより、量子化された勾配方向が各画素に設定された微分方向画像<k>を生成する機能を有している。具体的に説明すると、勾配値取得部23bはまず、それぞれ微分方向0°,180°に対応する微分画像<k><0,4>から、X方向微分画像を生成する。より具体的には、微分画像<k><0>から微分画像<k><4>を減算することにより、X方向微分画像を生成する。上述したように、微分画像<7:0>はそれぞれ、対応する微分方向に沿って暗から明に変化するエッジのみが強調された画像である。したがって、微分画像<k><0>は微分方向0°に沿って暗から明に変化するエッジのみが強調された画像であり、微分画像<k><4>は微分方向180°に沿って暗から明に変化するエッジのみが強調された画像である。これに対し、X方向微分画像は上記のように微分画像<k><0>から微分画像<k><4>を減算したものであるから、微分方向0°に沿って暗から明に変化するエッジと、微分方向180°に沿って暗から明に変化するエッジ(すなわち、微分方向0°に沿って明から暗に変化するエッジ)との両方が強調された画像となる。
次に、勾配値取得部23bは、それぞれ微分方向90°,270°に対応する微分画像<k><2,6>から、Y方向微分画像を生成する。より具体的には、微分画像<k><2>から微分画像<k><6>を減算することにより、Y方向微分画像を生成する。こうして生成されるY方向微分画像は、X方向微分画像と同様の理由により、微分方向90°に沿って暗から明に変化するエッジと、微分方向270°に沿って暗から明に変化するエッジ(すなわち、微分方向90°に沿って明から暗に変化するエッジ)との両方が強調された画像となる。
続いて、勾配値取得部23bは、以上のように生成したX方向微分画像及びY方向微分画像により、勾配画像<k>を生成する。具体的に説明すると、まず逆正接を用いる次の式(5)により、各画素の勾配方向G(i)(iは画素の通番)を算出する。ただし、式(5)中のX(i)はi番目の画素のX方向微分画像における明度(微分値)を示し、Y(i)はi番目の画素のY方向微分画像における明度(微分値)を示している。勾配値取得部23bは、こうして算出した勾配方向G(i)を各画素に設定することにより、勾配画像<k>を生成する。
Figure 2015210690
次に、勾配値取得部23bは、勾配画像<k>から微分方向画像<k>を生成する。具体的には、式(5)により算出した勾配方向G(i)を、上記所定数((図2に示した方向別微分画像生成部10aに設定される所定数。本実施の形態では「8」)の微分方向のうち最も近い方向に量子化してなる量子化勾配方向QG(i)を取得する。一例を挙げて説明すると、i番目の画素に対応する勾配方向G(i)が例えば40°であった場合、上述した微分方向0°、45°、90°、135°、180°、215°、270°、315°のうち、微分方向45°が最も近い方向となるので、量子化勾配方向QG(i)は45°となる。以上のような量子化勾配方向QG(i)をすべての画素について取得した後、勾配値取得部23bは、量子化勾配方向QG(i)を微分方向画像<k>の各画素に設定する。これにより、勾配値取得部23bによる微分方向画像<k>の生成が完了する。勾配値取得部23bが生成した微分方向画像<k>は、エッジ特徴点群生成部23cに供給される。
エッジ特徴点群生成部23cは、非極大抑制画像<k><7:0>に含まれる複数のエッジ点それぞれについて微分方向画像<k>から量子化勾配方向を取得し、該複数のエッジ点それぞれの座標及び量子化勾配方向を示すエッジ特徴点群<k>を生成するよう構成される。より具体的に言えば、エッジ特徴点群生成部23cは、微分方向画像<k>内の各画素がエッジ点であるか否かを判定する機能と、エッジ点であると判定した各画素について、微分方向画像<k>内における座標(ピクセル座標)、微分方向画像<k>内に設定された量子化勾配方向QG(i)、この量子化勾配方向QG(i)に対応する非極大抑制画像内の対応する画素に設定された値(サブピクセル変位量Δx)、及び、勾配画像<k>内に設定された勾配方向G(i)を含むエッジ特徴点群<k>を生成する機能とを有して構成される。
以下、微分方向画像<k>内のi番目の画素にかかる処理に注目し、エッジ特徴点群生成部23cの動作について、より具体的に説明する。エッジ特徴点群生成部23cはまず、i番目の画素に関して微分方向画像<k>内に設定された量子化勾配方向QG(i)を取得する。そして、8枚の非極大抑制画像<k><7:0>の中から、この量子化勾配方向QG(i)に対応するものを選択する。続いて、エッジ特徴点群生成部23cは、上記i番目の画素に対応する選択した非極大抑制画像<k>内の画素を参照し、そこに設定された値を取り出す。そして、取り出した値が−0.5以上0.5以下の範囲に含まれるか否かを判定し、含まれると判定した場合に、i番目の画素がエッジ点であると判定する。含まれないと判定した場合には、i番目の画素はエッジ点ではないと判定する。この判定では、要するに、非極大抑制画像<k>内の対応する画素にサブピクセル変位量Δxが設定されている場合にエッジ点であると判定し、そうでない場合にエッジ点ではないと判定していることになる。
i番目の画素がエッジ点であると判定した場合、エッジ特徴点群生成部23cは、微分方向画像<k>からi番目の画素の座標(ピクセル座標)及び量子化勾配方向QG(i)を取得するとともに、選択した非極大抑制画像<k>から対応する画素の設定値(サブピクセル変位量Δx)を取得し、さらに勾配画像<k>内から対応する画素の勾配方向G(i)を取得し、こうして取得した各情報を含む一群の情報を、エッジ特徴点群<k>内に1レコードとして格納する。
最終的に生成されるエッジ特徴点群<k>は、微分方向画像<k>内のすべての画素のうち、上記判定によりエッジ点であると判定された画素のそれぞれについて、同様のレコードを含む情報となる。こうして生成されるエッジ特徴点群<k>は、画像認識装置1において使用される複数のテンプレートのうちのひとつを構成するもので、単位回転角算出部23d及び回転処理部23eのそれぞれに供給される。
単位回転角算出部23dは、エッジ特徴点群<k>に基づいて単位回転角θ<k>を算出する機能部である。単位回転角θ<k>とは、回転テンプレートを生成するためにテンプレートを回転させる際の回転角の基準値である。単位回転角算出部23dによる単位回転角θ<k>の算出は、次の式(6)から式(10)に示す一連の計算を行うことによって行われる。ただし、式(6)中のDは、エッジ特徴点群<k>に含まれるj番目のエッジ点と、エッジ特徴点群<k>に含まれる全エッジ点の重心位置との間の距離である。また、Nは、エッジ特徴点群<k>に含まれるエッジ点の個数である。
Figure 2015210690
式(6)から式(10)について、計算の順を追いつつ詳しく説明する。まず単位回転角算出部23dは、式(6)により距離Dの平均値μを算出し、次いで式(7)により距離Dの標準偏差値uを算出する。次に単位回転角算出部23dは、式(8)に示すように、平均値μと標準偏差値uを加算することによってエッジ基準距離値Dを算出する。そして、このエッジ基準距離値Dを用いて、式(9)により角度変化量θを算出する。角度変化量θは、重心位置からエッジ基準距離値Dだけ離れた位置にあるエッジ点が重心位置を中心とした円軌道上を1画素分移動した場合の、該エッジ点の回転角を示している。最後に単位回転角算出部23dは、式(10)に示すように、角度変化量θに変形許容量V(設定値入力受付部3から供給されるもの)を乗算した結果を、単位回転角θ<k>として出力する。
回転処理部23eは、単位回転角算出部23dによって算出された単位回転角θ<k>に基づいてエッジ特徴点群<k>を回転させることにより、このエッジ特徴点群<k>であるエッジ特徴点群<k><0>を含むm+1個のエッジ特徴点群<k><m:0>を取得する。ただし、mは次の式(11)で表わされる。
Figure 2015210690
以上のようにして生成されるエッジ特徴点群<k><m:0>はそれぞれ、画像認識装置1において使用される複数のテンプレートのうちのひとつを構成する。
ここまで、高解像度ピラミッド生成部22から濃淡画像<k>が供給された場合の動作を例に取って高解像度テンプレート生成部23内の各部の動作を説明してきたが、実際の高解像度テンプレート生成部23は、1からn−1のn−1個のkそれぞれについて同様の動作を行うよう構成される。したがって、高解像度テンプレート生成部23は最終的に、図3に示すように、それぞれテンプレートである複数のエッジ特徴点群<1><m:0>〜<n−1><mn−1:0>を生成することとなる。
図3に戻る。低解像度ピラミッド生成部24(第1の低解像度ピラミッド生成部)は、高解像度テンプレート生成部23から供給される微分画像<n−1><7:0>(濃淡画像<n−1:1>のうちの最も解像度が低いものである濃淡画像<n−1>が入力画像である場合に8方向エッジ検出部10により生成される8枚の微分画像)それぞれの解像度をN−n+1段階にわたって落とすことにより、解像度ごとの8枚の微分画像<7:0>を含む8×(N−n+1)枚の微分画像<N:n><7:0>(第1の微分画像)を生成するよう構成される。
低解像度ピラミッド生成部24の基本的な動作原理については、高解像度ピラミッド生成部22と同様であるので、詳しい説明は省略する。ただし、低解像度ピラミッド生成部24は、8枚の微分画像<n−1><7:0>のそれぞれをダウンサンプリング及びフィルタリングの対象とし、N−n+1段階にわたって処理を繰り返すよう構成される。1段分のダウンサンプリングによる解像度の低下量は、高解像度ピラミッド生成部22と同様、画像の一辺のサイズが半分になる量に予め調節される。
低解像度テンプレート生成部25は、低解像度ピラミッド生成部24から供給される微分画像<k><7:0>(kはnからNの整数)を8方向エッジ検出部10に供給し、その結果として8方向エッジ検出部10から出力される非極大抑制画像<k><7:0>に基づき、微分画像<k><7:0>の解像度に対応するテンプレートを生成する機能部である。低解像度テンプレート生成部25は、nからNのN−n+1個のkそれぞれについて、このテンプレートの生成を行うよう構成される。
低解像度テンプレート生成部25は、図5に示すように、画像取得部25a、勾配値取得部25b、エッジ特徴点群生成部25c、単位回転角算出部25d、回転処理部25eを有して構成される。これらの機能部の動作は、基本的に、図4に示した高解像度ピラミッド生成部22内の各機能部の動作と同様である。以下、異なる点のみを説明する。
画像取得部25aには、濃淡画像ではなく微分画像<k><7:0>が供給される。画像取得部25aは、これを8方向エッジ検出部10に供給する。その結果として8方向エッジ検出部10から低解像度テンプレート生成部25に供給される画像は、図4に示した高解像度ピラミッド生成部22の例と同様、微分画像<k><7:0>及び非極大抑制画像<k><7:0>となる。なお、高解像度ピラミッド生成部22の画像取得部23aは、こうして供給された画像のうち微分画像<n−1><7:0>を低解像度ピラミッド生成部24に出力していたが、画像取得部25aはそのような出力は行わない。
8方向エッジ検出部10から供給された微分画像<k><7:0>及び非極大抑制画像<k><7:0>を受け、勾配値取得部25b、エッジ特徴点群生成部25c、単位回転角算出部25d、回転処理部25eは、図4に示した勾配値取得部23b、エッジ特徴点群生成部23c、単位回転角算出部23d、回転処理部23eと同様の処理を行う。これにより、図3に示すように、それぞれテンプレートである複数のエッジ特徴点群<n><m:0>〜<N><m:0>が生成される。
図1に戻り、マッチング処理部30は、探索対象画像入力受付部4から供給される探索対象画像を8方向エッジ検出部10に供給し、その結果として8方向エッジ検出部10から供給されるエッジ距離画像<7:0>(8枚の非極大抑制画像<7:0>に基づいて生成される8枚の画像)と、テンプレート生成部20により生成されたテンプレート(エッジ特徴点群)とに基づいて、探索対象画像内における基準画像のポーズを示すポーズ情報を取得する機能を有して構成される。
図6〜図8を参照して、マッチング処理部30の機能について詳しく説明する。マッチング処理部30は、図6に示すように、高解像度ピラミッド生成部31、画像取得部32、低解像度ピラミッド生成部33、全探索処理部34、及び周辺探索処理部35を有して構成される。
高解像度ピラミッド生成部31(第2の高解像度ピラミッド生成部)は、探索対象画像入力受付部4から供給される探索対象画像について、n−2段階(nは設定値入力受付部3から供給される値)にわたり、ガウシアンフィルターを適用しつつダウンサンプリング(低解像度化)を行い、さらに、各段階で得られるダウンサンプリング後の画像に差分フィルターを適用するように構成される。1段分のダウンサンプリングによる解像度の低下量は、画像の一辺のサイズが半分になる量に予め調節される。高解像度ピラミッド生成部31の具体的な機能はテンプレート生成部20内の高解像度ピラミッド生成部22と同様であるので、詳しい説明は省略する。最終的に、高解像度ピラミッド生成部31は、探索対象画像そのものである濃淡画像<1>を含むn−1枚の濃淡画像<n−1:1>(複数の第2の濃淡画像)を生成し、周辺探索処理部35に供給する。また、濃淡画像<n−1:1>のうち最も解像度が低い濃淡画像<n−1>に限り、画像取得部32にも供給する。
画像取得部32は、高解像度ピラミッド生成部31から供給された濃淡画像<n−1>を8方向エッジ検出部10に供給し、その結果として8方向エッジ検出部10から供給される微分画像<n−1><7:0>を低解像度ピラミッド生成部33に供給するよう構成される。
低解像度ピラミッド生成部33(第2の低解像度ピラミッド生成部)は、画像取得部32から供給される微分画像<n−1><7:0>それぞれの解像度をN−n+1段階にわたって落とすことにより、解像度ごとの8枚の微分画像<7:0>を含む複数の微分画像(第2の微分画像)を生成するように構成される。1段分のダウンサンプリングによる解像度の低下量は、画像の一辺のサイズが半分になる量に予め調節される。低解像度ピラミッド生成部33の具体的な機能はテンプレート生成部20内の低解像度ピラミッド生成部24と同様であるので、詳しい説明は省略する。最終的に、低解像度ピラミッド生成部33は、N−n+1組の8枚の微分画像<N:n><7:0>(複数の第2の微分画像)を生成し、そのうち微分画像<N><7:0>を全探索処理部34に、残りの微分画像<N−1:n><7:0>を周辺探索処理部35にそれぞれ供給する。
全探索処理部34は、低解像度ピラミッド生成部33から供給される微分画像<N><7:0>と、テンプレート生成部20から供給されるエッジ特徴点群<N><m:0>とに基づいて、探索対象画像内における基準画像のポーズの候補であるA+1個のポーズ情報候補<N><A:0>を取得する機能部である。なお、Aは探索の結果として得られる数値であり、予め決められているものではない。
全探索処理部34は、図7に示すように、画像取得部34a及び一致度空間取得部34bを有して構成される。
画像取得部34aは、低解像度ピラミッド生成部33から供給される微分画像<N><7:0>を8方向エッジ検出部10に供給し、その結果として8方向エッジ検出部10から供給されるエッジ距離画像<N><7:0>を一致度空間取得部34bに供給するよう構成される。
一致度空間取得部34bは、テンプレート生成部20から供給されるm+1個のエッジ特徴点群<N><m:0>ごとに、エッジ距離画像<N><7:0>の各画素を原点位置(左上位置)として、エッジ特徴点群内の各エッジ点とエッジ距離画像<N><7:0>内の各画素との一致度を算出する機能を有して構成される。以下、図10も参照しながら詳しく説明する。
一致度空間取得部34bは、まずエッジ特徴点群<N><0>に着目し、さらに、左上から順にエッジ距離画像<N><0>の座標に順次着目する。図10には、ある瞬間に一致度空間取得部34bが着目した座標(XOFF,YOFF)を図示している。一致度空間取得部34bによる一致度の算出処理では、エッジ距離画像<N><0>のうち、着目した座標(XOFF,YOFF)を左上として、X方向の幅XtempかつY方向の幅Ytempの領域が処理対象となる。ここで、X方向の幅Xtempは、エッジ特徴点群<N><0>に含まれる各画素のX座標のうち最大のものから最小のものを減じた値、つまりエッジ特徴点群<N><0>のX方向の幅であり、Y方向の幅Ytempは、エッジ特徴点群<N><0>に含まれる各画素のY座標のうち最大のものから最小のものを減じた値、つまりエッジ特徴点群<N><0>のY方向の幅である。エッジ特徴点群<N><0>内の各エッジ点は、処理対象領域内のいずれかの画素と対応することになる。
座標(XOFF,YOFF)に着目した一致度空間取得部34bは、エッジ特徴点群<N><0>内の各エッジ点について、次の式(12)及び式(13)により、エッジ距離画像<N><0>内の対応する画素との一致度を算出する。ただし、関数D(x,y,dir)は、対応する微分方向がdirであるエッジ距離画像上の座標(x,y)に設定されているエッジ距離ED(式(4)参照)である。また、Tx(i)、Ty(i)、Tdir(i)、Td(i)はそれぞれ、エッジ特徴点群に含まれるi番目のエッジ点のx座標、y座標、量子化勾配方向QG(i)、及びサブピクセル変位量Δxである。Vは、設定値入力受付部3から供給される変形許容量であり、S(i)は、エッジ特徴点群に含まれるi番目のエッジ点について算出された一致度である。
Figure 2015210690
以上のようにしてエッジ特徴点群<N><0>内の各エッジ点について一致度S(i)を算出した一致度空間取得部34bは、次の式(14)により、その平均値Scoreを算出する。ただし、Nは、エッジ特徴点群<N><0>に含まれるエッジ点の個数である。
Figure 2015210690
一致度空間取得部34bは、X軸、Y軸、θ軸で特定される投票空間内の各座標に、上記のようにして算出した平均値Scoreを対応付ける。ただし、θ座標は、エッジ特徴点群に対応する回転角に対応させる。上記の場合では、一致度空間取得部34bは、X座標XOFF、Y座標YOFF、θ座標0°(エッジ特徴点群<N><0>に対応する回転角)の点に、平均値Scoreを対応付けることになる。
一致度空間取得部34bは、互いに回転角の異なるm+1個のエッジ特徴点群<N><m:0>と、互いに微分方向の異なる8枚のエッジ距離画像<N><7:0>とのすべての組み合わせについて、エッジ距離画像内のすべての画素に順次着目しながら(座標(XOFF,YOFF)を切り替えながら)、以上の処理を実行する。ただし、微分方向が45°、135°、225°、315°に対応するエッジ距離画像<N><1,3,5,7>に関しては、式(13)に代えて式(15)を用いる。これは、これらの画像の画素間距離が、エッジ距離画像<N><0,2,4,6>に比べて2の平方根倍になることに対応するものである。
Figure 2015210690
一致度空間取得部34bの上記処理により、最終的に、X軸、Y軸、θ軸で特定される投票空間内の各座標に、平均値Scoreが対応づけられる。一致度空間取得部34bはさらに、その中で極大値を構成している座標を取得する。そして、取得した1つ以上の座標(X,Y,θ)を、A+1個のポーズ情報候補<N><A:0>として出力する。A+1は、一致度空間取得部34bが取得した座標の数である。
全探索処理部34は、以上のようにして取得したポーズ情報候補<N><A:0>を、周辺探索処理部35に供給するよう構成される。
周辺探索処理部35は、ポーズ情報候補<N><A:0>のそれぞれに基づいて微分画像<N−1:n><7:0>及び濃淡画像<n−1:1>のそれぞれから画像を抽出し、さらに、抽出した画像(抽出画像)とテンプレート生成部20から供給されるエッジ特徴点群<1><m:0>〜<N−1><mN−1:0>とに基づいてポーズ情報を取得する機能部である。より具体的には、解像度ごとに、該解像度に対応する抽出画像が入力画像である場合に8方向エッジ検出部10により生成される8枚のエッジ距離画像と、該解像度に対応するエッジ特徴点群(テンプレート)とに基づいて、探索対象画像内における基準画像のポーズの候補である少なくとも1つのポーズ情報候補を取得するよう構成される。画像認識装置1の最終的な出力であるポーズ情報は、最も高い解像度に対応して周辺探索処理部35が取得する少なくとも1つのポーズ情報候補の中から、周辺探索処理部35により選択される。
周辺探索処理部35は、図8(a)(b)に示すように、座標変換処理部35a、テンプレート選択部35b、処理領域抽出部35c、画像取得部35d、一致度空間取得部35e、及び最終回答選択部35fを有して構成される。周辺探索処理部35は、これらの機能部を用いて、低い解像度から順に処理対象の解像度を上げながら、N−1段階の処理を行うよう構成される。このN−1段階の処理のそれぞれにおいて、周辺探索処理部35は、A+1個のポーズ情報候補<N><A:0>のそれぞれに対応するポーズ情報候補を取得する。図8(a)には、このうちk段階目(kは1からN−1の整数)の処理かつa番目(aは0からAの整数)のポーズ情報候補<k><a>に関する部分を図示している。
なお、本実施の形態による周辺探索処理部35は、上記各段階のそれぞれでA+1個のポーズ情報候補を取得するよう構成される。つまり、全探索処理部34が取得したポーズ情報候補の数は周辺探索処理部35の処理の間維持されるが、ある段階で算出した平均値Scoreが例えば予め決められた所定値を下回るようなポーズ情報候補については、その段階以降、処理の対象としないこととしてもよい。こうすることで、正しい回答である可能性の低いポーズ情報候補を処理対象から除去し、処理コストを低減することが可能になる。
以下、図8(a)に示したk段階目の処理かつa番目のポーズ情報候補<k><a>に関する周辺探索処理部35の動作を例に取って説明する。なお、kは、N−1から1まで1ずつデクリメントされる。
座標変換処理部35aは、k=N−1の場合には全探索処理部34(図6)からポーズ情報候補<N><a>を取得し、k<N−1の場合には一致度空間取得部35eからひとつ前の段階で生成されたポーズ情報候補<k+1><a>を取得する。そして、取得したポーズ情報候補に座標変換処理を施す。この処理は、相対的に前段の処理で使用される各画像と、相対的に後段の処理で使用される各画像とで、解像度が異なるために必要となるものである。本実施の形態では、上述したように、1段階の処理で画像の一辺のサイズが半分になるように、画像のダウンサンプリングを行っている。したがって、座標変換処理部35aは、ポーズ情報候補<k+1><a>により示される座標(X,Y,θ)のX座標及びY座標をそれぞれ2倍することにより、座標変換を行うことになる。座標変換処理部35aは、座標変換後のポーズ情報候補<k+1><a>のうち、X座標及びY座標を処理領域抽出部35cに、θ座標をテンプレート選択部35bにそれぞれ供給する。
テンプレート選択部35bは、テンプレート生成部20(図1)から供給されるm+1個のエッジ特徴点群<k><m:0>の中から、座標変換処理部35aから供給されるθ座標に基づいて、7個を選択する機能を有している。具体的な例では、対応する回転角がθ座標に等しいものと、対応する回転角がθ座標にプラス側で近いものから順に3つと、対応する回転角がθ座標にマイナス側で近いものから順に3つとを選択する。以下、こうして選択されるものをエッジ特徴点群<k><s+3:s−3>と表わし、それぞれに対応する回転角をθs−3〜θs+3と表わす。テンプレート選択部35bは、選択したエッジ特徴点群<k><s+3:s−3>を一致度空間取得部35eに供給するとともに、対応する回転角θs−3〜θs+3を処理領域抽出部35cに供給する。また、テンプレート選択部35bは、回転角0°に対応するエッジ特徴点群<k><0>に関して上述したX方向の幅Xtemp及びY方向の幅Ytemp(図10参照)を取得し、それぞれX方向の幅Xtemp0及びY方向の幅Ytemp0として処理領域抽出部35cに供給する。
処理領域抽出部35cは、k≧nの場合には低解像度ピラミッド生成部33(図6)から8枚の微分画像<k><7:0>を取得し、k<nの場合には高解像度ピラミッド生成部31(図6)から濃淡画像<k>を取得する。そして、座標変換処理部35aから供給されるX座標及びY座標と、テンプレート選択部35bから供給される回転角θs−3〜θs+3及び幅Xtemp0,Ytemp0とに基づき、取得した画像から処理領域を抽出する。より具体的に説明すると、処理領域抽出部35cは、テンプレート選択部35bから供給される回転角θs−3〜θs+3及び幅Xtemp0,Ytemp0に基づき、まず回転角θs−3〜θs+3のそれぞれに対応する処理領域の幅Xtemp,Ytempを算出する。そして、座標変換処理部35aから供給されるX座標及びY座標を左上としてX方向の幅XtempかつY方向の幅Ytempの領域をまず取得し、さらにそこからX,Y方向に±V(Vは、設定値入力受付部3から供給される変形許容量)だけ拡大した領域を処理領域として抽出する。処理領域抽出部35cは、こうして抽出した抽出画像<k><7:0><s+3:s−3><a>(k≧nの場合)及び抽出画像<k><s+3:s−3><a>(k<nの場合)を、画像取得部35dに供給する。
画像取得部35dは、処理領域抽出部35cから供給される上記画像を8方向エッジ検出部10に供給し、その結果として8方向エッジ検出部10から供給されるエッジ距離画像<k><7:0><s+3:s−3><a>を一致度空間取得部35eに供給するよう構成される。
一致度空間取得部35eは、テンプレート選択部35bから供給されるエッジ特徴点群<k><s+3:s−3>ごとに、エッジ特徴点群内の各エッジ点とエッジ距離画像<k><7:0><s+3:s−3><a>内の各画素との一致度を算出する機能を有して構成される。この一致度の具体的な算出方法は上述した一致度空間取得部34bによるものと同様であるので、詳しい説明は省略する。最終的に、一致度空間取得部35eは、ポーズ情報候補<k><a>を取得し、k>1である場合には、取得したポーズ情報候補<k><a>を座標変換処理部35aに供給する。こうして取得されたポーズ情報候補<k><a>は通常、抽出画像内に対象物が含まれている場合、ポーズ情報候補<k+1><a>より高い精度で、抽出画像内の基準画像の位置を示すものとなる。
k=1である場合の一致度空間取得部35eは、図8(b)に示すように、A+1個のポーズ情報候補<1><A:0>と、それぞれについて算出した平均値Score<A:0>とを最終回答選択部35fに供給する。これを受けた最終回答選択部35fは、A+1個のポーズ情報候補<1><A:0>の中から平均値Scoreが最も大きいものを選択し、画像認識装置1の最終回答であるポーズ情報として出力する。
以上説明したように、本実施の形態による画像認識装置1によれば、8方向エッジ検出部10によるエッジ点の決定(微分処理及び非極大抑制処理)を、勾配方向ではなく所定数(8)の微分方向のそれぞれに基づいて行っているので、探索対象画像内において背景や対象物に外観上の変化が発生しても、高い精度で認識を行うことが可能になる。
また、画像認識装置1では、探索対象画像を、単なるエッジ画像(非極大抑制画像)ではなく、変形許容量Vだけエッジに幅を持たせたエッジ距離画像としている。つまり、エッジポテンシャル表現によりエッジの冗長性を制御しているので、エッジの変形を伴うような対象物の外観上の変化(誤差による変化を含む)が発生しても、高い精度で認識を行うことが可能になる。
さらに、画像認識装置1ではピラミッドアルゴリズムによる粗密探索を行っているが、解像度の低い画像を、濃淡画像ではなく、方向別微分画像生成部10aにより生成した微分画像により構成しているので、画像認識装置1では、低い解像度で細い線状の対象物が消えてしまうことが防止されている。したがって、ピラミッドアルゴリズムにおけるピラミッドの階層を従来に比べて深くすることができるので、対象物の認識に要する処理コストを従来に比べて低くすることが可能になるとともに、使用メモリ量の低減も可能となっている。
以上、本発明の好ましい実施の形態について説明したが、本発明はこうした実施の形態に何等限定されるものではなく、本発明が、その要旨を逸脱しない範囲において、種々なる態様で実施され得ることは勿論である。
例えば上記実施の形態ではピラミッドアルゴリズムによる粗密探索を行う場合を例に取って説明したが、本発明は、ピラミッドアルゴリズムによる粗密探索を行わない場合にも好適に適用できる。
また、上記実施の形態では変形許容量Vだけエッジに幅を持たせたエッジ距離画像を使用したが、本発明は、エッジ距離画像を使用しない場合(エッジ距離画像に代えて非極大抑制画像を用いる場合)にも好適に適用できる。
1 画像認識装置
2 基準画像入力受付部
3 設定値入力受付部
4 探索対象画像入力受付部
10 8方向エッジ検出部
10a 方向別微分画像生成部
10b 非極大抑制処理部
10c サブピクセル変位量算出部
10d エッジ距離画像生成部
20 テンプレート生成部
21 階層数算出部
22 高解像度ピラミッド生成部
23 高解像度テンプレート生成部
23a 画像取得部
23b 勾配値取得部
23c エッジ特徴点群生成部
23d 単位回転角算出部
23e 回転処理部
24 低解像度ピラミッド生成部
25 低解像度テンプレート生成部
25a 画像取得部
25b 勾配値取得部
25c エッジ特徴点群生成部
25d 単位回転角算出部
25e 回転処理部
30 マッチング処理部
31 高解像度ピラミッド生成部
32 画像取得部
33 低解像度ピラミッド生成部
34 全探索処理部
34a 画像取得部
34b 一致度空間取得部
35 周辺探索処理部
35a 座標変換処理部
35b テンプレート選択部
35c 処理領域抽出部
35d 画像取得部
35e 一致度空間取得部
35f 最終回答選択部

Claims (7)

  1. 基準画像の入力を受け付ける基準画像入力受付部と、
    探索対象画像の入力を受け付ける探索対象画像入力受付部と、
    入力画像を所定数の微分方向のそれぞれで微分することにより前記所定数の微分画像を生成し、さらに該所定数の微分画像のそれぞれについて対応する微分方向での非極大抑制処理を行うことにより前記所定数の非極大抑制画像を生成するエッジ検出部と、
    前記基準画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数の非極大抑制画像に基づいてテンプレートを生成するテンプレート生成部と、
    前記探索対象画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数の非極大抑制画像のそれぞれに基づいて生成される前記所定数の画像と、前記テンプレートとに基づいて前記探索対象画像内における前記基準画像のポーズを示すポーズ情報を取得するマッチング処理部と
    を備えることを特徴とする画像認識装置。
  2. 前記エッジ検出部は、
    前記所定数の微分画像のそれぞれについて対応する微分方向での非極大抑制処理を行うことにより、前記所定数の仮非極大抑制画像を生成する非極大抑制処理部と、
    前記所定数の仮非極大抑制画像のそれぞれに含まれるエッジ点ごとに、対応する前記微分画像に基づき、対応する微分方向における該エッジ点の中心線と、該エッジ点に対応するエッジとの間の距離を示すサブピクセル変位量を算出し、各エッジ点について算出したサブピクセル変位量を前記所定数の仮非極大抑制画像のそれぞれに設定することにより、前記所定数の非極大抑制画像を生成するサブピクセル変位量算出部と、
    前記所定数の非極大抑制画像のそれぞれに含まれる1又は複数のエッジ点それぞれの近傍に位置する複数の画素ごとに、対応するエッジ点に設定された前記サブピクセル変位量に基づいて、該画素と対応するエッジとの間の距離を示すエッジ距離を算出し、対応する前記非極大抑制画像に設定することにより、前記所定数のエッジ距離画像を生成するエッジ距離画像生成部とを有し、
    前記所定数の画像は、前記所定数のエッジ距離画像である
    ことを特徴とする請求項1に記載の画像認識装置。
  3. 前記テンプレート生成部は、
    前記基準画像の解像度を複数段階にわたって落とすことにより、前記基準画像と、解像度ごとの濃淡画像とを含む複数の第1の濃淡画像を生成する第1の高解像度ピラミッド生成部と、
    解像度ごとに、前記第1の濃淡画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数の非極大抑制画像に基づいて前記テンプレートを生成する高解像度テンプレート生成部と、
    前記複数の第1の濃淡画像のうちの最も解像度が低いものが前記入力画像である場合に前記エッジ検出部により生成される前記所定数の微分画像それぞれの解像度を複数段階にわたって落とすことにより、解像度ごとの前記所定数の微分画像を含む複数の第1の微分画像を生成する第1の低解像度ピラミッド生成部と、
    解像度ごとに、前記所定数の第1の微分画像のそれぞれについて対応する微分方向での非極大抑制処理を行うことによって生成される前記所定数の非極大抑制画像に基づいて前記テンプレートを生成する低解像度テンプレート生成部とを有し、
    前記マッチング処理部は、
    前記探索対象画像の解像度を複数段階にわたって落とすことにより、前記探索対象画像と、解像度ごとの濃淡画像とを含む複数の第2の濃淡画像を生成する第2の高解像度ピラミッド生成部と、
    前記複数の第2の濃淡画像のうちの最も解像度が低いものが前記入力画像である場合に前記エッジ検出部により生成される前記所定数の微分画像それぞれの解像度を複数段階にわたって落とすことにより、解像度ごとの前記所定数の微分画像を含む複数の第2の微分画像を生成する第2の低解像度ピラミッド生成部と、
    前記複数の第2の微分画像のうち最も低い解像度に対応する前記所定数の第2の微分画像と、前記解像度ごとのテンプレートのうち最も低い解像度に対応する前記テンプレートとに基づいて、それぞれ前記ポーズ情報の候補である少なくとも1つのポーズ情報候補を取得する全探索処理部と、
    前記複数の第2の微分画像のうち最も低い解像度以外の解像度に対応するもの及び前記複数の第2の濃淡画像のそれぞれから前記少なくとも1つのポーズ情報候補のそれぞれに基づいて抽出される抽出画像と、前記解像度ごとのテンプレートのうち最も低い解像度以外の解像度に対応する複数の前記テンプレートとに基づいて、前記ポーズ情報を取得する周辺探索処理部とを有する
    ことを特徴とする請求項1に記載の画像認識装置。
  4. 前記エッジ検出部は、
    前記所定数の微分画像のそれぞれについて対応する微分方向での非極大抑制処理を行うことにより、前記所定数の仮非極大抑制画像を生成する非極大抑制処理部と、
    前記所定数の仮非極大抑制画像のそれぞれに含まれるエッジ点ごとに、対応する前記微分画像に基づき、対応する微分方向における該エッジ点の中心線と、該エッジ点に対応するエッジとの間の距離を示すサブピクセル変位量を算出し、各エッジ点について算出したサブピクセル変位量を前記所定数の仮非極大抑制画像のそれぞれに設定することにより、前記所定数の非極大抑制画像を生成するサブピクセル変位量算出部と、
    前記所定数の非極大抑制画像のそれぞれに含まれる1又は複数のエッジ点それぞれの近傍に位置する複数の画素ごとに、対応するエッジ点に設定された前記サブピクセル変位量に基づいて、該画素と対応するエッジとの間の距離を示すエッジ距離を算出し、対応する前記非極大抑制画像に設定することにより、前記所定数のエッジ距離画像を生成するエッジ距離画像生成部とを有し、
    前記所定数の画像は、前記所定数のエッジ距離画像であり、
    前記周辺探索処理部は、解像度ごとに、該解像度に対応する前記抽出画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数のエッジ距離画像と、該解像度に対応する前記テンプレートとに基づいて、前記探索対象画像内における前記基準画像のポーズの候補である少なくとも1つのポーズ情報候補を取得するよう構成され、
    前記ポーズ情報は、最も高い解像度に対応して前記周辺探索処理部が取得する前記少なくとも1つのポーズ情報候補の中から選択される
    ことを特徴とする請求項3に記載の画像認識装置。
  5. 前記テンプレート生成部は、
    前記基準画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数の微分画像のうちの少なくとも一部に基づいて、量子化された勾配方向が各画素に設定された微分方向画像を生成する勾配値取得部と、
    前記基準画像が前記入力画像である場合に前記エッジ検出部により生成される前記所定数の非極大抑制画像に含まれる複数のエッジ点それぞれについて前記微分方向画像から量子化された勾配方向を取得し、該複数のエッジ点それぞれの座標及び量子化された勾配方向を示すエッジ特徴点群を生成するエッジ特徴点群生成部とを有し、
    前記テンプレートは前記エッジ特徴点群を含んで構成される
    ことを特徴とする請求項1に記載の画像認識装置。
  6. 前記テンプレート生成部は、
    前記エッジ特徴点群に基づいて単位回転角を算出する単位回転角算出部と、
    前記単位回転角に基づいて前記エッジ特徴点群を回転させることにより、前記エッジ特徴点群を含む複数のエッジ特徴点群を取得する回転処理部とをさらに有し、
    前記テンプレートは前記複数のエッジ特徴点群を含んで構成される
    ことを特徴とする請求項5に記載の画像認識装置。
  7. 前記所定数の微分方向は、360°を8つに等分割することにより得られる8つの方向である
    ことを特徴とする請求項1乃至6のいずれか一項に記載の画像認識装置。
JP2014092294A 2014-04-28 2014-04-28 画像認識装置 Active JP5685665B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014092294A JP5685665B1 (ja) 2014-04-28 2014-04-28 画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014092294A JP5685665B1 (ja) 2014-04-28 2014-04-28 画像認識装置

Publications (2)

Publication Number Publication Date
JP5685665B1 JP5685665B1 (ja) 2015-03-18
JP2015210690A true JP2015210690A (ja) 2015-11-24

Family

ID=52822306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014092294A Active JP5685665B1 (ja) 2014-04-28 2014-04-28 画像認識装置

Country Status (1)

Country Link
JP (1) JP5685665B1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993800B (zh) * 2019-03-18 2023-01-03 五邑大学 一种工件尺寸的检测方法、装置及存储介质
CN112085033B (zh) * 2020-08-19 2024-04-09 浙江华睿科技股份有限公司 一种模板匹配方法、装置、电子设备及存储介质
CN117115242B (zh) * 2023-10-17 2024-01-23 湖南视比特机器人有限公司 标志点的识别方法、计算机存储介质和终端设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3027680B2 (ja) * 1994-02-23 2000-04-04 松下電工株式会社 部品認識方法
JP2992446B2 (ja) * 1994-10-26 1999-12-20 松下電工株式会社 画像認識方法およびその装置
JP2000207556A (ja) * 1998-11-10 2000-07-28 Matsushita Electric Ind Co Ltd パタ―ンマッチング方法と装置
JP4082190B2 (ja) * 2002-11-26 2008-04-30 松下電工株式会社 人の存在位置検出装置とその検出方法及び同検出装置を用いた自律移動装置
JP2005128635A (ja) * 2003-10-21 2005-05-19 Sumitomo Bakelite Co Ltd 画像処理装置
JP4540661B2 (ja) * 2006-02-28 2010-09-08 三洋電機株式会社 物体検出装置

Also Published As

Publication number Publication date
JP5685665B1 (ja) 2015-03-18

Similar Documents

Publication Publication Date Title
JP5699788B2 (ja) スクリーン領域検知方法及びシステム
JP5923824B2 (ja) 画像処理装置
US8780223B2 (en) Automatic determination of compliance of a part with a reference drawing
EP3497618B1 (en) Independently processing plurality of regions of interest
JP5806786B1 (ja) 画像認識装置
US20100063612A1 (en) System and method for the on-machine 2-d contour measurement
WO2013061976A1 (ja) 形状検査方法およびその装置
KR101670270B1 (ko) 알려진 형상의 기준을 탐사하는 시스템 및 방법
US11512946B2 (en) Method and system for automatic focusing for high-resolution structured light 3D imaging
JP5685665B1 (ja) 画像認識装置
US11450140B2 (en) Independently processing plurality of regions of interest
Wang et al. A high-precision Mark positioning algorithm based on sub-pixel shape template matching in wafer bonding alignment
KR20150003573A (ko) 영상 패턴 검출 방법 및 그 장치
CN111199533B (zh) 图像处理装置
EP2691939B1 (en) Automatic determination of compliance of a part with a reference drawing
Li et al. Deep learning-based interference fringes detection using convolutional neural network
JP2008052598A (ja) 画像位置計測方法、画像位置計測装置、および画像位置計測プログラム
JP6198104B2 (ja) 3次元物体認識装置及び3次元物体認識方法
JP5904168B2 (ja) 撮像画像の特徴点抽出方法および特徴点抽出装置
WO2018135326A1 (ja) 画像処理装置、画像処理システム、画像処理プログラム、及び画像処理方法
US20200286248A1 (en) Structured light subpixel accuracy isp pipeline/fast super resolution structured light
Metzner et al. Automatic camera calibration and sensor registration of a multi-sensor fringe measurement system using hexapod positioning
US20220230459A1 (en) Object recognition device and object recognition method
JP2017162251A (ja) 3次元非接触入力装置
Lin et al. Design and control of an optical alignment system using a XXY stage integrated with dual CCDs

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150119

R150 Certificate of patent or registration of utility model

Ref document number: 5685665

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250