JP4946878B2 - 画像識別装置及びプログラム - Google Patents

画像識別装置及びプログラム Download PDF

Info

Publication number
JP4946878B2
JP4946878B2 JP2008003276A JP2008003276A JP4946878B2 JP 4946878 B2 JP4946878 B2 JP 4946878B2 JP 2008003276 A JP2008003276 A JP 2008003276A JP 2008003276 A JP2008003276 A JP 2008003276A JP 4946878 B2 JP4946878 B2 JP 4946878B2
Authority
JP
Japan
Prior art keywords
feature
identification
image
feature point
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008003276A
Other languages
English (en)
Other versions
JP2009163682A (ja
Inventor
晃一郎 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP2008003276A priority Critical patent/JP4946878B2/ja
Publication of JP2009163682A publication Critical patent/JP2009163682A/ja
Application granted granted Critical
Publication of JP4946878B2 publication Critical patent/JP4946878B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、画像識別装置及びプログラムに係り、特に、画像がどの識別対象物を表わしているかを識別する画像識別装置及びプログラムに関する。
従来より、対象画像に対して、色やテクスチャなどの特徴量を用いて、小領域に分割してから、類似する小領域を統合して、画像をセグメント化するコンピュータシステムが知られている(特許文献1)。
また、色、テクスチャ、動きなどの複数の特徴量を用いて、特徴量ごとに領域を分割し、それら複数の分割結果の重なりから領域を統合して、対象画像の領域分割を行う領域分割装置が知られている(特許文献2)。
特開2003−173442号公報 特開2006−127024号公報
しかしながら、上記の特許文献1に記載の技術では、領域の分割に、色やテクスチャ情報を用いており、照明環境の変動や、物体のパターンの多様性に対する影響を受けやすいため、様々な状況の画像を安定して識別することができない、という問題がある。また、上記の特許文献2に記載の技術では、領域の分割に動き情報を用いており、すべての画素について、正確な動きを求めることは難しいため、様々な状況の画像を安定して識別することができない、という問題がある。
本発明は、上記の問題点を解決するためになされたもので、識別対象画像が、どの識別対象物を表しているかを安定して識別することができる画像識別装置及びプログラムを提供することを目的とする。
上記の目的を達成するために本発明に係る画像識別装置は、複数種類の識別対象物を撮像することにより得られた学習画像の前記識別対象物を表わす領域内に定めた注目画素と、前記学習画像から抽出された特徴点であって、かつ、該注目画素の周辺に存在する周辺特徴点との位置関係、及び前記周辺特徴点の特徴量を、前記識別対象物毎に記憶した記憶手段と、前記識別対象画像から複数の前記特徴点を抽出する特徴点抽出手段と、前記特徴点抽出手段によって抽出された前記複数の特徴点の各々について、前記特徴量を算出する特徴量算出手段と、前記識別対象画像内の各対象画素について、前記抽出された前記特徴点であって、かつ、前記対象画素の周辺に存在する周辺特徴点と前記対象画素との位置関係、及び前記周辺特徴点について算出された前記特徴量と、前記記憶手段に記憶された前記位置関係及び前記周辺特徴点の前記特徴量とを比較して、前記対象画素が、前記複数種類の識別対象物の何れを表わしているかを識別する識別手段とを含んで構成されている。
本発明に係るプログラムは、コンピュータを、複数種類の識別対象物を撮像することにより得られた学習画像の前記識別対象物を表わす領域内に定めた注目画素と、前記学習画像から抽出された特徴点であって、かつ、該注目画素の周辺に存在する周辺特徴点との位置関係、及び前記周辺特徴点の特徴量を、前記識別対象物毎に記憶した記憶手段、前記識別対象画像から複数の前記特徴点を抽出する特徴点抽出手段、前記特徴点抽出手段によって抽出された前記複数の特徴点の各々について、前記特徴量を算出する特徴量算出手段、及び前記識別対象画像内の各対象画素について、前記抽出された前記特徴点であって、かつ、前記対象画素の周辺に存在する周辺特徴点と前記対象画素との位置関係、及び前記周辺特徴点について算出された前記特徴量と、前記記憶手段に記憶された前記位置関係及び前記周辺特徴点の前記特徴量とを比較して、前記対象画素が、前記複数種類の識別対象物の何れを表わしているかを識別する識別手段として機能させるためのプログラムである。
本発明によれば、複数種類の識別対象物を撮像することにより得られた学習画像の識別対象物を表わす領域内に定めた注目画素と、学習画像から抽出された特徴点であって、かつ、該注目画素の周辺に存在する周辺特徴点との位置関係、及び周辺特徴点の特徴量を、記憶手段に識別対象物毎に記憶しておく。
そして、特徴点抽出手段によって、識別対象画像から複数の特徴点を抽出する。特徴量算出手段によって、特徴点抽出手段によって抽出された複数の特徴点の各々について、特徴量を算出する。
そして、識別手段によって、識別対象画像内の各対象画素について、抽出された特徴点であって、かつ、対象画素の周辺に存在する周辺特徴点と対象画素との位置関係、及び周辺特徴点について算出された特徴量と、記憶手段に記憶された位置関係及び周辺特徴点の特徴量とを比較して、対象画素が、複数種類の識別対象物の何れを表わしているかを識別する。
このように、対象画素の周辺に存在する周辺特徴点と対象画素との位置関係、及び周辺特徴点の特徴量を用いることにより、識別対象画像内の対象画素が、どの識別対象物を表わしているかを安定して識別することができる。
本発明に係る特徴量算出手段は、複数の特徴点の各々について、特徴量として、特徴点のエッジ方向に関する物理量、特徴点の輝度に関する物理量、及び特徴点の3次元位置の少なくとも一つを算出することができる。これによって、画像を撮像した環境によって変動しない特徴点の特徴量を用いることができる。
上記の識別対象画像及び前記学習画像の各々を、車両に搭載された撮像装置によって撮像された画像とすることができる。
本発明に係る記憶手段は、注目画素に対して周辺の所定位置にある所定領域内に存在する周辺特徴点の特徴量を、識別対象物毎に記憶し、識別手段は、識別対象画像の各対象画素について、対象画素に対して所定位置にある所定領域内に存在する周辺特徴点の特徴量と、記憶手段に記憶された周辺特徴点の特徴量とを比較して、対象画素が、複数種類の識別対象物の何れを表わしているかを識別することができる。これによって、対象画素に対して所定位置にある所定領域内に存在する周辺特徴点の特徴量を用いることにより、識別対象画像内の対象画素が、どの識別対象物を表わしているかを安定して識別することができる。
本発明に係る記憶手段は、位置関係、及び周辺特徴点の特徴量が属する複数の分類の何れかを、識別対象物毎に記憶し、特徴量算出手段は、複数の特徴点の各々について、特徴量を算出し、算出した特徴量が属する分類を特定し、識別手段は、識別対象画像の各対象画素について、周辺特徴点と対象画素との位置関係、及び周辺特徴点の特徴量が属する分類と、記憶手段に記憶された位置関係、及び周辺特徴点の特徴量が属する分類とを比較して、対象画素が、複数種類の識別対象物の何れを表わしているかを識別することができる。
本発明に係る画像識別装置は、識別手段による識別結果に基づいて、識別対象画像を、各識別対象物を表わす領域に分割する領域分割手段を更に含むことができる。これによって、識別対象画像を、各識別対象物を表わす領域に安定して分割することができる。
以上説明したように、本発明の画像識別装置及びプログラムによれば、対象画素の周辺に存在する周辺特徴点と対象画素との位置関係、及び周辺特徴点の特徴量を用いることにより、識別対象画像内の対象画素が、どの識別対象物を表わしているかを安定して識別することができる、という効果が得られる。
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、車両に搭載され、かつ、撮像画像を、各識別対象物を表わす領域に分割する画像識別装置に本発明を適用した場合を例に説明する。
図1に示すように、第1の実施の形態に係る画像識別装置10は、車両(図示省略)に取り付けられ、かつ、車両の前方を撮像して画像を生成する撮像装置12と、撮像装置12から得られる撮像画像を、各識別対象物を表わす領域に分割するコンピュータ14と、コンピュータ14による領域分割の結果を表示する表示装置16とを備えている。
撮像装置12は、車両の前方を撮像し、画像の画像信号を生成する撮像部(図示省略)と、撮像部で生成された画像信号をA/D変換するA/D変換部(図示省略)と、A/D変換された画像信号を一時的に格納するための画像メモリ(図示省略)とを備えている。
コンピュータ14は、CPUと、RAMと、後述する学習処理ルーチン及び画像識別処理ルーチンの各々を実行するためのプログラムを記憶したROMとを備え、機能的には次に示すように構成されている。コンピュータ14は、撮像装置12から撮像された画像を取得する画像取得部20と、画像取得部20により取得した撮像画像から、画像上で追跡しやすい特徴点を複数抽出する特徴点抽出部22と、抽出された特徴点の各々について、特徴点の周囲における各エッジ方向のヒストグラムを算出して、各エッジ方向のヒストグラムを示す特徴ベクトルを生成すると共に、特徴ベクトルが後述するどの分類に属するかを特定して、特定された特徴ベクトルに関する分類を、特徴点の情報として求める特徴点特徴量算出部24と、取得した撮像画像の各画素について、画素の周辺に存在する周辺特徴点の分類を用いて、画素の特徴ベクトルを算出する画素特徴量算出部26と、後述する学習処理によって予め求められた画素の特徴ベクトルと識別対象物ラベルとの関係を記憶した特徴量記憶部28と、算出された画素の特徴ベクトル、及び記憶した画素の特徴ベクトルと対象物ラベルとの関係に基づいて、撮像画像の各画素がどの識別対象物(たとえば、人、車両、路面、木、建物、空など)を表わしているかを識別する識別部30と、同じ識別対象物を表している隣接する画素を、同一の領域とすることにより、撮像画像の領域分割を行う領域分割部32とを備えている。
特徴点抽出部22は、図2(A)や図3(A)に示すように、撮像装置12から得られる撮像画像から、特徴点を複数抽出する。特徴点とは、周囲の点と区別でき、異なる画像間で対応関係を求めることが容易な点のことを指す。特徴点は、2次元的に濃淡変化の勾配値が大きくなる画素を検出する方法(例えばHarrisオペレータなど)を用いて、自動的に抽出される。Harrisオペレータを用いる方法では、以下に説明するように、特徴点を抽出する。
まず、画像の点(u,v)の輝度をI(u,v)として、以下の(1)式によって、行列Mを計算する。
ただし、I,Iはそれぞれ水平方向、垂直方向の微分、Gσは標準偏差σのガウス分布による平滑化を表す。
そして、上記(1)式で計算された行列Mの固有値λ、λを用いて、以下の(2)式によりコーナー強度を計算する。
ただし、kは、予め設定される定数であって、0.04〜0.06の値が一般に用いられる。そして、このコーナー強度がしきい値以上であってかつ極大となる点を選択し、選択された点を特徴点として抽出する。
特徴点特徴量算出部24は、以下に説明するように、各特徴点の特徴ベクトルの分類を算出する。まず、特徴点の周囲に、所定の大きさのウィンドウを設定し、ウィンドウ内の各画素について、勾配の大きさ及び方向を算出する。勾配の大きさは、以下の(3)式に従って算出される。
ただし、m(u,v)は、画像座標(u,v)での勾配の大きさを表わし、x(u,v)は、画像xの画像座標(u,v)の画素値を表わす。
また、勾配の方向は、以下の(4)式に従って算出される。
ただし、θ(u,v)は、画素座標(u,v)での勾配の方向を表わす。
そして、特徴点の周囲に設定したウィンドウを複数の小領域に分割し、各小領域について、図2(B)や図3(B)に示すようなエッジ方向のヒストグラムを作成する。エッジ方向のヒストグラムは、エッジ方向を所定の数に分割したヒストグラムであり、小領域内の各画素の勾配方向を勾配の大きさで重み付けして投票することにより、エッジ方向のヒストグラムを生成する。そして、全ての小領域のエッジ方向のヒストグラムを連結したベクトルを、特徴点の特徴ベクトルとして生成する。
そして、図4(B)、(C)に示すような、後述する全ての学習画像から得られた特徴ベクトルに関する複数の分類に基づいて、各特徴点の特徴ベクトルが、どの分類に属するかを特定し、特定された分類を、特徴点の分類とする。
画素特徴量算出部26は、撮像画像の各対象画素について、以下に説明するように、画素の特徴ベクトルを算出する。まず、図5(A)に示すように、対象画素の位置に対する相対位置(u,v)を中心とし、かつ、大きさをw×hとする矩形領域を設定し、その矩形領域内に存在する周辺特徴点の数及び周辺特徴点の特徴ベクトルの分類を用いて、画素の特徴ベクトルを算出する。例えば、矩形領域内に存在する周辺特徴点について、特徴点の情報として得られた特徴ベクトルに関する分類についてヒストグラムを生成する。図5(A)に示すような撮像画像に設定された矩形領域の場合、対象画素に対して設定された矩形領域内に分類2の周辺特徴点が2点存在するので、図5(B)に示すような、特徴点の特徴ベクトルに関する分類のヒストグラムが生成される。
上記の矩形領域の相対位置及び大きさとして、対象画素を識別しやすい矩形領域の相対位置及び大きさが、学習により予め定められている。また、上記の矩形領域として、相対位置と大きさが異なる複数の矩形領域が定められており、各矩形領域に対して生成された分類のヒストグラムを連結して、画素の特徴ベクトルを生成する。
なお、対象画素の特徴ベクトルは、対象画素の周辺に存在する周辺特徴点と対象画素との位置関係、及び周辺特徴点について算出された特徴量に対応している。
特徴量記憶部28は、上記と同様の画素の特徴ベクトルと識別対象物ラベルとの関係を記憶している。画素の特徴ベクトルと識別対象物ラベルとの関係は、以下に説明する学習方法により予め求められる。
まず、複数の識別対象物を撮像することにより得られた学習用の学習画像と、対応する識別対象物ラベル画像とを複数入力する。識別対象物ラベル画像は、各画素がどの種類の識別対象物を表しているかを示す識別対象物ラベルからなるデータである。そして、入力された各学習画像に対して、上記の特徴点抽出部22と同様に、特徴点を複数抽出する。次に、全ての学習画像から抽出された全ての特徴点に対して、上述したように、エッジ方向のヒストグラムを算出し、エッジ方向のヒストグラムを示す特徴ベクトルを生成する。すべての特徴点のエッジ方向のヒストグラムを示す特徴ベクトルをクラスタリングし、図4(B)、(C)のように、複数の分類に分ける。
そして、上記のように得られた特徴ベクトルに関する分類に基づいて、学習画像の各特徴点について、特徴点の特徴ベクトルに関する分類を特定する。
各特徴点について、特徴点の特徴ベクトルに関する分類が得られると、学習画像の各画素について、各画素と周辺特徴点との相対的な位置関係、及び周辺特徴点の特徴ベクトルに関する分類に基づいて、上記の画素特徴量算出部26と同様に、画素の特徴ベクトルを算出する。
全ての画素について画素の特徴ベクトルを計算すると、入力された識別対象物ラベル画像を用いて、各識別対象物と画素の特徴ベクトルとの関係について学習し、各識別対象物ラベルと、識別対象物を表わす領域内に定めた注目画素の特徴ベクトルとの関係を特徴量記憶部28に記憶する。
識別部30は、撮像画像の各対象画素について求められた画素の特徴ベクトルと、特徴量記憶部28に記憶された識別対象物ラベルと対応した注目画素の特徴ベクトルとを比較して、撮像画像の各画素が、どの識別対象物を表わしているかを識別する。
領域分割部32は、各画素の識別結果を用いて、以下に説明するように、撮像画像を領域分割する。まず、すべての画素を独立した領域として設定し、異なる領域に属し、かつ、隣接する画素の組の中で、同じ種類の識別対象物を表わしていると識別された組があれば、その組の画素が同じ領域となるように領域を統合する。この領域の統合処理を繰り返すことによって、画像の領域分割を行なう。
次に、本実施の形態の原理について説明する。画像を領域分割し、それぞれの画像領域が、どのような識別対象物を表わしているかを識別する問題では、従来、各画素の色やテクスチャ情報を特徴量として用いて、画素がどの種類の識別対象物を表わしているかを識別しており、色やテクスチャは照明環境の変動などに頑健ではない。
一方、画像中の特徴点については、画像の領域分割や識別のための強い手がかりとなる特徴量(エッジ方向の特徴や3次元位置など)を抽出することができるが、特徴点は画像中で粗い密度でしか抽出することができない。
本実施の形態では、画像の各画素に対して、周辺特徴点との相対的な位置関係と周辺特徴点のエッジ方向に関する物理量を、画素の特徴量とすることにより、特徴点でない画素の特徴量としても、頑健な特徴点の特徴量を利用することが可能となり、画像の領域分割及び識別を安定して行うことができる。
次に、本実施の形態に係る画像識別装置10の作用について説明する。まず、車載カメラから車両前方を撮像することにより得られた複数の学習画像と、各学習画像に対応して生成された、各画素がどの識別対象物を表わしているかを示す識別対象物ラベルからなる識別対象物ラベル画像とがコンピュータ14に入力され、学習画像及び識別対象物ラベル画像がメモリ(図示省略)に記憶される。
そして、コンピュータ14において、図6に示す学習処理ルーチンが実行される。まず、ステップ100において、メモリから、複数の学習画像及び複数の学習画像に対応する識別対象物ラベル画像を取得し、ステップ102において、上記ステップ100で取得した学習画像の各々について、特徴点を複数抽出する。
そして、ステップ104において、上記ステップ102で抽出された特徴点の各々について、特徴点の情報として、エッジ方向のヒストグラムを算出し、算出したエッジ方向のヒストグラムを示す特徴ベクトルを生成する。
次のステップ106では、上記ステップ104で算出された特徴点の特徴ベクトルの全てに対して、クラスタリング処理を行い、特徴点の特徴ベクトルを複数の分類に分ける。そして、ステップ108において、上記ステップ104で算出された特徴点の特徴ベクトルと、上記ステップ106で得られた分類とに基づいて、各特徴点の特徴ベクトルが属する分類を特定し、特定された分類を、特徴点の特徴ベクトルに関する分類とする。
そして、ステップ110において、各学習画像について、上記ステップ108で算出された、周辺の矩形領域内に存在する周辺特徴点の特徴ベクトルに関する分類を用いて、各画素の特徴ベクトルを算出する。
次のステップ112では、上記ステップ110で算出された各画素の特徴ベクトルと、上記ステップ100で取得した識別対象物ラベル画像とに基づいて、各識別対象物ラベルが示す識別対象物を表わす領域内に定めた注目画素の特徴ベクトルを求め、画素の特徴ベクトルと識別対象物ラベルとの関係を学習する。
そして、ステップ114において、上記ステップ112で学習した画素の特徴ベクトルと識別対象物ラベルとの関係を、特徴量記憶部28に記憶して、学習処理ルーチンを終了する。
そして、画像識別装置10を搭載した車両の走行中に、撮像装置12によって車両の前方の所定領域が撮像されると、コンピュータ14において、図7に示す画像識別処理ルーチンが実行される。
まず、ステップ130において、撮像装置12から撮像画像を取得し、ステップ132において、上記ステップ130で取得した撮像画像から特徴点を抽出する。そして、ステップ134において、上記ステップ132で抽出した特徴点の各々について、エッジ方向のヒストグラムを算出し、算出したエッジ方向のヒストグラムを示す特徴ベクトルを生成し、学習処理により得られた特徴ベクトルに関する分類に基づいて、特徴ベクトルが属する分類を特定し、特定した分類を特徴点の特徴ベクトルに関する分類とする。
そして、ステップ136において、撮像画像の各対象画素について、上記ステップ134で算出された特徴点の特徴ベクトルに関する分類のうち、対象画素について所定の相対位置に設定された所定の矩形領域内に存在する周辺特徴点の分類を用いて、対象画素の特徴ベクトルを算出する。
次のステップ138では、特徴量記憶部28から、画素の特徴ベクトルと識別対象物ラベルとの関係を示すデータを取得する。そして、ステップ140において、上記ステップ138で取得した画素の特徴ベクトルと識別対象物ラベルとの関係を示すデータ、及び上記ステップ136で算出した各画素の特徴ベクトルに基づいて、撮像画像の各画素の特徴ベクトルと、識別対象物ラベルが示す識別対象物を表わす領域内に定めた注目画素の特徴ベクトルと比較して、撮像画像の各画素が表している識別対象物を識別する。
次のステップ142では、領域分割の初期設定として、撮像画像の全ての画素の各々を、独立した領域として設定し、ステップ144において、異なる領域に属し、かつ、隣接する画素の組の中で、同じ種類の識別対象物を表わしていると識別された組が存在するか否かを判定する。上記ステップ144で、異なる領域に属し、かつ、同じ識別対象物を表わしていると識別された隣接する画素の組が存在する場合には、ステップ146で、この隣接する画素が同じ領域となるように領域を統合し、上記ステップ144へ戻る。
上記ステップ144で、異なる領域に属し、かつ、同じ識別対象物を表わしていると識別された隣接する画素の組が存在しない場合には、これ以上領域を統合できないため、領域分割が終了したと判断し、ステップ148において、上記ステップ142〜146の処理により撮像画像が領域分割された結果を、表示装置16に表示させて、画像識別処理ルーチンを終了する。
以上説明したように、第1の実施の形態に係る画像識別装置によれば、撮像画像について、対象画素に対して周辺の所定位置にある矩形領域内に存在する周辺特徴点のエッジ方向のヒストグラムを表わす特徴ベクトルを用いて、学習データと比較することにより、識別対象となる撮像画像内の対象画素が、どの識別対象物を表わしているかを安定して識別することができる。また、撮像画像を、各識別対象物を表わす領域に安定して分割することができる。
また、画像を撮像した環境によって変動しない特徴点の特徴量を用いるため、様々な環境で撮像した撮像画像から、人、車両、路面、木、建物、空などの識別対象物を表わす領域を検出することができる。
次に、第2の実施の形態に係る画像識別装置について説明する。なお、第1の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。
第2の実施の形態では、特徴点について、3次元位置に関する分類を求めている点と、画素の特徴ベクトルとして、矩形領域内の特徴点の3次元位置に関する分類のヒストグラムを算出している点とが、第1の実施の形態と主に異なっている。
図8に示すように、第2の実施の形態に係る画像識別装置210のコンピュータ214は、撮像装置12によって連続して撮像された複数枚の撮像画像を取得する画像取得部220と、画像取得部220により取得した複数枚の撮像画像の各々から、画像上で追跡しやすい特徴点を複数抽出する特徴点抽出部222と、特徴点抽出部222によって複数枚の撮像画像から抽出された特徴点に基づいて、複数枚の撮像画像間で対応する点を検索して追跡し、複数枚の撮像画像で対応する特徴点の画像座標を検出する対応点検索部223と、対応する特徴点の複数枚の撮像画像の各々における画像座標に基づいて、1枚の撮像画像から抽出された特徴点の各々について、特徴点の特徴量として3次元位置を算出し、算出した3次元位置が属する分類を特定する特徴点特徴量算出部224と、取得した1枚の撮像画像の各画素について、画素の周辺に存在する周辺特徴点の3次元位置に関する分類を用いて、画素の特徴ベクトルを算出する画素特徴量算出部226と、学習によって求められた画素の特徴ベクトルと識別対象物ラベルとの関係を記憶した特徴量記憶部228と、識別部30と、領域分割部32とを備えている。
画像取得部220は、撮像装置12によって連続して撮像された複数枚の撮像画像を取得する。なお、撮像装置12がステレオカメラである場合には、ステレオカメラによって同時に撮像された複数枚の撮像画像を取得すればよい。
対応点検索部223は、特徴点抽出部222により1枚の撮像画像から抽出された特徴点の各々について、他の撮像画像との間で対応付けを行って、1枚の撮像画像の特徴点に対応する特徴点を他の撮像画像から検索する。なお、複数枚の撮像画像で対応する特徴点を検索するときには、複数枚の撮像画像で対応する特徴点及びその周囲の点の輝度は変化しないという仮定を用いて、複数枚の撮像画像の輝度のマッチングを行えばよく、例えば、Lucas−Kanade法を用いて、1枚の撮像画像上の特徴点に対応する特徴点を、他の撮像画像上から検索する。
特徴点特徴量算出部224は、以下に説明するように、各特徴点について、特徴点の特徴量として3次元位置を算出し、学習処理で得られた3次元位置に関する複数の分類に基づいて、算出した特徴点の3次元位置が属する分類を特定する。
例えば、2枚の撮像画像に、対応する特徴点が写っており、2枚の撮像画像を撮影したときの撮像装置12の相対的な位置及び姿勢の変化が、回転行列Rと並進ベクトルtで表されるとする。また、2枚の撮像画像で対応する特徴点の座標が(x、y)、(x’、y’)で表わされるとすると、その特徴点の3次元座標(X、Y、Z)は、以下の(5)式の解として計算される。
ただし、行列X=(X、Y、Z、1)である。また、撮像装置12のキャリブレーション行列をKとし、行列P、P’を以下の(6)式で定義すると、行列Aは、以下の(7)式で表される。
ただし、行列Iは、3×3の単位行列であり、行列0は、3×1の0行列である。また、p、p’は、それぞれ行列P、P’の第i行のベクトルである。
上記の(5)式〜(7)式を用いて、各特徴点の3次元位置が算出されると、後述する学習画像から得られた3次元位置に関する複数の分類に基づいて、各特徴点の3次元位置が、どの分類に属するかを特定し、特定された3次元位置に関する分類を、特徴点の分類とする。
画素特徴量算出部226は、1枚の撮像画像の各対象画素について、以下に説明するように、画素の特徴ベクトルを算出する。まず、対象画素の位置に対する相対位置(u,v)を中心とし、かつ、大きさをw×hとする矩形領域を設定し、その矩形領域内に存在する周辺特徴点の3次元位置の分類を用いて、画素の特徴ベクトルを算出する。例えば、予め定められた複数の矩形領域の各々について、矩形領域内に存在する周辺特徴点の3次元位置に関する分類のヒストグラムを算出し、複数の矩形領域について算出された複数のヒストグラムを連結して、画素の特徴ベクトルを生成する。
特徴量記憶部228は、上記と同様の画素の特徴ベクトルと識別対象物ラベルとの関係を記憶している。画素の特徴ベクトルと識別対象物ラベルとの関係は、以下に説明する学習方法により予め求められる。
まず、連続して撮像された2枚の学習画像と、対応する識別対象物ラベル画像とを複数組用意して、コンピュータ214に入力する。そして、入力された各学習画像に対して、上記の特徴点抽出部222と同様に、特徴点を複数抽出し、上記の対応点検索部223と同様に、各組の学習画像について、対応する特徴点を検索する。次に、各組の学習画像について、対応する特徴点から、上述したように、特徴点の3次元位置を算出する。また、全ての特徴点の3次元位置をクラスタリングし、特徴点の3次元位置を複数の分類に分ける。
そして、上記のように得られた3次元位置に関する複数の分類に基づいて、上記の特徴点特徴量算出部224と同様に、各特徴点について、特徴点の3次元位置が属する分類を特定する。
各特徴点について、特徴点の3次元位置が属する分類が得られると、学習画像の各画素について、各画素と周辺の特徴点との相対的な位置関係、及び周辺の特徴点の3次元位置が属する分類に基づいて、上記の画素特徴量算出部226と同様に、画素の特徴ベクトルを算出する。
全ての画素について画素の特徴ベクトルを計算すると、入力された識別対象物ラベル画像を用いて、各識別対象物と画素の特徴ベクトルとの関係について学習し、各識別対象物ラベルが示す識別対象物が表わす領域内に定めた注目画素の特徴ベクトルを求め、各識別対象物ラベルと画素の特徴ベクトルとの関係を示すデータとして特徴量記憶部228に記憶する。
次に、第2の実施の形態に係る画像識別処理ルーチンでは、撮像装置12から複数枚の撮像画像を取得し、複数枚の撮像画像から特徴点を抽出する。そして、複数枚の撮像画像間で対応する特徴点を検出し、対応する特徴点の組の各々について、特徴点の特徴量として、特徴点の3次元位置を算出する。そして、学習処理により得られた特徴点の3次元位置に関する分類に基づいて、算出した特徴点の3次元位置が属する分類を特定し、特定した分類を、算出した特徴点の3次元位置に関する分類とする。
そして、撮像画像の各対象画素について、算出された特徴点の3次元位置に関する分類のうち、対象画素について所定の相対位置に設定された所定の矩形領域内に存在する特徴点の分類を用いて、画素の特徴ベクトルを算出する。
次に、特徴量記憶部228から、画素の特徴ベクトルと識別対象物ラベルとの関係を示すデータを取得する。そして、取得した画素の特徴ベクトルと識別対象物ラベルとの関係を示すデータ、及び算出した各画素の特徴ベクトルに基づいて、撮像画像の各画素の特徴ベクトルと、識別対象物ラベルが示す識別対象物を表わす領域内に定めた注目画素の特徴ベクトルと比較して、撮像画像の各画素が表している識別対象物を識別する。
そして、領域分割の初期設定として、撮像画像の全ての画素の各々を、独立した領域として設定し、異なる領域に属し、かつ、隣接する画素の組の中で、同じ種類の識別対象物を表わしていると識別された組が存在するか否かを判定する。異なる領域に属し、かつ、同じ識別対象物を表わしていると識別された隣接する画素の組が存在する場合には、この隣接する画素が同じ領域となるように領域を統合する。異なる領域に属し、かつ、同じ識別対象物を表わしていると識別された隣接する画素の組が存在しない場合には、領域分割が終了したと判断し、撮像画像が領域分割された結果を、表示装置16に表示させる。
このように、撮像画像について、対象画素に対して周辺の所定位置にある矩形領域内に存在する周辺特徴点の3次元位置を用いて、学習データと比較することにより、識別対象となる撮像画像内の対象画素が、どの識別対象物を表わしているかを安定して識別することができる。
画像の領域分割や識別を行うとき、画像の色情報や、テクスチャ情報、動き情報などを用いて処理を行うが、照明環境の変動や対象物の多様性などにより、誤った処理結果となりやすい。上記の実施の形態では、画像中の物体の強い手がかりとなる特徴点の形状情報や3次元位置を、各画素の特徴量へ加えることにより、照明変動があり、色やテクスチャでは領域分割又は識別を行なうことが難しい場合や、画像パターンの中に、多様性がある建物などの物体が存在する場合であっても、精度よく領域分割を行なうことができる。
なお、上記の実施の形態では、特徴点の特徴ベクトルまたは特徴量として、エッジ方向のヒストグラムや3次元位置を用いた場合を例に説明したが、これに限定されるものではなく、特徴点の特徴ベクトルとして、特徴点の周辺画素の輝度の分布を示す特徴ベクトルを用いてもよい。また、特徴点の特徴ベクトルとして、エッジ方向のヒストグラム、3次元位置、及び輝度の分布の組み合わせを表わす特徴ベクトルを用いてもよい。
また、対象画素の特徴ベクトルとして、周辺の矩形領域内に存在する周辺特徴点の特徴ベクトルが属する分類のヒストグラムを表わす特徴ベクトルを用いた場合を例に説明したが、これに限定されるものではなく、対象画素の特徴ベクトルとして、対象画素の周辺に存在する周辺特徴点の相対位置、及びこの周辺特徴点の特徴ベクトルが属する分類を表わす特徴ベクトルを用いてもよい。また、周辺特徴点の特徴量と対象画素自体の特徴量(画素の輝度値、1次微分、2次微分など)を組み合わせた特徴ベクトルを用いてもよい。
また、特徴点の情報として、特徴点の特徴ベクトル又は特徴量の分類を用いる場合を例に説明したが、これに限定するものではなく、特徴点の情報として、特徴点の特徴ベクトル又は特徴量自体を用いるようにしてもよい。この場合には、対象画素に対する矩形領域内に存在する周辺特徴点の特徴ベクトル又は特徴量を表わすベクトルを、対象画素の特徴ベクトルとして用いればよい。また、学習処理によって、各識別対象物ラベルを示す識別対象物を表わす領域内に定めた注目画素に対する、矩形領域内に存在する周辺特徴点の特徴ベクトル又は特徴量を表わす特徴ベクトルを求め、各識別対象物ラベルと画素の特徴ベクトルとの関係を示すデータとして、特徴量記憶部に記憶しておけばよい。
本発明の第1の実施の形態に係る画像識別装置の構成を示す概略図である。 (A)撮像画像から特徴点が抽出された様子を示すイメージ図、及び(B)特徴点について算出されるエッジ方向のヒストグラムを示すイメージ図である。 (A)撮像画像から特徴点が抽出された様子を示すイメージ図、及び(B)特徴点について算出されるエッジ方向のヒストグラムを示すイメージ図である。 (A)学習画像から特徴点が抽出された様子を示すイメージ図、(B)分類された特徴点の周辺領域の画像を示すイメージ図、及び(C)分類された特徴点のエッジ方向のヒストグラムを示すイメージ図である。 (A)対象画素に対して設定される周辺の矩形領域を示すイメージ図、及び(B)設定された矩形領域について特徴点の特徴ベクトルの分類のヒストグラムを示すイメージ図である。 本発明の第1の実施の形態に係る画像識別装置における学習処理ルーチンの内容を示すフローチャートである。 本発明の第1の実施の形態に係る画像識別装置における画像識別処理ルーチンの内容を示すフローチャートである。 本発明の第2の実施の形態に係る画像識別装置の構成を示す概略図である。
符号の説明
10、210 画像識別装置
12 撮像装置
14、214 コンピュータ
16 表示装置
22、222 特徴点抽出部
24、224 特徴点特徴量算出部
26、226 画素特徴量算出部
28、228 特徴量記憶部
30 識別部
32 領域分割部

Claims (7)

  1. 複数種類の識別対象物を撮像することにより得られた学習画像の前記識別対象物を表わす領域内に定めた注目画素と、前記学習画像から抽出された特徴点であって、かつ、該注目画素の周辺に存在する周辺特徴点との位置関係、及び前記周辺特徴点の特徴量を、前記識別対象物毎に記憶した記憶手段と、
    前記識別対象画像から複数の前記特徴点を抽出する特徴点抽出手段と、
    前記特徴点抽出手段によって抽出された前記複数の特徴点の各々について、前記特徴量を算出する特徴量算出手段と、
    前記識別対象画像内の各対象画素について、前記抽出された前記特徴点であって、かつ、前記対象画素の周辺に存在する周辺特徴点と前記対象画素との位置関係、及び前記周辺特徴点について算出された前記特徴量と、前記記憶手段に記憶された前記位置関係及び前記周辺特徴点の前記特徴量とを比較して、前記対象画素が、前記複数種類の識別対象物の何れを表わしているかを識別する識別手段と、
    を含む画像識別装置。
  2. 前記特徴量算出手段は、前記複数の特徴点の各々について、前記特徴量として、前記特徴点のエッジ方向に関する物理量、前記特徴点の輝度に関する物理量、及び前記特徴点の3次元位置の少なくとも一つを算出する請求項1記載の画像識別装置。
  3. 前記識別対象画像及び前記学習画像の各々を、車両に搭載された撮像装置によって撮像された画像とした請求項1又は2記載の画像識別装置。
  4. 前記記憶手段は、前記注目画素に対して周辺の所定位置にある所定領域内に存在する前記周辺特徴点の前記特徴量を、前記識別対象物毎に記憶し、
    前記識別手段は、前記識別対象画像の各対象画素について、前記対象画素に対して前記所定位置にある前記所定領域内に存在する前記周辺特徴点の前記特徴量と、前記記憶手段に記憶された前記周辺特徴点の前記特徴量とを比較して、前記対象画素が、前記複数種類の識別対象物の何れを表わしているかを識別する請求項1〜請求項3の何れか1項記載の画像識別装置。
  5. 前記記憶手段は、前記位置関係、及び前記周辺特徴点の特徴量が属する複数の分類の何れかを、前記識別対象物毎に記憶し、
    前記特徴量算出手段は、前記複数の特徴点の各々について、前記特徴量を算出し、算出した特徴量が属する前記分類を特定し、
    前記識別手段は、前記識別対象画像の各対象画素について、前記周辺特徴点と前記対象画素との位置関係、及び前記周辺特徴点の前記特徴量が属する前記分類と、前記記憶手段に記憶された前記位置関係、及び前記周辺特徴点の前記特徴量が属する前記分類とを比較して、前記対象画素が、前記複数種類の識別対象物の何れを表わしているかを識別する請求項1〜請求項4の何れか1項記載の画像識別装置。
  6. 前記識別手段による識別結果に基づいて、前記識別対象画像を、各識別対象物を表わす領域に分割する領域分割手段を更に含む請求項1〜請求項5の何れか1項記載の画像識別装置。
  7. コンピュータを、
    複数種類の識別対象物を撮像することにより得られた学習画像の前記識別対象物を表わす領域内に定めた注目画素と、前記学習画像から抽出された特徴点であって、かつ、該注目画素の周辺に存在する周辺特徴点との位置関係、及び前記周辺特徴点の特徴量を、前記識別対象物毎に記憶した記憶手段、
    前記識別対象画像から複数の前記特徴点を抽出する特徴点抽出手段、
    前記特徴点抽出手段によって抽出された前記複数の特徴点の各々について、前記特徴量を算出する特徴量算出手段、及び
    前記識別対象画像内の各対象画素について、前記抽出された前記特徴点であって、かつ、前記対象画素の周辺に存在する周辺特徴点と前記対象画素との位置関係、及び前記周辺特徴点について算出された前記特徴量と、前記記憶手段に記憶された前記位置関係及び前記周辺特徴点の前記特徴量とを比較して、前記対象画素が、前記複数種類の識別対象物の何れを表わしているかを識別する識別手段
    として機能させるためのプログラム。
JP2008003276A 2008-01-10 2008-01-10 画像識別装置及びプログラム Expired - Fee Related JP4946878B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008003276A JP4946878B2 (ja) 2008-01-10 2008-01-10 画像識別装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008003276A JP4946878B2 (ja) 2008-01-10 2008-01-10 画像識別装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2009163682A JP2009163682A (ja) 2009-07-23
JP4946878B2 true JP4946878B2 (ja) 2012-06-06

Family

ID=40966194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008003276A Expired - Fee Related JP4946878B2 (ja) 2008-01-10 2008-01-10 画像識別装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4946878B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5560925B2 (ja) * 2010-06-10 2014-07-30 大日本印刷株式会社 3次元形状検索装置、3次元形状検索方法、及びプログラム
JP2012022518A (ja) * 2010-07-14 2012-02-02 Purex:Kk マーク読み取り装置、および方法
JP5742267B2 (ja) * 2011-02-08 2015-07-01 富士ゼロックス株式会社 画像処理プログラム及び画像処理装置
JP5733158B2 (ja) * 2011-11-02 2015-06-10 富士通株式会社 認識支援装置、認識支援方法、およびプログラム
JP2014112347A (ja) * 2012-11-08 2014-06-19 Nec Corp 画像照合システム、画像照合方法、およびプログラム
EP3089108B1 (en) 2013-12-26 2022-02-02 Nec Corporation Image processing device, subject identification method and program
KR102232797B1 (ko) * 2014-03-03 2021-03-26 에스케이플래닛 주식회사 객체 식별 장치, 그 방법 및 컴퓨터 프로그램이 기록된 기록매체
JP6278757B2 (ja) * 2014-03-07 2018-02-14 オリンパス株式会社 特徴量生成装置、特徴量生成方法、およびプログラム
JP6474210B2 (ja) 2014-07-31 2019-02-27 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 大規模画像データベースの高速検索手法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0676065A (ja) * 1992-08-26 1994-03-18 Hitachi Ltd 道路環境認識方法及び装置
JPH06343131A (ja) * 1993-04-06 1994-12-13 Victor Co Of Japan Ltd 多次元色彩画像圧縮方式
JP3516118B2 (ja) * 1997-03-24 2004-04-05 オムロン株式会社 物体認識方法および物体認識装置

Also Published As

Publication number Publication date
JP2009163682A (ja) 2009-07-23

Similar Documents

Publication Publication Date Title
JP4946878B2 (ja) 画像識別装置及びプログラム
US20220172348A1 (en) Information processing device, information processing method, and storage medium
CN109829398B (zh) 一种基于三维卷积网络的视频中的目标检测方法
US9824294B2 (en) Saliency information acquisition device and saliency information acquisition method
JP2940317B2 (ja) 画像処理装置
US7127107B2 (en) Land partition data generating method and apparatus
CN108229475B (zh) 车辆跟踪方法、系统、计算机设备及可读存储介质
US8447114B2 (en) Method and apparatus for calculating pixel features of image data
JP4877374B2 (ja) 画像処理装置及びプログラム
JP4970381B2 (ja) 特徴抽出装置、特徴抽出方法、画像処理装置、及び、プログラム
WO2009100058A2 (en) Object detection and recognition system
CN109961082B (zh) 物体识别处理装置、物体识别处理方法以及存储介质
JP5262705B2 (ja) 運動推定装置及びプログラム
CN101383005A (zh) 一种利用辅助规则纹理的乘客目标图像和背景分离方法
CN102739911A (zh) 图像处理装置及图像处理方法
CN103353941A (zh) 基于视角分类的自然标志物注册方法
CN111274964B (zh) 一种基于无人机视觉显著性分析水面污染物的检测方法
JP2011165170A (ja) 対象物検出装置及びプログラム
CN110969135B (zh) 自然场景中的车标识别方法
CN109166093B (zh) 一种图像显著区域检测方法
CN111104857A (zh) 一种基于步态能量图的身份识别方法及系统
CN106909936B (zh) 一种基于双车辆可变形部件模型的车辆检测方法
JP4894747B2 (ja) 部分領域検出装置、対象物識別装置、及びプログラム
CN106446832B (zh) 一种基于视频的实时检测行人的方法
JP6350018B2 (ja) 対象物検出装置及び要素選択装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120220

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4946878

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees