JP5201184B2 - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP5201184B2
JP5201184B2 JP2010187661A JP2010187661A JP5201184B2 JP 5201184 B2 JP5201184 B2 JP 5201184B2 JP 2010187661 A JP2010187661 A JP 2010187661A JP 2010187661 A JP2010187661 A JP 2010187661A JP 5201184 B2 JP5201184 B2 JP 5201184B2
Authority
JP
Japan
Prior art keywords
image
window
unit
feature amount
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010187661A
Other languages
English (en)
Other versions
JP2012048326A (ja
Inventor
暉 曹
充彦 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP2010187661A priority Critical patent/JP5201184B2/ja
Publication of JP2012048326A publication Critical patent/JP2012048326A/ja
Application granted granted Critical
Publication of JP5201184B2 publication Critical patent/JP5201184B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像処理装置及びプログラムに係り、特に、入力画像から識別対象物を識別する画像処理装置及びプログラムに関する。
従来、部分領域および検索画像の画素数が所定値未満であるか否かを判別し、所定値未満のときは平滑化処理が施された色ヒストグラムを作成し、入力画像の部分領域と検索画像の色ヒストグラムを比較して色ヒストグラムの類似度を求め、その類似度が所定レベル以上であるか否かを判定して、所定レベル以上の部分領域を検索画像が存在する検出領域とする画像検出装置が提案されている(例えば、特許文献1参照)。
また、撮像手段により異なる時刻に撮像された各画像からそれぞれエッジを抽出した時系列の複数枚のエッジ画像間の関係により着目する時点のエッジ画像において移動した物体に相当する領域を抽出し、抽出した領域についてエッジ上の画素の方向コードの度数分布を求め、抽出した領域が人に対応する領域か否かをあらかじめ人のエッジ画像について求めたエッジ上の画素の方向コードの度数分布である基準データとの類似度を用いて評価する人体検知装置が提案されている(例えば、特許文献2参照)。
また、顔候補領域の画像を取得し、顔候補領域の大きさに基づいて、顔候補領域から目画素及び口画素を抽出するための抽出条件を決定し、決定された抽出条件に基づいて顔候補領域から目画素及び口画素を抽出し、目画素及び口画素に基づいて顔候補領域に対する目及び口の面積率を算出し、目と口の面積率をニューラルネットワークに入力し、ニューラルネットワークを用いて顔候補領域が人物の顔であるか否かを判定する画像処理装置が提案されている(例えば、特許文献3参照)。
特開2002−163653号公報 特開2005−115932号公報 特開2005−202562号公報
しかしながら、入力画像中に識別対象物が様々なサイズで存在する場合には、入力画像から様々なサイズの部分領域を抽出する必要があるが、特許文献1〜3の技術では、抽出した部分領域毎に、ヒストグラムを生成する等の処理が必要となり、抽出する部分領域のサイズを増やして精密な識別を行おうとすると演算量が増大する、という問題がある。
本発明は、上記の問題点を解決するためになされたもので、入力画像に含まれる識別対象物の様々なサイズに対応しつつ、演算量を削減することができる画像処理装置及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の画像処理装置は、入力画像の複数の画素を含む単位領域を所定画素ずつずらしながら、該単位領域に含まれる画素の画素値に基づいて、該単位領域のサイズに依存しない単位特徴量を演算する単位特徴量演算手段と、複数の画素を含む複数の小領域で構成されたウインドウ画像であって、該小領域のサイズを異ならせた複数のサイズのウインドウ画像の各々を、前記入力画像から抽出するウインドウ画像抽出手段と、前記ウインドウ画像抽出手段により抽出されたウインドウ画像の小領域のサイズに関わらず、前記小領域に対応する単位領域の同一の単位特徴量を用いて、前記ウインドウ画像のウインドウ特徴量を演算するウインドウ特徴量演算手段と、前記ウインドウ特徴量演算手段により演算されたウインドウ特徴量、及び対象物を識別するために予め生成された識別モデルに基づいて、前記ウインドウ画像が識別対象物を表す画像か否かを識別する識別手段と、を含んで構成されている。
本発明の画像処理装置によれば、単位特徴量演算手段が、入力画像の複数の画素を含む単位領域を所定画素ずつずらしながら、単位領域に含まれる画素の画素値に基づいて、単位領域のサイズに依存しない単位特徴量を演算する。また、ウインドウ画像抽出手段が、複数の画素を含む複数の小領域で構成されたウインドウ画像であって、小領域のサイズを異ならせた複数のサイズのウインドウ画像の各々を、入力画像から抽出する。
そして、ウインドウ特徴量演算手段が、ウインドウ画像抽出手段により抽出されたウインドウ画像の小領域のサイズに関わらず、小領域に対応する単位領域の同一の単位特徴量を用いて、ウインドウ画像のウインドウ特徴量を演算する。ウインドウ画像の小領域のサイズに関わらず、とは、小領域のサイズと単位領域のサイズとが一致する場合はもちろん、一致しない場合であっても、小領域に対応する単位領域の単位特徴量を用いることを意味する。
識別手段は、ウインドウ特徴量演算手段により演算されたウインドウ特徴量、及び対象物を識別するために予め生成された識別モデルに基づいて、ウインドウ画像が識別対象物を表す画像か否かを識別する。
このように、ウインドウ画像を構成する小領域のサイズが異なる場合でも、同一の単位特徴量を用いて、ウインドウ画像全体の特徴量であるウインドウ特徴量を演算するため、入力画像に含まれる識別対象物の様々なサイズに対応しつつ、演算量を削減することができる。
また、前記単位特徴量を、前記単位領域に含まれる画素のエッジの強度及び角度から得られるエッジ角度のヒストグラムとすることができる。エッジ角度のヒストグラムは単位領域のサイズが異なる場合でも、正規化することにより同様の分布を示すため、単位領域のサイズに依存しない単位特徴量として用いることができる。
また、前記入力画像を、異なる解像度の画像に変換する変換手段を含み、前記ウインドウ画像抽出手段は、前記入力画像及び前記変換手段により変換された異なる解像度の画像の各々から、前記複数のサイズのウインドウ画像の各々を抽出することができる。これにより、入力画像内の識別対象物について、より様々なサイズに対応することができる。
また、前記ウインドウ特徴量演算手段は、前記小領域が前記単位領域より小さい場合には、前記小領域に対応する前記単位領域が重複し、前記小領域が前記単位領域より大きい場合には、前記小領域に対応する前記単位領域が離間するように前記単位領域を対応させることができる。このように小領域に対して単位領域を対応させることで、小領域のサイズに関わらず同一の単位特徴量を用いることができ、演算量を削減できる。
また、前記ウインドウ画像抽出手段は、前記識別手段により前記ウインドウ画像が識別対象物を表す画像であると識別された場合に、前記入力画像の前記ウインドウ画像が抽出された近傍領域から再度ウインドウ画像を抽出し、前記ウインドウ特徴量演算手段は、前記ウインドウ画像抽出手段により再度抽出されたウインドウ画像の小領域毎に特徴量を演算して、前記ウインドウ特徴量を再度演算するようにすることができる。これにより、識別精度が向上する。
また、本発明の画像処理プログラムは、コンピュータを、入力画像の複数の画素を含む単位領域を所定画素ずつずらしながら、該単位領域に含まれる画素の画素値に基づいて、該単位領域のサイズに依存しない単位特徴量を演算する単位特徴量演算手段、複数の画素を含む複数の小領域で構成されたウインドウ画像であって、該小領域のサイズを異ならせた複数のサイズのウインドウ画像の各々を、前記入力画像から抽出するウインドウ画像抽出手段、前記ウインドウ画像抽出手段により抽出されたウインドウ画像の小領域のサイズに関わらず、前記小領域に対応する単位領域の同一の単位特徴量を用いて、前記ウインドウ画像のウインドウ特徴量を演算するウインドウ特徴量演算手段、及び前記ウインドウ特徴量演算手段により演算されたウインドウ特徴量、及び対象物を識別するために予め生成された識別モデルに基づいて、前記ウインドウ画像が識別対象物を表す画像か否かを識別する識別手段として機能させるためのプログラムである。

以上説明したように、本発明の画像処理装置及びプログラムによれば、ウインドウ画像を構成する小領域のサイズが異なる場合でも、同一の単位特徴量を用いて、ウインドウ画像全体の特徴量であるウインドウ特徴量を演算するため、入力画像に含まれる識別対象物の様々なサイズに対応しつつ、演算量を削減することができる、という効果が得られる。
本実施の形態に係る対象物識別装置の概略構成を示すブロック図である。 解像度画像の生成を示すイメージ図である。 セル内の各画素についてエッジの強度及び角度を算出した様子を示すイメージ図である。 セル特徴量であるエッジ角度のヒストグラムを示す図である。 各解像度画像からのセル特徴量の演算を説明するためのイメージ図である。 (A)ウインドウ画像を示すイメージ図、(B)ウインドウ画像を構成するブロックを示すイメージ図、及び(C)ブロックを構成するセルを示すイメージ図である。 (A)4×4セルウインドウ画像、(B)5×5セルウインドウ画像、及び(C)6×6セルウインドウ画像を示すイメージ図である。 1ブロック分の特徴量を示す図である。 (A)4×4セルに5×5単位セルを対応させる場合、及び(B)6×6セルに5×5単位セルを対応させる場合を説明するためのイメージ図である。 本実施の形態に係る対象物識別装置のコンピュータにおいて実行される識別処理ルーチンの内容を示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態では、入力画像から識別対象物として歩行者を識別する対象物識別装置に本発明を適用した場合を例に説明する。
図1に示すように、本実施の形態に係る対象物識別装置10は、車両(図示省略)に取り付けられ、かつ、車両の前方を撮像して画像を生成する撮像装置12と、撮像装置12で撮像されて入力された入力画像から歩行者を識別する処理を実行するコンピュータ14と、コンピュータ14の識別結果を表示する表示装置16とを備えている。
撮像装置12は、車両の前方を撮像した画像の画像信号を生成する撮像部(図示省略)と、撮像部で生成された画像信号をA/D変換するA/D変換部(図示省略)と、A/D変換された画像信号を一時的に格納するための画像メモリ(図示省略)とを備えている。
コンピュータ14は、CPUと、RAMと、後述する識別処理ルーチンを実行するためのプログラムを記憶したROMとを備え、機能的には次に示すように構成されている。コンピュータ14は、撮像装置12で撮像されて入力された入力画像を取得する画像取得部20と、画像取得部20により取得した入力画像を、異なる複数の解像度の画像の各々に変換する解像度変換部22と、入力画像及び解像度変換部22で変換された画像(以下、解像度画像という)の各々から、所定サイズの画素群からなる単位セル(単位領域)の特徴量を演算するセル特徴量演算部24と、入力画像及び解像度画像の各々から、様々な大きさの切り出しウインドウを用いて走査することにより、複数のウインドウ画像を抽出するウインドウ画像抽出部26と、セル特徴量演算部24で演算されたセル特徴量を用いて、ウインドウ画像抽出部26で抽出した各ウインドウ画像のウインドウ特徴量を演算するウインドウ特徴量演算部28と、歩行者及び非歩行者を撮像した学習画像に基づいて予め生成された学習モデルとしてのSVM(サポートベクターマシン)モデルを記憶した学習モデル記憶部30と、ウインドウ特徴量演算部28で演算されたウインドウ特徴量と、学習モデルとに基づいて、SVM識別器により、識別対象のウインドウ画像が歩行者を表す画像であるか否かを識別する識別部32と、識別部32での識別結果を入力画像に重畳して表示装置16に表示するように制御する表示制御部34と、を含んだ構成で表すことができる。
解像度変換部22は、例えば、図2に示すように、入力画像の解像度を1/2に変換した1/2解像度画像、1/4に変換した1/4解像度画像を生成する。なお、以下では、入力画像を1/1解像度画像ともいう。例えば、入力画像が640×480画素の場合には、1/2解像度画像は、320×240画素、1/4解像度画像は、160×120画素となる。
セル特徴量演算部24は、図3に示すように、後述するウインドウ画像のサイズとの関係で定まる単位セルに含まれる各画素を、ソーベルフィルタ等の空間フィルタで微分して、各画素についてエッジの強度及び角度を算出する。例えば、単位セルは、縦5画素×横5画素(以下、5×5単位セルという)とすることができる。
エッジ強度mは、下記(1)式に従って算出される。
Figure 0005201184

ただし、m(x,y)は画像座標(x,y)でのエッジ強度を表わし、I(x,y)は、画像座標(x,y)の輝度値を表わす。ここで、エッジ強度は、上記(1)式に示すように、画像の各画素を注目画素としたときの注目画素の周辺に存在する周辺画素の輝度差に基づいて求められ、注目画素及び周辺画素を含む所定領域内の輝度の変化度合いを示している。
また、エッジ角度θは、下記(2)式に従って算出される。
Figure 0005201184

ただし、θ(x,y)は、画素座標(x,y)でのエッジ角度を表わす。
そして、図4に示すように、エッジ角度毎にエッジ強度を積算したヒストグラム(以下、エッジ角度のヒストグラムという)を、セル特徴量として演算する。具体的には、エッジ角度は0〜180度或いは0〜360度の範囲をN度ずつに分割する。例えば、0〜180度の範囲で30度ずつに分割して、6区分のヒストグラムを算出する。なお、ヒストグラムの投票時には、各画素の持つエッジ角度に対応した区分に、当該画素が持つエッジ強度で投票することによって、エッジ角度のヒストグラムを算出する。
このようなエッジ角度のヒストグラムは、エッジ強度について正規化することで、セルサイズに関わらず同様の分布を示すため、これをセル特徴量として用いることで、セルサイズに依存しないセル特徴量を演算することができる。このセル特徴量を、図5に示すように、各解像度画像について、単位セルを1画素ずつずらしながら演算する。
ウインドウ画像抽出部26は、解像度変換部22で生成された各解像度画像から、様々なサイズのウインドウ画像を抽出する。図6に示すように、ウインドウ画像(同図(A))は、例えば横2×縦4の8つのブロック(B1〜B8)で構成されており(同図(B))、さらに、各ブロックは、例えば横2×縦2の4つのセルで構成されている(同図(C))。このセルサイズを異ならせることにより、ウインドウ画像のサイズを異ならせることができる。
例えば、図7に示すように、セルサイズを4×4画素(以下、4×4セルという)にした場合には、16×32画素のウインドウ画像となり(同図(A))、セルサイズを5×5画素(以下、5×5セルという)にした場合には、20×40画素のウインドウ画像となり(同図(B))、セルサイズを6×6画素(以下、6×6セルという)にした場合には、24×48画素のウインドウ画像となる(同図(C))。なお、以下では、各ウインドウ画像のサイズを、セルサイズを基準に、4×4セルウインドウ画像、5×5セルウインドウ画像、6×6セルウインドウ画像ともいう。この各サイズと同一の切り出しウインドウを、入力画像に対して所定画素ずつずらしながら走査して、切り出しウインドウ内のウインドウ画像を抽出する。
なお、1/2解像度画像から4×4セルウインドウ画像を抽出した場合には、1/1解像度画像から、ここでは用意されていない8×8セルウインドウ画像を抽出した場合と同一の結果となる。学習モデルは、ウインドウ画像のサイズ毎に必要となるが、このように、異なる複数の解像度画像と組み合わせることで、学習モデルの数を削減することができる。上記の例では、ウインドウ画像のサイズは3種類、解像度画像も3種類であるので、計9種類のサイズに対応できることになる。
ウインドウ特徴量演算部28は、例えば、図6に示すように、ウインドウ画像抽出部26により抽出されたウインドウ画像を、各ブロックに分割し、さらに各ブロックをセルに分割する。そして、図8に示すように、各セルに対応する画素位置の画素から演算されたセル特徴量であるエッジ角度のヒストグラムを羅列して結合することによりブロック毎の特徴量を得て、さらにこれをブロック順に羅列して結合することによりウインドウ画像全体の特徴量であるウインドウ特徴量として演算する。ここでは、セル特徴量は6つに区分されており、1ブロックが4セル、ブロック数は8ブロックであるので、192次元のウインドウ特徴量となる。
ここで、例えば、単位セルが5×5単位セルの場合には、5×5セルウインドウ画像については、ウインドウ画像内の各ブロックを構成する各セルのサイズと、単位セルのサイズとが同一であるため、各セルに5×5単位セルをそのまま対応させることができる。
一方、4×4セルウインドウ画像については、各セルサイズと単位セルのサイズとが一致しないため、図9(A)に示すように、例えば、セル1(ブロック内の左上のセル、図中斜線部)に対して、左上角の画素位置を一致させた5×5単位セルを対応させ、セル1のエッジ角度のヒストグラムとして、対応させた5×5単位セルから演算されたセル特徴量であるエッジ角度のヒストグラムを用いる。従って、セル2(右上)、セル3(左下)、セル4(右下)についても同様に5×5単位セルを対応させると、5×5単位セルは重複した状態となる。
また、6×6セルウインドウ画像については、各セルサイズと単位セルのサイズとが一致しないため、図9(B)に示すように、例えば、セル1(ブロック内の左上のセル、図中斜線部)に対して、左上角の画素位置を一致させた5×5単位セルを対応させ、セル1のエッジ角度のヒストグラムとして、対応させた5×5単位セルから演算されたセル特徴量であるエッジ角度のヒストグラムを用いる。従って、セル2(右上)、セル3(左下)、セル4(右下)についても同様に5×5単位セルを対応させると、5×5単位セルは離間した状態となる。
セル特徴量であるエッジ角度のヒストグラムは、セルサイズに依存しない特徴量であるため、上記のように、セル特徴量演算部24で演算した5×5単位セルのセル特徴量を、サイズの異なる4×4セル及び6×6セルの特徴量として代用することができる。
学習モデル記憶部30では、以下のような学習処理によって予め生成された学習モデルを記憶している。
まず、歩行者を撮像した部分を抽出した複数の歩行者画像と、歩行者以外を撮像した部分を抽出した複数の非歩行者画像とを予め用意し、複数の歩行者画像及び複数の非歩行者画像の各々について、上述したのと同様の手法により、ウインドウ特徴量を演算する。そして、各画像について求められたウインドウ特徴量を訓練データとし、各画像が歩行者画像及び非歩行者画像の何れであるかに応じて付与される教師ラベルを用いて、学習処理を行い、SVMモデルを学習モデルとして求め、学習モデル記憶部30に記憶する。
識別部32は、学習モデル記憶部30に記憶された学習モデルと、ウインドウ特徴量演算部28により演算されたウインドウ特徴量とに基づいて、従来既知のSVM識別器を用いて、識別対象のウインドウ画像が歩行者を表す画像であるか否かを識別する。
次に、本実施の形態に係る対象物識別装置10の作用について説明する。まず、歩行者を撮像することにより得られた複数の歩行者画像と、歩行者以外を撮像することにより得られた非歩行者画像とに基づいて、学習処理を行い、得られたSVMモデルを、学習モデル記憶部30に記憶する。
そして、対象物識別装置10を搭載した車両の走行中に、撮像装置12によって車両の前方の所定領域が撮像されると、コンピュータ14では、撮像装置12で撮影され入力される入力画像を取得し、入力画像に対して、様々な大きさの切り出しウインドウを走査しながら、切り出しウインドウによって切り出されるウインドウ画像の各々について、コンピュータ14において、図10に示す識別処理ルーチンが実行される。
ステップ100で、撮像装置12により撮影された入力画像を取得する。次に、ステップ102で、上記ステップ100で取得した入力画像の解像度を1/2に変換した1/2解像度画像、1/4に変換した1/4解像度画像を生成する。
次に、ステップ104で、上記ステップ102で生成した各解像度画像(入力画像=1/1解像度画像を含む)に対して、5×5単位セルに含まれる各画素を、ソーベルフィルタ等の空間フィルタで微分して、各画素についてエッジの強度及び角度を算出し、セル特徴量としてエッジ角度のヒストグラムを演算する。セル特徴量は、各解像度画像について、5×5単位セルを1画素ずつずらしながら演算する。
次に、ステップ106で、上記ステップ102で生成された各解像度画像から選択した1つの解像度画像(例えば、1/1解像度画像)から、用意された様々なサイズの切り出しウインドウの1つを用いて、ウインドウ画像を抽出する。例えば、16×32画素の切り出しウインドウを用いた場合には、4×4セルウインドウ画像が抽出される。
次に、ステップ108で、上記ステップ106で抽出されたウインドウ画像を、各ブロックに分割し、さらに各ブロックをセルに分割する。ここでは、セルサイズは4×4となる。そして、上記ステップ104で、各セルに対応する画素位置の画素から演算されたセル特徴量であるエッジ角度のヒストグラムを羅列して結合したブロック毎の特徴量を得て、さらにこれをブロック順に羅列して結合したウインドウ画像全体の特徴量であるウインドウ特徴量として演算する。ここでは、各セルに対して、左上角の画素位置を一致させた5×5単位セルを対応させ、各セルのエッジ角度のヒストグラムとして、対応させた5×5単位セルから演算されたセル特徴量であるエッジ角度のヒストグラムを用いる。
次に、ステップ110で、学習モデル記憶部30に記憶された学習モデルと、上記ステップ108で演算されたウインドウ特徴量とに基づいて、従来既知のSVM識別器を用いて、識別対象のウインドウ画像が歩行者を表す画像であるか否かを識別する。ウインドウ画像が歩行者を示す画像であると識別された場合には、ウインドウ画像の画素位置及びサイズを所定の記憶領域に記憶する。
次に、ステップ112で、現在の解像度画像(1/1解像度画像)の全範囲について切り出しウインドウを走査してウインドウ画像を抽出したか、切り出しウインドウの全てのサイズについて処理が終了したか、及び全ての解像度画像について処理が終了したかを判定することにより、現在の入力画像に対する識別対象の探索を終了するか否かを判定する。探索を終了しない場合には、ステップ114へ移行し、探索を終了する場合には、ステップ116へ移行する。
ステップ114では、現在の解像度画像の全範囲について切り出しウインドウを走査していない場合には、切り出しウインドウを1ステップ移動させる。現在の解像度画像の全範囲について切り出しウインドウを走査終了している場合には、切り出しウインドウのサイズを変更する(例えば、20×40画素の切り出しウインドウ)。全てのサイズの切り出しウインドウについて処理が終了している場合には、次の解像度画像を選択する(例えば、1/2解像度画像)。そして、ステップ106へ戻り、新たなウインドウ画像を抽出して、処理を繰り返す。
ステップ116では、上記ステップ110で所定の記憶領域に記憶された識別結果に基づいて、例えば、入力画像の歩行者を表す画像であると識別された部分を矩形枠で囲むなどして、表示装置16に表示する。
以上説明したように、本実施の形態に係る対象物識別装置によれば、各解像度画像から、セルサイズを異ならせた複数のウインドウ画像を抽出することで、入力画像に含まれる識別対象の様々なサイズに対応することができ、また、ウインドウ画像の各セルのセル特徴量であるエッジ角度のヒストグラムを羅列して結合することによりウインドウ特徴量を演算する場合に、セルサイズが異なる場合でも、同一の単位セルのセル特徴量を用いることで、演算量を削減することができる。また、入力画像から複数の解像度画像を生成することで、ウインドウ画像のサイズの種類を増加させることなく、より様々なサイズに対応することができる。
なお、上記実施の形態では、セル特徴量演算部24で演算されたセル特徴量を用いてウインドウ特徴量を演算し、そのウインドウ特徴量を用いて最終的な識別を行う場合について説明したが、上記実施の形態の処理により、識別対象物であると識別されたウインドウ画像が抽出された入力画像の近傍領域において、再度ウインドウ画像を抽出し、ウインドウ特徴量演算部28において、セル特徴量演算部24で演算されたセル特徴量を用いることなく、すなわち、4×4セルウインドウ画像であれば各セルに含まれる4×4画素を用いて、エッジ角度のヒストグラムを生成して、ウインドウ特徴量を演算するようにしてもよい。これにより、識別精度が向上する。
また、上記実施の形態では、解像度画像として、入力画像より低解像度の1/2解像度画像及び1/4解像度画像を生成する場合について説明したが、入力画像より高解像度の解像度画像を生成するようにしてもよい。上記実施の形態では、4×4セルウインドウ画像のサイズを100%とすると、5×5セルウインドウ画像のサイズが125%、6×6セルウインドウ画像のサイズが150%という25%刻みの拡大率となる。そこで、入力画像(例えば、640×480画素)を一旦、高解像度化(1280×960画素)して、セルサイズを8×8画素、9×9画素、10×10画素・・・とすることで、ウインドウ画像の拡大率を12.5%刻みにすることができ、識別対象物のサイズの変化に対して、よりきめ細かな対応が可能となる。
また、上記実施の形態では、解像度画像を3種類、ウインドウ画像(セルサイズ)を3種類用いる場合について説明したが、これに限定されず、4種類以上としてもよい。また、ウインドウ画像内に異なるサイズのセルを混在させてもよい。また、セルの縦横比は1対1に限定されない。また、上記実施の形態では、ウインドウ画像の各セルに単位領域のセルを対応させる際に、各セルの左上の画素を基準に対応させたが、これに限定されない。
また、上記実施の形態では、SVM識別器を用いて、画像の識別処理を行う場合を例に説明したが、これに限定されるものではなく、従来既知の他の識別手法(例えば、最近傍識別、線形判別など)を用いて、画像の識別処理を行うようにしてもよい。
また、上記実施の形態では、識別対象物として歩行者を識別する対象物識別装置に、本発明を適用した場合を例に説明したが、識別対象物は、自動車や二輪車等でもよい。
また、上記実施の形態では、撮像装置から入力画像を取得し、ウインドウ画像を抽出する場合を例に説明したが、これに限定されるものではなく、ハードディスク装置から画像データを読み込み、読み込んだ画像データから、ウインドウ画像を抽出してもよい。
また、セル特徴量として、エッジ角度のヒストグラムを演算する場合について説明したが、これに限定されるものではなく、例えば、Haar−Like特徴量等を用いてもよい。
なお、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムをCDROM等の記憶媒体に格納して提供することも可能である。
10 対象物識別装置
12 撮像装置
14 コンピュータ
16 表示装置
20 画像取得部
22 解像度変換部
24 セル特徴量演算部
26 ウインドウ画像抽出部
28 ウインドウ特徴量演算部
30 学習モデル記憶部
32 識別部
34 表示制御部

Claims (6)

  1. 入力画像の複数の画素を含む単位領域を所定画素ずつずらしながら、該単位領域に含まれる画素の画素値に基づいて、該単位領域のサイズに依存しない単位特徴量を演算する単位特徴量演算手段と、
    複数の画素を含む複数の小領域で構成されたウインドウ画像であって、該小領域のサイズを異ならせた複数のサイズのウインドウ画像の各々を、前記入力画像から抽出するウインドウ画像抽出手段と、
    前記ウインドウ画像抽出手段により抽出されたウインドウ画像の小領域のサイズに関わらず、前記小領域に対応する単位領域の同一の単位特徴量を用いて、前記ウインドウ画像のウインドウ特徴量を演算するウインドウ特徴量演算手段と、
    前記ウインドウ特徴量演算手段により演算されたウインドウ特徴量、及び対象物を識別するために予め生成された識別モデルに基づいて、前記ウインドウ画像が識別対象物を表す画像か否かを識別する識別手段と、
    を含む画像処理装置。
  2. 前記単位特徴量を、前記単位領域に含まれる画素のエッジの強度及び角度から得られるエッジ角度のヒストグラムとした請求項1記載の画像処理装置。
  3. 前記入力画像を、異なる解像度の画像に変換する変換手段を含み、
    前記ウインドウ画像抽出手段は、前記入力画像及び前記変換手段により変換された異なる解像度の画像の各々から、前記複数のサイズのウインドウ画像の各々を抽出する
    請求項1または請求項2記載の画像処理装置。
  4. 前記ウインドウ特徴量演算手段は、前記小領域が前記単位領域より小さい場合には、前記小領域に対応する前記単位領域が重複し、前記小領域が前記単位領域より大きい場合には、前記小領域に対応する前記単位領域が離間するように前記単位領域を対応させる請求項1〜請求項3のいずれか1項記載の画像処理装置。
  5. 前記ウインドウ画像抽出手段は、前記識別手段により前記ウインドウ画像が識別対象物を表す画像であると識別された場合に、前記入力画像の前記ウインドウ画像が抽出された近傍領域から再度ウインドウ画像を抽出し、
    前記ウインドウ特徴量演算手段は、前記ウインドウ画像抽出手段により再度抽出されたウインドウ画像の小領域毎に特徴量を演算して、前記ウインドウ特徴量を再度演算する
    請求項1〜請求項4のいずれか1項記載の画像処理装置。
  6. コンピュータを、
    入力画像の複数の画素を含む単位領域を所定画素ずつずらしながら、該単位領域に含まれる画素の画素値に基づいて、該単位領域のサイズに依存しない単位特徴量を演算する単位特徴量演算手段、
    複数の画素を含む複数の小領域で構成されたウインドウ画像であって、該小領域のサイズを異ならせた複数のサイズのウインドウ画像の各々を、前記入力画像から抽出するウインドウ画像抽出手段、
    前記ウインドウ画像抽出手段により抽出されたウインドウ画像の小領域のサイズに関わらず、前記小領域に対応する単位領域の同一の単位特徴量を用いて、前記ウインドウ画像のウインドウ特徴量を演算するウインドウ特徴量演算手段、及び
    前記ウインドウ特徴量演算手段により演算されたウインドウ特徴量、及び対象物を識別するために予め生成された識別モデルに基づいて、前記ウインドウ画像が識別対象物を表す画像か否かを識別する識別手段
    として機能させるための画像処理プログラム。
JP2010187661A 2010-08-24 2010-08-24 画像処理装置及びプログラム Expired - Fee Related JP5201184B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010187661A JP5201184B2 (ja) 2010-08-24 2010-08-24 画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010187661A JP5201184B2 (ja) 2010-08-24 2010-08-24 画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2012048326A JP2012048326A (ja) 2012-03-08
JP5201184B2 true JP5201184B2 (ja) 2013-06-05

Family

ID=45903160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010187661A Expired - Fee Related JP5201184B2 (ja) 2010-08-24 2010-08-24 画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5201184B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5838948B2 (ja) * 2012-10-17 2016-01-06 株式会社デンソー 対象物識別装置
JP6151908B2 (ja) * 2012-11-14 2017-06-21 日本放送協会 学習装置、識別装置、およびそのプログラム
JP6435740B2 (ja) * 2014-09-22 2018-12-12 日本電気株式会社 データ処理システム、データ処理方法およびデータ処理プログラム
CN110532414B (zh) * 2019-08-29 2022-06-21 深圳市商汤科技有限公司 一种图片检索方法及装置
WO2021200199A1 (ja) * 2020-03-30 2021-10-07 ソニーグループ株式会社 情報処理装置、情報処理方法および情報処理プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070237387A1 (en) * 2006-04-11 2007-10-11 Shmuel Avidan Method for detecting humans in images

Also Published As

Publication number Publication date
JP2012048326A (ja) 2012-03-08

Similar Documents

Publication Publication Date Title
CN108229490B (zh) 关键点检测方法、神经网络训练方法、装置和电子设备
JP4877374B2 (ja) 画像処理装置及びプログラム
US8447114B2 (en) Method and apparatus for calculating pixel features of image data
US8805077B2 (en) Subject region detecting apparatus
CN103218605B (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
JP5671928B2 (ja) 学習装置、学習方法、識別装置、識別方法、およびプログラム
JP6688277B2 (ja) プログラム、学習処理方法、学習モデル、データ構造、学習装置、および物体認識装置
US8923610B2 (en) Image processing apparatus, image processing method, and computer readable medium
JP6410450B2 (ja) オブジェクト識別装置、オブジェクト識別方法及びプログラム
JP6123975B2 (ja) 特徴量抽出装置及び特徴量抽出方法
JP5201184B2 (ja) 画像処理装置及びプログラム
CN109034136A (zh) 图像处理方法、装置、摄像设备及存储介质
CN112396050B (zh) 图像的处理方法、设备以及存储介质
CN102737240B (zh) 分析数字文档图像的方法
JP5691834B2 (ja) 画像識別装置及びプログラム
CN112541394A (zh) 黑眼圈及鼻炎识别方法、系统及计算机介质
JP5100688B2 (ja) 対象物検出装置及びプログラム
US20220180555A1 (en) Estimation device, estimation method, and storage medium
JP2014016710A (ja) 対象物検出装置及びプログラム
JP2013003686A (ja) 認識装置および方法、プログラム、並びに記録媒体
CN112926463A (zh) 一种目标检测方法和装置
JP5020920B2 (ja) 歩行者検出装置及びプログラム
JP6405603B2 (ja) 情報処理装置、情報処理システム及びプログラム
JP2013011950A (ja) 画像処理装置、画像処理方法及びプログラム
Arunkumar et al. Estimation of vehicle distance based on feature points using monocular vision

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130128

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160222

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees