JP6171608B2 - 物体検出装置 - Google Patents

物体検出装置 Download PDF

Info

Publication number
JP6171608B2
JP6171608B2 JP2013127820A JP2013127820A JP6171608B2 JP 6171608 B2 JP6171608 B2 JP 6171608B2 JP 2013127820 A JP2013127820 A JP 2013127820A JP 2013127820 A JP2013127820 A JP 2013127820A JP 6171608 B2 JP6171608 B2 JP 6171608B2
Authority
JP
Japan
Prior art keywords
image
specific object
evaluation
parts
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013127820A
Other languages
English (en)
Other versions
JP2015001966A (ja
Inventor
ニキネジャド ホセイン テヘラニ
ニキネジャド ホセイン テヘラニ
悠貴 大石
悠貴 大石
一仁 竹中
一仁 竹中
万寿三 江川
江川  万寿三
誠一 三田
誠一 三田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota School Foundation
Denso Corp
Original Assignee
Toyota School Foundation
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota School Foundation, Denso Corp filed Critical Toyota School Foundation
Priority to JP2013127820A priority Critical patent/JP6171608B2/ja
Publication of JP2015001966A publication Critical patent/JP2015001966A/ja
Application granted granted Critical
Publication of JP6171608B2 publication Critical patent/JP6171608B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像を通じて、特定の対象物を検出する物体検出装置に関する。
例えば、自車両の前方を撮影し、その撮影画像に車や歩行者が映し出されている場合に、自車両の乗員に、車や歩行者の存在を報知して注意を促したり、衝突を防ぐために自動ブレーキをかけたりするシステムの開発が盛んに行われている。
ただし、歩行者は、動きにより全体の形態が変化する。また、車といっても、セダン、ワゴン、SUVなど種々の形態のものがある。そのため、画像中に歩行者や車が映しだされている場合に、極力、漏れがなく検出を行いながら、非対象物を誤って検出しないようにする点に難しさがある。
この問題に対する1つの解決策として、特許文献1において提案された手法がある。この特許文献1には、画像における物体の変位可能な特徴を正規化するための方法が記載されている。例えば、車の場合、「変異可能な特徴」は車輪と定められる。そして、特徴である車輪を画像において抽出して、反復的な探索プロセス及びコスト関数を使用したり、あるいは直接マッピングを使用したりすることにより、車輪を車の下部の最良のロケーションに変位させる。
このようにすることにより、画像において、物体の特徴が正規化されるので、その特徴に依拠する物体の検出や、認識等のタスクを良好に行い得るようになる。
特開2011−22996号公報
ここで、画像を通じて特定の対象物を検出する際の別の問題として、オクルージョンの問題がある。例えば、検出すべき特定の対象物が車である場合、交差道路から、自車両が走行している道路に進入しようとする他車両があるとき、その他車両の後部が、交差点にある建造物によって隠されてしまうことがある。この場合、自車両に設置したカメラによって撮影した画像には、その他車両の前半部しか映らない。また、例えば、自車両が複数車線道路を走行している場合であって隣接車線を走行する他車両がある場合や、自車両がカーブを走行している場合であって前方を走行する他車両がある場合など、カメラの画角によっては、他車両の全体が画像に写し出されないこともある。
このように、他の物体の影に隠れたり、カメラの撮影範囲の問題で、特定対象物の一部しか画像に写しだされない場合、特許文献1の手法を適用しても、特定対象物の検出や認識の精度を向上させることは困難である。なぜならば、特許文献1では、物体の位置を基準として、特徴の変位ゾーンを定義し、その変位ゾーン内の特徴を、最良のロケーションに変位させる。このような処理を行うためには、画像において、変位可能な特徴を含む物体全体が抽出される必要がある。しかし、オクルージョンにより物体の一部しか画像に含まれない場合、変位可能な特徴の抽出が困難になる。その結果、変位可能な特徴を最良のロケーションに変位させることもできなくなり、対象物体を検出することが困難になる。
本発明は、上述した点に鑑みてなされたものであり、検出すべき特定の対象物の一部しか画像に映しだされていない場合であっても、その特定対象物の検出を可能とした物体検出装置を提供することを目的とする。
上記目的を達成するために、本発明による物体検出装置は、
画像を取得する画像取得手段(2)と、
画像取得手段が取得した画像の各部において、検出すべき特定対象物に関して、当該特定対象物の全体形状である確からしさを示す第1の評価値、特定対象物を構成する複数のパーツに関して、特定対象物に対する相対位置を考慮しつつ、各パーツである確からしさを示す第2の評価値、及び各パーツ同士の相対的位置関係の確からしさを示す第3の評価値を算出し、それら第1から第3の評価値に基づき、特定対象物である確からしさを表す評価点を算出する算出手段(11、21〜25、31〜35)と、
算出手段が算出した評価点に基づき、画像に特定対象物が映し出されているか否かを判定する判定手段(40、41)と、を有し、
算出手段は、特定対象物が部分的に画像に映し出された場合に備えて、その映し出されるパーツの組み合わせが異なる複数の隠れパターン毎に、第1から第3の評価値のそれぞれに重み付けを与える重みのセットを別個に有しており、それら別個の重みセットにより第1から第3の評価値に重み付けを与えつつ、複数の評価点を算出し、
判定手段は、算出手段により算出された複数の評価点に基づいて、特定対象物が映し出されているか否かを判定することを特徴とする。
上述したように、算出手段は、特定対象物である確からしさを表す評価点を算出する基礎となる評価値の1つとして、その特定対象物を構成する複数のパーツ同士の相対的位置関係の確からしさを示す第3の評価値を用いる。このため、特定対象物の全体が画像に映し出されていなくとも、少なくとも2つのパーツが画像に映しだされていれば、その2つのパーツの相対的位置関係の確からしさを示す第3の評価値は相対的に大きい値が算出されることになる。このため、その第3の評価値に基づき算出される評価点も相対的に大きくなり、その評価点に基づき、特定対象物を検出することが可能になる。
上述した構成において、算出手段は、特定対象物が部分的に画像に映し出された場合に備えて、その映し出されるパーツの組み合わせが異なる複数の隠れパターン毎に、第1から第3の評価値のそれぞれに重み付けを与える重みのセットを別個に有しており、それら別個の重みセットにより第1から第3の評価値に重み付けを与えつつ、複数の評価点を算出し、判定手段は、算出手段により算出された複数の評価点に基づいて、特定対象物が映し出されているか否かを判定す
このように、複数の隠れパターン毎に設定された第1から第3の評価値のそれぞれに重み付けを与える重みのセット用いることで、例えば、画像に映しだされているパーツの内、より特定対象物の特徴を表しやすいパーツの重みを大きくしたりといったことができるようになる。その結果、特定対象物の一部しか画像に映しだされていない場合であっても、より精度良く、その特定対象物の検出を行うことが可能になる。
なお、上記括弧内の参照番号は、本発明の理解を容易にすべく、後述する実施形態における具体的な構成との対応関係の一例を示すものにすぎず、なんら本発明の範囲を制限することを意図したものではない。
また、上述した特徴以外の本発明の特徴に関しては、後述する実施形態の説明及び添付図面から明らかになる。
実施形態に係る物体検出装置の構成を示す構成図である。 物体検出演算部における、特定対象物を検出するためのアルゴリズムを示す図である。 特定対象物である四輪車の各種の形態に応じたモデル、及びそれらのモデルに対応して設定されたルートフィルタ、パーツフィルタ、及び変位コストマップの例を示す図である。 四輪車のサイドモデルにおいて設定されたパーツについて説明するための図である。 歩行者モデルの一例に対して設定されたルートフィルタ、パーツフィルタ、及び変位コストマップを示す図である。 歩行者モデルを例にとって、ルートスコア及びパーツスコアの算出の手順について説明するための図である。 四輪車のサイドモデルを例として、隠れパターンについて説明するための図である。 四輪車のサイドモデルについて設定される4つの隠れパターンを説明するための図である。 四輪車のサイドモデルについて設定される他の隠れパターンを説明するための図である。 四輪車のバックモデルについて設定される3つの隠れパターンを説明するための図である。 異なるパーツのパーツフィルタの適用位置における、x軸方向の距離、y軸方向の距離の算出方法を示す図である。 異なるタイプの四輪車において、パーツ同士の相対的位置関係が相違することを示した図である。 パーツ同士の相対的位置の存在確率分布を示す図である。 画像においてパーツPとパーツPが見えている第1隠れパターンを、条件付き確率場においてモデル化した例を示す図である。 画像においてパーツP〜パーツPが見えている第2隠れパターンを、条件付き確率場においてモデル化した例を示す図である。 本実施形態の効果について説明するための図である。 本実施形態の効果について説明するための図である。 本実施形態の別の効果について説明するための図である。
以下、本発明の実施形態に係る物体検出装置について、図面を参照しつつ説明する。なお、本実施形態においては、物体検出装置を車両に適用し、車両の進行方向に存在する四輪車や歩行者を特定対象物として検出する例について説明する。ただし、特定対象物は、四輪車や歩行者に限られず、二輪車やその他の移動体を含めても良い。また、本発明による物体検出装置の適用対象は車両に限られる訳ではなく、例えば、物体検出装置を所定位置に固定して設置し、ある監視領域に侵入した不審者などを検出するために用いられても良い。
図1は、本実施形態による物体検出装置1の構成を示す構成図である。図1に示すように、物体検出装置1は、カメラ2と物体検出演算部3とによって構成される。
カメラ2は、例えば、電荷結合素子(CCD)からなる画像センサを内蔵し、自車両の前方を撮影することができるように、ルームミラーの裏側などに設置される。このカメラ2は、所定周期で自車両前方の画像を撮影し、その撮影した画像の画素毎の明るさ(輝度)を示す画像信号を、物体検出演算部3へ出力する。
物体検出演算部3は、カメラ2によって撮影された画像の中に、検出すべき特定対象物である四輪車や歩行者が映しだされている場合に、その特定対象物を検出するものである。物体検出演算部3は、その検出結果を、アプリケーション制御装置4へ出力する。
アプリケーション制御装置4は、物体検出装置1によって特定対象物が検出された場合に、所定のアプリケーションを実行するものである。所定のアプリケーションには、自車両の乗員に、四輪車や歩行者の存在を報知して注意を促す注意喚起アプリケーション、所定距離まで近づいたときに警告を与える衝突予防アプリケーション、及び、衝突の可能性が生じた場合に、自動ブレーキをかけたり、ステアリングを自動操舵したりする衝突回避アプリケーションなどが含まれる。
次に、物体検出演算部3による、特定対象物の検出手法について説明する。図2は、物体検出演算部3における、特定対象物である四輪車や歩行者を検出するためのアルゴリズムを示している。
まず、ブロック11において、入力画像10からHOG(Histograms of Oriented Gradients)特徴が演算される。このHOG特徴は、良く知られているように、画像の局所領域における輝度の勾配方向をヒストグラム化した特徴量である。この勾配方向ヒストグラムは、近傍の異なる局所領域(ブロック)にて正規化されることで、対象の形状、向き等の多少の変動に対しても頑強なものとなる。
本実施形態では、詳しくは後述するが、ブロック11において、解像度の異なる2種類のHOG特徴が演算される。例えば、高解像度のHOG特徴は、4×4ピクセルを1セルとして、輝度の勾配方向ヒストグラムを作成し、低解像度のHOG特徴は、8×8ピクセルを1セルとして、輝度の勾配方向ヒストグラムを作成する。
ブロック11により演算されたHOG特徴は、ブロック21,31に与えられる。ブロック21、31は、それぞれ、予め定められたモデルに関して、該当するモデルのルートスコア、パーツスコア、モデルに対するパーツの変位コスト、及びパーツ位置を算出する。
ここで、ブロック21,31において、それぞれ予め定められているモデルについて説明する。例えば、四輪車の場合、その四輪車が、どの方向から撮影されたかに応じて、画像に映し出される四輪車の形態は大きく異なる。一例として、図3に示すように、四輪車が、前方から撮影された場合、後方から撮影された場合、斜め後方から撮影された場合、及び斜め前方から撮影された場合、それぞれ、四輪車の形態は異なる。撮影された画像に四輪車が映し出されたとしても、その画像が撮影された時点では、四輪車がいずれの方向から撮影されたかは分からない。そのため、どの方向から撮影されたとしても、画像に映し出されている四輪車を検出できるように、図3に示すように、複数のモデル(フロントモデル、バックモデル、サイドバックモデル、サイドフロントモデルなど)が予め定められる。なお、図3に示したモデルがすべてではなく、例えば、サイドモデルなども使用される。さらに、必要に応じて、ライトサイドモデル、レフトサイドモデル、ライトサイドバック、レフトサイドバックなど、左右のモデルが別個に設定されても良い。
ただし、図3は以下の公知の先行文献より一部引用した。
Niknejad H.T., Mita S. , McAllester D. , Naito T. , "Vision-Based Vehicle Detection for Nighttime with Discriminately Trained Mixture of Weighted Deformable Part Models"14th International IEEE Conference on Intelligent Transportation Systems, 2011, pp.1560-1565.
Niknejad, H.T., Takahashi K. , Mita S. , McAllester D. , "Vehicle detection and tracking at nighttime for urban autonomous driving ", IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2011, pp. 4442-4447.
そして、本実施形態では、このように、同一特定対象物について種々のモデルを定めた上で、各モデルが、画像に映し出されている確からしさを判断するための指標である評価点を算出する。各ブロック21,31において算出される、設定されたモデル毎のルートスコア、パーツスコア、モデルに対するパーツの変位コスト、及びパーツ位置は、各モデルの評価点の算出のために用いられる評価値やパラメータとなる。このため、各ブロック21、31は、設定されたモデルの数だけ設けられる。
ルートスコアは、それぞれ定められたモデルの全体形状が、画像に映しだされている確からしさを示す評価値である。このルートスコアの算出方法を以下に説明する。
本実施形態では、上述したように、ブロック11において、撮影した画像のHOG特徴が演算される。そのHOG特徴画像に対して、HOG特徴により各モデルの全体形状を表したルートフィルタを適用し、どの程度、相関性があるかに応じてルートスコアが算出される。
ルートフィルタは、検出対象とすべき様々なタイプの四輪車(セダン、ワゴン、SUVなど)の実際の画像からHOG特徴を得つつ、SVM(support vector machine)などを用いた学習により求められたHOG特徴によるテンプレートである。従って、HOG特徴画像において、ルートフィルタにより表現されるHOG特徴と相関性の高いHOG特徴が見出された場合、そのHOG特徴は、四輪車によるものである可能性が高いといえる。なお、ルートフィルタは、各モデル毎に事前に設定され、ブロック22、32に記憶される。そして、ブロック21において、ルートスコアを算出する際に、ブロック22からブロック21に、記憶されたルートフィルタが与えられる。
ルートフィルタを用いて、ルートスコアを算出する場合、HOG特徴画像全体に渡って、ルートフィルタを所定ピクセル間隔で移動させる。そして、ルートフィルタの適用位置毎に、ルートフィルタとの相関性を示す値であるルートスコアを算出する。この際、画像に映し出される四輪車のサイズが変化することを考慮し、ルートスコアを算出するHOG特徴画像が、複数種類のサイズの画像として算出される。このように、画像内のどの位置において、どのような大きさで特定対象物が映し出されるかが分からない場合、画像内の様々な位置と大きさにて、ルートフィルタを走査させながら、ルートフィルタとの相関性を計算する必要がある。このような場合、公知のIntegral Histogramの処理を適用することで、計算処理の高速化を図ることができる。Ingetral Histogramに関しては、例えば「Integral Histrogram; −A fast way to extract histograms in cartesion space」(CVPR2005)に詳しく説明されているため詳細は省略する。
パーツスコアは、各モデルを構成するパーツの形状が、画像に映しだされている確からしさを示す評価値である。本実施形態では、ルートスコアに加えて、パーツスコア及び後述する変位コストも用いることで、特定対象物の検出精度を高めている。
例えば、図4に示す四輪車のサイドモデルでは、そのサイドモデルの特徴的部分としてのパーツが、車両前方部P1、フロントタイヤP2、フロントサイドウインドウP3、リアドアP4、車両後方部P5、及びリアタイヤP6に定められている。そして、これらのパーツ(車両前方部P1、フロントタイヤP2、フロントサイドウインドウP3、リアドアP4、車両後方部P5、及びリアタイヤP6)の確からしさをそれぞれ算出するために、各パーツのパーツフィルタが予め設定され、ブロック22、32に記憶されている。なお、図3には、各モデル毎に、各モデルを構成する複数のパーツのために設定されたパーツフィルタが描かれている。
パーツフィルタは、ルートフィルタと同様に、検出対象とすべき様々なタイプの四輪車の実際の画像から各パーツのHOG特徴を得つつ、SVMなどを用いた学習により求められたHOG特徴によるテンプレートである。従って、HOG特徴画像において、パーツフィルタにより表現されるHOG特徴と相関性の高いHOG特徴が見出された場合、そのHOG特徴は、該当するパーツを示している可能性が高いといえる。なお、パーツフィルタについても、ルートフィルタと同様に、HOG特徴画像のサイズを様々なサイズに変化させつつ、その画像上を所定ピクセル間隔で移動させる。そして、パーツフィルタの適用位置毎にパーツスコアが算出される。
モデルに対するパーツの変位コストは、モデル全体に対するパーツの相対位置の適正度合いを示すものである。例えば、ある領域のパーツスコアが高い場合であっても、その領域にパーツが存在すると仮定したとき、そのパーツに対して、あるべき位置にモデルが存在しなければ、その領域にはパーツが存在する可能性は低いといえる。変位コストは、このようなモデルとパーツとの相対位置関係に基づき、パーツが存在する確からしさを評価するためのものである。
この変位コストの算出方法の具体例について説明する。まず、特定対象物として検出すべき様々なタイプの四輪車について、モデルと各パーツとの相対位置の関係を調べる。そして、モデルとパーツとの相対位置として適性度が高い範囲ほど確率が高くなり、適性度が低い範囲ほど確率が低くなる変位コストマップを定める。図3には、各モデルの各パーツ毎に設定された変位コストマップが示されている。
この変位コストマップを用い、変位コストは、例えば、以下のようにして算出される。上述したように、様々なサイズのHOG特徴画像の各部に、ルートフィルタ及びパーツフィルタが適用されて、各サイズの各位置に対して、それぞれルートスコア及びパーツスコアが算出される。このとき、同じサイズのHOG特徴画像における、ルートフィルタの適用位置に対するパーツフィルタの相対的な適用位置から、変位コストマップを用いて、相対位置の適正度に応じた変位コストを決定する。例えば、ルートフィルタの位置が固定され、そのルートフィルタに対するパーツフィルタの位置を変化させ、変位コストマップにより、相対位置の適性度に応じた変位コストを定める。この変位コストは、パーツフィルタの適用位置において算出されるパーツスコアに加算される。このようにして、変位コストを加味した値に修正されたパーツスコアの最大値を取る位置として、あるモデルの位置に対する最適なパーツフィルタの相対位置が算出される。このときのパーツスコアと変位コストがあるモデルの位置に対するパーツスコアと変位コストである。このようにすることにより、各パーツが、モデルに対する相対位置として、本来有るべき位置の範囲に存在するときに、より高いパーツスコアが算出され、そのパーツスコアに基づき、モデルとパーツとの最適な相対位置を求めることができる。
以上がルートスコア及びパーツスコアの算出の手順である。さらにこの算出を効率的に行う実施例として、歩行者を例に取り、図5及び図6を参照して説明する。なお、図5及び図6は以下の公知の先行文献より一部引用した。
Felzenszwalb, P.F. ; Girshick, R.B. ; McAllester, D. ; Ramanan, D., "Object Detection with Discriminatively Trained Part-Based Models" IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 32, No.9 , pp. 1627-1645, 2010.
図5は、歩行者モデルの一例に対して設定されたルートフィルタ、パーツフィルタ、及び変位コストマップを示している。図5に示す歩行者モデルでは、パーツとして、頭部、右胴体部、左胴体部、脚上部、及び脚下部の5つが定められている。これに応じて、パーツフィルタ及び変位コストマップも、それら5つのパーツに対応するように定められている。
図6に示すように、まず、入力画像50に基づき、低解像度のHOG特徴画像51と、高解像度のHOG特徴画像54が生成される。そして、ルートフィルタ52は、低解像度のHOG特徴画像51に適用され、パーツフィルタ55,58は、高解像度のHOG特徴画像54に適用される。このようにルートフィルタ52とパーツフィルタ55、58を適用するHOG特徴画像の解像度を異ならせている理由は、ルートフィルタ52のサイズが、パーツフィルタ55、58のサイズよりも大きいので、それぞれのサイズに見合った解像度とするためである。ただし、ルートフィルタ52とパーツフィルタ55、58とは、同じ解像度のHOG特徴画像に適用されても良い。
HOG特徴画像51の各所に、ルートフィルタ52を適用してルートスコアが算出される。図6では、そのルートスコアを算出位置ごとにまとめたルートスコアマップ53を示している。しかし、これは効率的に計算を行うためであり、必ずしもルートスコアマップ53を生成する必要はない。なお、図6において、ルートスコアマップ53は、高スコアであるほど明度が明るく、低スコアであるほど明度が暗くなるように示されている。
同様に、HOG特徴画像54の各所に、各パーツフィルタ55,58が適用されることにより、各パーツのパーツスコアが算出される。図6では、それらの各パーツスコアを算出位置ごとにまとめたパーツスコアマップ56,59も示している。このパーツスコアマップ56、59によって示される各部のパーツスコアに、上述した変位コストを加算して修正したパーツスコアが算出される。図6には、この修正パーツスコアの最大値を算出位置ごとにまとめた修正パーツスコアマップ57、60も示されている。言い換えれば、修正パーツスコアマップ57、60は、モデルの算出位置においてパーツの相対位置が最適である場合のパーツスコアと変位スコアの和を表している。しかし、これは効率的に計算を行うためであり、必ずしも修正パーツスコアマップ57,60を生成する必要はない。この図6に示した各マップ56、57、59、60から理解されるように、変位コストにより、各パーツが映し出されている画像に対応する箇所のパーツスコアが高められる。
そして、ルートスコアと修正パーツスコアとを加算することで特定対象物を検出するためのスコアを得ることができる。特定対象物が存在する場合には、変位コストを加味したパーツスコアを利用することで、特定対象物が存在する位置のスコアを高めることができる。その結果、例えばルートスコアのみを利用する場合に比較して、特定対象物の検出精度を高めることができる。
しかしながら、特定対象物の一部が建造物等の影に隠れていたり、撮影された画像内に特定対象物の一部しか映し出されていなかったり、いわゆるオクルージョンが生じた場合、上述した手法によっても、特定対象物を検出できない虞がある。
そこで、本実施形態では、検出すべき特定の対象物の一部しか画像に映しだされていない場合であっても、その特定対象物の検出を可能とすべく、図2に示すように、ブロック23,33において、各パーツ同士の相対的位置関係の確からしさを示すスコアをさらに加味(加算)して、隠れパターンに応じて、それぞれ、特定対象物が存在する確からしさを示す評価点を算出するようにした。以下に、ブロック23,33における評価点の算出手法について説明する。
ブロック23,33には、各モデル毎に予め定められた複数の隠れパターン毎に、特定対象物もしくはその一部が存在する確からしさを示す評価点を算出する複数のブロック24、25、34、35が含まれている。評価点の具体的な算出方法を説明する前に、まず、隠れパターンについて説明する。
上述したように、本実施形態では、各モデル毎に、各モデルを構成する特徴部分として複数のパーツが予め定められている。オクルージョンが発生した場合、図7(a)〜(c)に示すように、特定対象物である四輪車の一部が建造物などの影に隠れたりする。しかし、画像に映し出される部分に着目すると、四輪車の一部が隠れているパターンを、見えているパーツの組み合わせにより分類することができる。
例えば、図7(a)〜(c)に示すように、四輪車のサイドモデルにおいて、車両前方部P1とフロントタイヤP2とが見えている状態を第1隠れパターン、車両前方部P1とフロントタイヤP2に加えてフロントサイドウインドウP3が見えている状態を第2隠れパターン、さらに、リアドアP4まで見えている状態を第3隠れパターンとして定めることができる。このように、四輪車のサイドモデルにおいて、その前方向から後方向に向かって徐々に見えるパーツの数が増えるように隠れパターンを設定した場合、例えば、図8に示すように、4つの隠れパターンを設定することができる。ただし、図8に示す例において、P1〜P4とP6のパーツが見えている状態となる隠れパターンを追加して、合計5つの隠れパターンを設定することも可能である。
図7及び図8では、四輪車のサイドモデルにおいて、四輪車の前方向から後ろ方向に向かって、徐々に見えるパーツの数が増えるように、隠れパターンを設定することについて説明した。しかし、隠れパターンは、さらに、種々の状態を考慮して設定することが好ましい。例えば、他車両が後進する場合などは、他車両の後部から見え始める場合がある。そのため、四輪車のサイドモデルにおいて、図9(a)〜(c)に示すように、車両後方部P5とリアタイヤP6が見える状態、それらに加えてリアドアP4が見える状態、さらに、フロントサイドウインドウP3が見える状態を、それぞれ隠れパターンとして設定しても良い。さらに、看板や樹木などにより、車両の上部が隠れたり、下部が隠れたりすることも考えられる。そのため、四輪車のサイドモデルにおいて、上部が隠れることを考慮し、例えば、車両前方部P1、フロントタイヤP2、及びリアタイヤP6が見えている状態を1つの隠れパターンとして設定しても良い。また、下部が隠れることを考慮して、例えば、車両前方部P1、フロントサイドウインドウP3、及び車両後方部P5が見えている状態を1つの隠れパターンとして設定しても良い。
以上、四輪車のサイドモデルを例にとって、隠れパターンについて説明した。もちろん、サイドモデルばかりでなく、図10に示すバックモデルなどの他のモデルにおいても、同様の考え方で、見えているパーツの組み合わせにより、複数の隠れパターンが設定される。図10に示す例では、レフトテールランプP5とレフトリアタイヤP6が見える状態を第1の隠れパターン、それらに加えて、リアウインドウP3とテール中央部P4が見える状態を第2の隠れパターン、さらにライトテールランプP2とライトリアタイヤP1が見える状態を第3の隠れパターンとしている。
ただし、各モデルの隠れパターンに関しては、実際に四輪車の各部が隠れた多数のサンプル画像を用意し、それらのサンプル画像から隠れパターンを抽出することにより、隠れパターンを学習することが好ましい。その具体的手法として、例えば、各サンプル画像について、ルートスコア、パーツスコア、変位コスト、及びパーツ位置を算出する。そして、算出したルートスコア、パーツスコア、変位コスト、及びパーツ位置に基づいて、サンプル画像をいくつかのクラスターに分類する。そして、分類されたクラスター毎に、隠れパターンを設定する。このようにすれば、実際に起こりえる隠れパターンをサンプル画像に含まれる発生頻度に応じて、漏れ無く設定することができる。
このようにして、各モデルに対して、複数の隠れパターンを設定した後、各隠れパターンについて、特定対象物もしくはその一部が存在する確からしさを示す評価点を算出するための算出式を定める。これは条件付き確率場(Conditional Random Field)の考え方に基づき、ルートスコア、変位コストを考慮したパーツスコア、及び、それらの間の相対的位置関係の確からしさを示すスコアから算出する(以下、変位コストを考慮したパーツスコアを、単にパーツスコアと読むことにする)。この算出式の基本形を、下記の数式1に示す。なお、以下の数式1は、図4に示された、6個のパーツを有するサイドモデルの各隠れパターンに関して、評価点を算出するための算出式の基本形を示している。
Sは評価点、添字kは隠れパターンの番号、Fはルートスコア、fは各パーツ毎に算出される、パーツスコアを示している。また、Δ ijは、図11に示すように、それぞれ異なるパーツ(図11では、P1とP2)のパーツスコアを算出するためのパーツフィルタiとパーツフィルタjとの適用位置のx軸方向の距離を示している。同様に、Δ ijは、図11に示すように、パーツフィルタiとパーツフィルタjとの適用位置のy軸方向の距離を示している。さらに、N(μ ij,σ ij )は、パーツフィルタi,jの適用位置のx軸方向の距離から、パーツ同士の相対的位置関係の確率分布を定めた平均μ ij、分散σ ij の正規分布である。同様に、N(μ ij,σ ij )は、パーツフィルタi,jの適用位置のy軸方向の距離から、パーツ同士の相対的位置関係の確率分布を定めた平均μ ij、分散σ ij の正規分布である。
ここで、本実施形態において検出対象とする四輪車は、その大きさやタイプにおいて多くのバリエーションがある。例えば、図12(a)はセダンタイプの四輪車を示し、図12(b)はSUVタイプの四輪車を示している。図12(a)、(b)に示されるように、四輪車の大きさやタイプが異なると、同じパーツであっても、パーツ同士の相対的位置関係は相違する。そのため、本実施形態では、様々な大きさやタイプの四輪車のパーツ同士の相対的位置関係を調べ、その結果を、対象となるパーツの組みごとにまとめる。すると、例えば、図13に示すような確率分布図(正規分布図)を得ることができる。なお、図13において、μは分布の平均値を表し、σは分散の大きさを表している。すなわち、μとσにより、該当するパーツ同士の相対的位置の存在確率を示す確率分布の形態を表すことができる。そして、この異なるパーツ同士の相対的位置の存在確率を、異なるパーツ同士の相対的位置関係の確からしさを示すスコアとして用いる。これらパーツ同士の相対的位置関係のパラメータ(μ ij、μ ij、σ ij 、σ ij )は、観測したサンプル画像から最適値を求める。
このように、本実施形態では、四輪車である確からしさを表す評価点Sを算出する基礎となるスコア(評価値)として、上述したルートスコア及びパーツスコアに加えて、四輪車を構成する複数のパーツ同士の相対的位置関係の確からしさを示すスコアを用いる。このため、四輪車の全体が画像に映し出されていなくとも、少なくとも2つのパーツが画像に映しだされていれば、その2つのパーツの相対的位置関係の確からしさを示すスコアは相対的に大きい値が算出されることになる。従って、そのスコアに基づき算出される評価点Sも相対的に大きくなり、その評価点Sに基づき、画像に部分的に映しだされている四輪車を検出することが可能になる。
そして、上記の数式1に示した評価点Sの算出式において、ω は、ルートスコアに乗じられる重みである。ω は、各パーツスコアに対して別個に設定され、対応するパーツスコアにそれぞれ乗じられる重みである。φxk ijは、x軸方向における、異なるパーツ同士の相対的位置関係の確からしさを示すスコアに乗じられる重みである。また、φyk ijは、y軸方向における、異なるパーツ同士の相対的位置関係の確からしさを示すスコアに乗じられる重みである。
このように、本実施形態では、ルートスコア(F)、パーツスコア(f)、及び異なるパーツ同士の相対的位置関係の確からしさを示すスコア(N(Δx ij|μ ij,σ ij )、N(Δ ij|μ ij,σ ij ))のそれぞれに重み付けを与える重みのセット(ω 0、ω 、φxk ij、φyk ij)を、隠れパターンごとに別個に有している。この重みのセットを用いることにより、それぞれの隠れパターン毎に適切な評価点Sを算出することができるようになる。つまり、隠れパターン毎に設定された重みのセット用いることで、例えば、見えているパーツの内で、より四輪車の特徴を表しやすいパーツの重みを大きくしたりといったことができるようになる。また、例えば四輪車の一部しか画像に映しだされていない場合であっても、見えているパーツスコアの重みと見えているパーツ同士の位置関係の重みを大きくすることで、より精度良く、その四輪車の検出を行うことが可能になる。
次に、重みのセット(ω 0、ω 、φxk ij、φyk ij)の設定方法について説明する。重みのセット(ω 0、ω 、φxk ij,φyk ij)は、収集したサンプル画像から各隠れパターン毎に最適値を学習することによって設定される。
例えば、図14は、画像において、パーツPとパーツPが見えている第1隠れパターンをモデル化した例を示している。なお、図14において、Pは、四輪車(特定対象物)の全体形状を示すモデルを表している。
図14に示すモデル化された第1隠れパターンは、四輪車全体のモデルPと、パーツP、Pとからなる。そして、このモデル化された隠れパターンにおいて、ルートスコアFの重みω 、パーツスコアf、fの重みω 、ω 、及びモデルPとパーツPとパーツPとの相対的位置関係の確からしさを示すスコアの重みφ 01=(φx1 01、φy1 01)、φ 02=(φx1 02、φy1 02)、φ 12=(φx1 12、φy1 12)が学習により最適値に設定される。
なお、四輪車全体のモデルPとパーツP、Pとの相対的位置関係の確からしさは、上述した変位コストとして算出され、パーツスコアに加算されている。そして、パーツスコアに対する重みω 、ω が学習されているので、図14に示す、四輪車全体のモデルPとパーツP、Pとの相対的位置関係の確からしさに対する重みφ 01=(φx1 01、φy1 01)、φ 02=(φx1 02、φy1 02)は学習対象から除外しても良い。一方、これらの重みφ 01=(φx1 01、φy1 01)、φ 02=(φx1 02、φy1 02)を学習対応とする場合には、変位コストを考慮したパーツスコアと、相対的位置関係の確からしさのそれぞれに対する重みを別々に定めることになるので、より適切な評価点が算出できる。
さらに、図14では、第1隠れパターンにおいて見えているパーツP、Pに関してのみ図示されているが、見えていないパーツP、P、Pに関しても、パーツスコアに対応する重み、及びパーツ同士の相対的位置関係の確からしさを示すスコアの重みを学習しても良い。この場合、最適値の学習の結果、見えているパーツのパーツスコアよりも、見えていないパーツのパーツスコアに対する重みが小さくなるように設定される。この場合、重みはゼロ、もしくはマイナスとなっても良い。重みがゼロの場合は、見えていないパーツを考慮しない場合と同じ評価点Sとなる。重みがマイナスとなった場合は、見えるべきでないパーツが見えているときの評価点Sがより小さくなり、その見えているパーツを含む隠れパターンに対応した評価点Sとの差異をより大きくすることができる。このように見えていないパーツに関する重みを考えることで、見えていないパーツ同士の関係を完全に考慮しないということがなくなり、より適切な評価点が算出できる。
また、パーツP〜パーツPが見えている第2隠れパターンをモデル化した例を、図15に示す。この場合、モデル化された第2隠れパターンは、四輪車全体のモデルPと、パーツP、P、Pとからなる。そして、このモデル化された第2隠れパターンでは、ルートスコアFの重みω 、及び、パーツスコアf、f、fの重みω 、ω 、ω に加えて、少なくとも、パーツPとパーツPとの相対的位置関係の確からしさを示すスコアの重みφ 12=(φx2 12、φy2 12)、パーツPとパーツPとの相対的位置関係の確からしさを示すスコアの重みφ 13=(φx2 13、φy2 13)、及びパーツPとパーツPとの相対的位置関係の確からしさを示すスコアの重みφ 23=(φx2 23、φy2 23)が学習により最適値に設定される。なお、第1隠れパターンでの例と同様に、見えていないパーツに関する重みを学習しても良い。また、モデルPとの相対的位置関係の確からしさを示すスコアの重みを学習しても良い。
上述した各種の重みの学習は、モデル化された隠れパターンにおいて、それぞれ、その隠れパターンとして、見えているべきパーツが画像に映しだされた正サンプル画像と、見えているべきパーツが画像に映しだされていない負サンプル画像とを用いて行われる。つまり、正サンプル画像及び負サンプル画像について、それぞれ評価点Sを算出し、正サンプル画像の評価点Sが大きくなり、負サンプル画像の評価点Sが小さくなるように、各重みを学習する。例えば、1つの学習の方法として本実施形態では、確率的勾配降下法(Stochastic Gradient Descent)を用いる。
再び、図2を参照して説明を続ける。ブロック24、25、34、35において、各モデル毎に予め定められた複数の隠れパターン毎に、特定対象物もしくはその一部が存在する確からしさを示す評価点Sが算出されると、それらの評価点Sは、ブロック40に出力される。
ブロック40では、各ブロック24、25、34、35から出力された評価点Sの中で、最大の評価点Smaxを抽出する。最大の評価点Smaxが、入力画像10において、最も映しだされている可能性が高い四輪車の形態(モデル)を示しているためである。そして、ブロック40にて抽出された最大評価点Smaxはブロック41に与えられ、所定の閾値と比較される。そして、最大評価点Smaxが所定の閾値以上であれば、四輪車が映像に映しだされていると判断し、四輪車の検出を行う。
上述した手法にて評価点Sを算出するとともに、物体検出を行うことにより、例えば、図16に示すように、側道から、自車両が走行する道路に進入しようとする他車両があり、その他車両の後部が建造物によって隠れて見えない場合でも、その他車両を検出することが可能となる。すなわち、本実施形態では、他車両の大部分が見えなくとも、その他車両を検出することができる。そのため、図17に示すように、ルートスコアと変位コストを加味したパーツスコアとにより物体検出を行う比較例よりも、他車両との距離が十分に離れている、かなり早いタイミングで、他車両の検出を行うことが可能となる。従って、自車両の運転者は、事前に速度を低下させるなど、余裕を持って、危険回避のための運転操作を行うことができるようになる。
さらに、本実施形態では、モデル全体に対するパーツの位置の確からしさを示す変位コストだけではなく、パーツ同士の相対的位置関係の確からしさを示すコストも利用して物体検出を行なっている。このため、図18に示すように、ルートスコアと変位コストを加味したパーツスコアとから物体検出を行う比較例よりも、物体検出の正確性を高めることができる。
以上、本発明の好ましい実施形態について説明したが、本発明は、上述した実施形態になんら制限されることなく、本発明の主旨を逸脱しない範囲において、種々変形して実施することができる。
例えば、上述した実施形態では、特定対象物の検出のためにHOG特徴を用いたが、その他の画像特徴量、例えばHaar−Like特徴、SIFT(Scale−Invariant Feature Transform)、SURF(Speeded Up Robust Feature)等の周知の特徴量を用いても良い。
また、上述した実施形態では、特定対象物の検出のために、出力された評価点Sから最大の評価点Smaxを抽出し、その結果を閾値と比較したが、別の方法で物体の検出を行っても良い。例えば、複数のモデルが車両の車種(セダン、ワゴン、トラック)と方向(フロント、サイド、リア)のそれぞれに対して用意されているような場合を考える。このとき、これらモデルのそれぞれに対して、隠れパターンが設定される。ところで、セダンとワゴンのサイドモデルにおいて、車両後部が隠れるような隠れパターンでは、見えている部分は似た形状となる。そこで、複数のモデルに対する同じ隠れパターンに対応する評価点Sをひとつのグループにまとめ、グループごとに評価点Sと閾値との比較結果を投票し、その数が一定数より大きい場合に、検出するようにしてもよい。
1 物体検出装置
2 カメラ
3 物体検出演算部
4 アプリケーション制御装置

Claims (5)

  1. 画像を取得する画像取得手段(2)と、
    前記画像取得手段が取得した画像の各部において、検出すべき特定対象物に関して、当該特定対象物の全体形状である確からしさを示す第1の評価値、前記特定対象物を構成する複数のパーツに関して、前記特定対象物に対する相対位置を考慮しつつ、各パーツである確からしさ示す第2の評価値、及び各パーツ同士の相対的位置関係の確からしさを示す第3の評価値を算出し、それら第1から第3の評価値に基づき、前記特定対象物である確からしさを表す評価点を算出する算出手段(11、21〜25、31〜35)と、
    前記算出手段が算出した評価点に基づき、前記画像に前記特定対象物が映し出されているか否かを判定する判定手段(40、41)と、を有し、
    前記算出手段は、前記特定対象物が部分的に前記画像に映し出された場合に備えて、その映し出されるパーツの組み合わせが異なる複数の隠れパターン毎に、前記第1から第3の評価値のそれぞれに重み付けを与える重みのセットを別個に有しており、それら別個の重みセットにより前記第1から第3の評価値に重み付けを与えつつ、複数の評価点を算出し、
    前記判定手段は、前記算出手段により算出された複数の評価点に基づいて、前記特定対象物が映し出されているか否かを判定することを特徴とする物体検出装置。
  2. 前記重みのセットは、隠れパターンとして映し出されるべきパーツが映し出された正サンプル画像と、映し出されるべきパーツが映し出されていない負サンプル画像を用いて、前記複数の隠れパターン毎に、学習により設定されることを特徴とする請求項1に記載の物体検出装置。
  3. 前記算出手段は、前記特定対象物を複数の方向から見た場合の、前記特定対象物の全体形状、前記特定対象物を構成する複数のパーツ、及び各パーツ同士の相対的位置関係について、それぞれ第1から第3の評価値を算出するとともに、それら複数組の第1から第3の評価値から複数の評価点を算出し、
    前記判定手段は、前記算出手段により算出された複数の評価点に基づいて、前記特定対象物が映し出されているか否かを判定することを特徴とする請求項1又は2に記載の物体検出装置。
  4. 前記算出手段は、前記第1から第3の評価値の重み付き和として、前記評価点を算出することを特徴とする請求項1又は2に記載の物体検出装置。
  5. 前記算出手段は、前記画像を所定領域毎に細分化し、その所定領域内の輝度の勾配方向をヒストグラム化して、画像特徴量を算出する特徴量算出手段(11)を有し、当該特徴量算出手段が算出した画像特徴量に基づき、前記特定対象物の全体形状である確からしさを示す第1の評価値、及び前記特定対象物を構成する各パーツである確からしさ示す第2の評価値を算出するものであり、
    前記特徴量算出手段は、前記特定対象物の全体形状である確からしさを示す第1の評価値を算出するための第1の画像特徴量と、前記特定対象物を構成する各パーツである確からしさ示す第2の評価値を算出するための第2の画像特徴量とをそれぞれ算出し、前記第1の画像特徴量よりも前記第2の画像特徴量の方が解像度が高いことを特徴とする請求項1乃至のいずれかに記載の物体検出装置。
JP2013127820A 2013-06-18 2013-06-18 物体検出装置 Active JP6171608B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013127820A JP6171608B2 (ja) 2013-06-18 2013-06-18 物体検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013127820A JP6171608B2 (ja) 2013-06-18 2013-06-18 物体検出装置

Publications (2)

Publication Number Publication Date
JP2015001966A JP2015001966A (ja) 2015-01-05
JP6171608B2 true JP6171608B2 (ja) 2017-08-02

Family

ID=52296423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013127820A Active JP6171608B2 (ja) 2013-06-18 2013-06-18 物体検出装置

Country Status (1)

Country Link
JP (1) JP6171608B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6377533B2 (ja) * 2015-01-06 2018-08-22 Kddi株式会社 オクルージョン発生時に専用の識別器を用いて物体を追跡する装置、プログラム及び方法
JP6766950B2 (ja) * 2017-03-22 2020-10-14 日本電気株式会社 物体検出装置、物体検出方法および物体検出プログラム
WO2021033273A1 (ja) * 2019-08-20 2021-02-25 日本電信電話株式会社 推定プログラム、推定装置、検出モデルの生成方法、学習方法、および、学習装置

Also Published As

Publication number Publication date
JP2015001966A (ja) 2015-01-05

Similar Documents

Publication Publication Date Title
KR102109941B1 (ko) 라이다 센서 및 카메라를 이용한 객체 검출 방법 및 그를 위한 장치
Asvadi et al. 3D object tracking using RGB and LIDAR data
US10442438B2 (en) Method and apparatus for detecting and assessing road reflections
US20180204076A1 (en) Moving object detection and classification image analysis methods and systems
CN106647776B (zh) 车辆变道趋势的判断方法、判断装置和计算机存储介质
Kim et al. Robust detection of non-motorized road users using deep learning on optical and LIDAR data
US10867403B2 (en) Vehicle external recognition apparatus
Guo et al. A multimodal ADAS system for unmarked urban scenarios based on road context understanding
JP7135665B2 (ja) 車両制御システム、車両の制御方法及びコンピュータプログラム
KR100979726B1 (ko) 이동 물체의 특징점을 이용하는 영상 검지 방법
JP7454685B2 (ja) 車両走行路内のデブリの検出
JP5593217B2 (ja) 車両用外界認識装置およびそれを用いた車両システム
KR20180047149A (ko) 충돌 위험 경고 장치 및 방법
JP4967758B2 (ja) 物体移動の検出方法及び検出装置
JP6171608B2 (ja) 物体検出装置
KR20170137273A (ko) 변형 가능한 파트 모델을 사용한 보행자 검출 장치 및 방법
JP6472504B1 (ja) 情報処理装置、情報処理プログラム、及び、情報処理方法
JP2020135616A (ja) 物体検出装置
JP7298426B2 (ja) 物体検出装置
US10982967B2 (en) Method and device for fast detection of repetitive structures in the image of a road scene
JP5345999B2 (ja) レーンマーク認識装置
Chun-Zhao et al. Drivable road boundary detection for intelligent vehicles based on stereovision with plane-induced homography
WO2022004495A1 (ja) 障害物検出装置及び障害物検出方法
Guo et al. Semantic-based road environment recognition in mixed traffic for intelligent vehicles and advanced driver assistance systems
EP3540643A1 (en) Image processing apparatus and image processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20151221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170619

R150 Certificate of patent or registration of utility model

Ref document number: 6171608

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250