JPWO2020054260A1

JPWO2020054260A1 - 画像認識装置

Info

Publication number: JPWO2020054260A1
Application number: JP2020546756A
Authority: JP
Inventors: 郭介牛場; 小林　正幸; 正幸小林; 都堀田; 堀田　　都; 裕史大塚
Original assignee: Hitachi Astemo Ltd
Current assignee: Hitachi Astemo Ltd
Priority date: 2018-09-12
Filing date: 2019-08-06
Publication date: 2021-08-30
Anticipated expiration: 2039-08-06
Also published as: WO2020054260A1; CN112639877A; JP6983334B2

Abstract

立体物の全体をうまく検知できなかった場合に認識性能が低下するという課題があった。本発明は、立体物領域設定処理４０１では、検知処理２０８によって得られた立体物の検知領域３０１を、立体物の検知特性情報に基づいて拡大もしくは縮小して立体物領域５０１を設定する。立体物領域設定処理４０１で設定された立体物領域５０１を認識処理２０９の基準サイズとすると、この基準サイズが認識のための最適な認識領域とは限らない。そこで、認識倍率設定処理４０２では、立体物の認識特性情報を用いて認識領域を補正する。走査領域設定処理４０３は、各認識領域に対して、配置特性情報に基づいて、認識領域よりも大きな走査領域を設定する。

Description

本発明は、画像認識装置に関する。

近年、運転支援や自動運転等に必要な画像認識装置に対する性能向上への要求が高まっている。例えば、歩行者に対する衝突安全機能では、自動車アセスメントにおいて夜間歩行者への衝突安全試験が追加されるなど、性能向上が求められている。これを実現するために、歩行者など立体物に対する高い認識性能が必要になる。

特許文献１には、ある移動立体物と他の立体物が重なっている状況において、立体物を内包する所定の領域の内部の特徴点を追跡することで領域の内部に存在する歩行者などの移動立体物を検知する認識装置が提案されている。

特開２０１７−１４２７６０号公報

しかしながら従来の装置では、立体物の全体をうまく検知できなかった場合に認識性能が低下するという課題があった。

本発明の第１の態様による画像認識装置は、撮像部によって撮像された画像上に設定された立体物の検知領域に対して、前記立体物の検知特性情報に基づいて前記立体物の検知領域を拡大もしくは縮小して立体物領域を設定する立体物領域設定部と、前記立体物領域設定部により設定された前記立体物領域に対して前記立体物の種別を特定する認識処理を行う認識処理部と、を備える。
本発明の第２の態様による画像認識装置は、撮像部によって撮像された画像上に設定された立体物の検知領域に対して、前記立体物の第１の特性情報に基づいて前記立体物の検知領域を拡大もしくは縮小して立体物領域を設定する立体物領域設定部と、前記立体物領域設定部によって求めた前記立体物領域を基準サイズとして、前記立体物の第２の特性情報に基づいて、複数のサイズの認識領域を定める認識倍率設定部と、前記認識倍率設定部で定めた複数の前記認識領域に対して、前記立体物の第３の特性情報に基づいて前記認識領域よりも広い複数の走査領域を設定する走査領域設定部と、前記走査領域設定部で設定された前記走査領域を用いて、認識処理を行う認識処理部と、を備える。

本発明によれば、立体物を的確に検知し、認識性能を向上させた画像認識装置を提供できる。

画像認識装置の全体構成を示すブロック図である。画像認識装置の動作を示すフローチャートである。検知処理により画像上に設定された立体物領域を示す図である。認識処理の詳細を示すフローチャートである。立体物領域設定処理の原理を説明する図である。認識倍率設定処理の原理を説明する図である。認識倍率設定処理における正規化を説明する図である。走査領域設定処理の原理を説明する図である。倍率毎走査認識処理の原理を説明する図である。最適倍率設定処理の原理を説明する図である。詳細認識位置決定処理の原理を説明する図である。詳細認識処理の原理を説明する図である。変形例に係る画像認識装置の全体構成を示すブロック図である。

図１は、本実施形態にかかわる画像認識装置１００の全体構成を示すブロック図である。画像認識装置１００は、車両に搭載され、車両前方の左右に配置された左カメラ１０１と右カメラ１０２を備える。カメラ１０１、１０２は、ステレオカメラを構成し、例えば、歩行者、車両、信号、標識、白線、車のテールランプ、ヘッドライトなどの立体物を撮像する。画像認識装置１００は、カメラ１０１、１０２で撮像された車両前方の画像情報に基づいて車外環境を認識する。そして、車両（自車両）は、画像認識装置１００による認識結果に基づいて、ブレーキ、ステアリングなどを制御する。

画像認識装置１００は、カメラ１０１、１０２で撮像した画像を画像入力インタフェース１０３より取り込む。画像入力インタフェース１０３より取り込まれた画像情報は、内部バス１０９を介して画像処理部１０４へ送られる。そして、演算処理部１０５で処理され、処理途中の結果や最終結果の画像情報などは記憶部１０６に記憶される。

画像処理部１０４は、左カメラ１０１の撮像素子から得られる第１の画像と、右カメラ１０２の撮像素子から得られる第２の画像とを比較して、それぞれの画像に対して、撮像素子に起因するデバイス固有の偏差の補正や、ノイズ補間などの画像補正を行い、これを記憶部１０６に記憶する。更に、第１の画像と第２の画像との間で、相互に対応する箇所を計算して、視差情報を求め、画像上の各画素に対応する距離情報として、これを記憶部１０６に記憶する。画像処理部１０４は、内部バス１０９を介して演算処理部１０５、ＣＡＮインタフェース１０７、制御処理部１０８に接続されている。

演算処理部１０５は、記憶部１０６に蓄えられた画像情報および距離情報（視差情報）を使い、車両周辺の環境を把握するために、立体物の認識を行う。立体物の認識結果や中間的な処理結果の一部が、記憶部１０６に記憶される。演算処理部１０５は、撮像した画像に対して立体物の認識を行った後に、認識結果を用いて車両制御の計算を行う。車両制御の計算の結果として得られた車両の制御方針や、認識結果の一部はＣＡＮインタフェース１０７を介して、車載ネットワークＣＡＮ１１０に伝えられ、これにより車両の制御が行われる。

制御処理部１０８は、各処理部が異常動作を起こしていないか、データ転送時にエラーが発生していないかなどを監視し、異常動作を防止する。画像処理部１０４、演算処理部１０５、および制御処理部１０８は、単一または複数のコンピュータユニットにより構成してもよい。

図２は、画像認識装置１００の動作を示すフローチャートである。
画像認識装置１００に備えられた左カメラ１０１と右カメラ１０２とにより画像が撮像され、撮像された画像情報２０３、２０４のそれぞれについて、撮像素子が持つ固有の癖を吸収するための補正などの画像処理２０５を行う。画像処理２０５の処理結果は画像バッファ２０６に蓄えられる。画像バッファ２０６は、図１の記憶部１０６に設けられる。

次に視差処理２０７が行われる。具体的には、補正された２つの画像を使って、画像同士の照合を行い、これにより左カメラ１０１、右カメラ１０２で得た画像の視差情報を得る。左右画像の視差により、立体物の画像上のある着目点が、三角測量の原理によって、立体物までの距離として求められる。画像処理２０５および視差処理２０７は、図１の画像処理部１０４で行われ、最終的に得られた画像情報、および視差情報は記憶部１０６に蓄えられる。

そして、次の検知処理２０８では、視差処理２０７により左右画像の各画素の視差または距離が得られた視差情報を用いて、３次元空間上の立体物を検知する。図３は、検知処理２０８により画像上に設定された立体物の検知領域を示す図である。図３には、検知処理２０８の結果、画像上において、カメラ１０１、１０２によって検知された歩行者の検知領域３０１と車両の検知領域３０２が示されている。これらの検知領域３０１、３０２は、図３に示すように矩形であっても、視差や距離から得られる不定形の領域であってもよい。後段の処理において計算機での扱いを容易にするため一般的には矩形として扱われる。本実施形態では以下、領域は矩形として扱い、立体物の一例として主に歩行者を用いて説明する。

次に、認識処理２０９では、検知処理２０８により画像上に設定された検知領域に対して立体物の種別を特定する認識処理を行う。認識処理２０９による認識対象の立体物は、例えば、歩行者、車両、信号、標識、白線、車のテールランプやヘッドライトなどであり、これらの何れであるかその種別が特定される。この認識処理２０９が安定して立体物の認識を行うためには、画像上の検知領域と認識したい対象の領域が一致している必要がある。しかし、カメラ１０１、１０２においては外環境の明るさやカメラ間の撮像性能のばらつきなどによって、認識したい画像上の領域を完全に一致させることができない場合がある。これは、ミリ波などのレーダーと、カメラなどの画像センサを組み合わせた場合でも同様である。この問題を解決した認識処理２０９の詳細については後述する。

次に、車両制御処理２１０では、立体物の認識結果と、自車両の状態（速度、舵角など）とを勘案して、例えば、乗員に警告を発し、自車両のブレーキングや舵角調整などの制御を行う。あるいは、認識した立体物に対する回避制御を定め、その結果を自動制御情報としてＣＡＮインタフェース１０７を介して出力する。認識処理２０９および車両制御処理２１０は、図１の演算処理部１０５で行われる。

なお、図２のフローチャート、および後述の図４のフローチャートで示したプログラムを、ＣＰＵ、メモリなどを備えたコンピュータにより実行することができる。全部の処理、または一部の処理をハードロジック回路により実現してもよい。更に、このプログラムは、予め画像認識装置１００の記憶媒体に格納して提供することができる。あるいは、独立した記憶媒体にプログラムを格納して提供したり、ネットワーク回線によりプログラムを画像認識装置１００の記憶媒体に記録して格納することもできる。データ信号（搬送波）などの種々の形態のコンピュータ読み込み可能なコンピュータプログラム製品として供給してもよい。

図４は、認識処理２０９の詳細を示すフローチャートである。このフローチャートは、図４に示すように、立体物領域設定処理４０１、認識倍率設定処理４０２、走査領域設定処理４０３、倍率毎走査認識処理４０４、最適倍率設定処理４０６、詳細認識位置決定処理４０７、詳細認識処理４０８を行う。以下、順に各処理を説明する。なお、これらの処理ではステレオカメラを前提に説明する。

［立体物領域設定処理］
立体物領域設定処理４０１では、検知処理２０８によって得られた立体物の検知領域３０１を、立体物の検知特性情報に基づいて拡大もしくは縮小して立体物領域５０１を設定する。

図５は、立体物領域設定処理４０１の原理を説明する図である。図５では、歩行者の検知領域３０１を立体物の検知特性情報に基づいて拡大して立体物領域５０１を設定した例を示す。検知特性情報は、例えば、（１）立体物の識別性、（２）立体物との距離、（３）立体物の大きさ、（４）立体物の想定サイズ、（５）外環境の明るさ、（６）ヘッドライトの向き、（７）立体物が存在する路面の高さ、（８）センサ分解能などである。以下に、これらの検知特性情報について説明する。

（１）立体物の識別性は、例えばカメラ１０１、１０２においては背景領域との組み合わせによって立体物が得にくい場合が考えられる。路面と同色の歩行者の服装や、夜間の歩行者の頭頂部などがこれに当たる。また、カメラ１０１、１０２が雨滴などの影響で対象の一部がぼけて立体物領域が欠けることも考えられる。このような場合、検知領域を拡大する。また、三次元空間中の人と人以外の領域が結合した立体物になる場合も有る。路肩の電柱や柵などと言った立体物と人との結合のように識別前に分離することは困難なためである。このような場合に画像の色や輝度やエッジに基づいて検知領域を縮小する。また、レーダーセンサなどの別種のセンサや、カメラ１０１、１０２においても水平方向の取り付け高さが違う場合、主に上部方向に隠れが発生し、立体物は小さく出る。このような構成の処理特性を持つ場合には検知領域を拡大する。

（２）立体物との距離は、遠ければ大きく立体物領域を拡大し、近ければ小さく立体物領域を縮小する。この拡大率は、カメラ１０１、１０２を含むセンサ分解能によって決定しても良い。対象が遠方に行けば行くほど１画素あたりの３次元空間を占めるサイズが大きくなり、誤差が乗るからである。

（３）立体物の大きさは、立体物が小さければ立体物領域を拡大し、立体物が大きければ立体物領域を縮小する。

（４）立体物の想定サイズは、例えば、立体物を歩行者と想定して、歩行者と想定して小さ過ぎる立体物は立体物領域を拡大し、歩行者と想定して大き過ぎる立体物は立体物領域を縮小する。どの程度のものまでを対象とするかは、（５）外環境の明るさや（６）ヘッドライトの向きも考慮に入れて決定してよい。例えば、昼の明るい環境であれば立体物領域を縮小し、夜の暗い環境であれば立体物領域を拡大する。また、ヘッドライトの向きに応じて、例えば、ヘッドライトの向きがロウビームであれば足元に光が当たっているので、高さ方向に立体物領域を拡大する。ヘッドライトの向きがハイビームであれば、全身に光が当たっているので立体物領域を縮小する。また、立体物までの距離や（７）立体物が存在する位置の路面の高さによっても立体物領域を拡大もしくは縮小してもよい。例えば、路面の高さが低い場合に、ハイビームであれば、足元には光が当たらないため下方向に立体物領域を拡大する。

（８）センサ分解能は、センサがカメラ１０１、１０２であれば、距離に応じて１画素あたりのサイズが変わるので、立体物のサイズや、対象の距離と組み合わせることによって立体物領域を拡大もしくは縮小する。例えば、立体物が近傍に居る場合は１画素あたりの３次元空間の分解能が高いため、立体物領域を拡大する。立体物が遠い場合は１画素あたりの３次元空間の分解能が低いため、立体物領域を縮小する。また、立体物領域として取得する領域の特性によっては、立体物領域を縮小する。立体物領域として取得する領域の特性とは、例えば立体物領域が得られた視差のある領域やセンサ応答領域がより大きく設定される場合であり、このような場合は立体物領域を縮小する。

立体物の検知特性情報に基づいて立体物領域５０１を設定する例について説明する。例えば、歩行者においては、画像上の変化が大きい手足領域は欠けて小さくなりやすい。また、夜間の場合は黒髪の人ならば、頭が背景と混ざって検知しづらい。このような場合に、１画素あたりの３次元空間上のサイズを元にして、画像上の立体物領域５０１を変更する。例えば、明るい昼間なら頭部と思われる領域の拡大は０ｃｍ、足元の領域の拡大は１０ｃｍ、夜間なら頭部の領域の拡大は１０ｃｍ、足元の領域の拡大は１０ｃｍとする。さらに車両のロウビームが届く範囲なら頭部の領域の拡大は１０ｃｍ、足元の領域の拡大は０ｃｍとする。横幅も同様に適宜拡大縮小する。また時系列による横幅の変化量を元に補正を実施しても良い。また、後段の認識処理の内容によっては、認識領域を縮小しても良い。例えば、歩行者であれば上半身のみで認識を実施する場合などである。拡大縮小するサイズは所定の割合、若しくは画像上のサイズで決定しても良いが、３次元空間上のサイズを基準に設定することにより、認識対象としてあり得ないサイズの除外が可能となる。
また、この拡大縮小による立体物領域５０１のサイズは、３次元空間上の距離と画素の関係から、検知領域３０１と同一になる場合もある。

以上、検知特性情報について説明したが、立体物領域設定処理４０１においては、これらの検知特性情報を複数組み合わせることによって、より精度よく立体物領域５０１を設定する。例えば、距離、外環境の明るさ、ライト向き、路面高さ、センサ分解能などを組み合わせることで、昼夜の影響をより軽減した立体物領域５０１を設定する。また、ここで述べた画素数やサイズは一例であり、この範囲に限定するものではない。

［認識倍率設定処理］
次に、図４に示す認識倍率設定処理４０２について説明する。
立体物領域設定処理４０１で設定された立体物領域５０１を認識処理２０９の基準サイズとすると、この基準サイズが認識のための最適な認識領域とは限らない。そこで、認識倍率設定処理４０２では、立体物の認識特性情報を用いて複数のサイズの認識領域を定める。この時、最適な認識領域は不明であることから、基準サイズを元に認識領域を拡大もしくは縮小して、複数のサイズの認識領域を定める。認識特性情報は、例えば、（１）立体物との距離、（２）立体物の大きさ、（３）立体物の限界サイズ、（４）センサ分解能などである。以下に、これらの認識特性情報について説明する。

（１）立体物との距離は、認識領域を拡大もしくは縮小を行う場合の拡大量もしくは縮小量を決定する指標となる。例えば、立体物が遠方にある場合、１画素あたりの立体物サイズは大きくなる。この場合、認識処理を行う後述の識別器９０１の入力になるのは画像であるため、立体物が遠方にある場合は、近傍にある場合に比べて拡大もしくは縮小する画素数は小さくなる。そこで、基準サイズを元に、立体物との距離に応じて、認識領域を拡大もしくは縮小して、複数のサイズの認識領域を定める。

（２）立体物の大きさは、認識領域を拡大もしくは縮小を行う場合の拡大量もしくは縮小量を決定する指標となる。例えば、立体物が大きい場合は立体物が小さい場合に比べて、画像上で拡大もしくは縮小を行う場合の画素数は小さくなる。また、実空間上のサイズに基づいて複数のサイズの認識領域を定める場合、遠方に居る場合は近傍に居る場合に比べて、画像上で拡大もしくは縮小を行う場合の画素数は小さくなる。サブピクセル単位で認識領域を設定しない場合は、基準サイズと同じになる場合も有る。

（３）立体物の限界サイズは、立体物が認識対象である場合に想定される限界サイズである。例えば、立体物が歩行者である場合、立体物の高さが２．５メートルを超えるなど大きければ、縮小方向に領域を設定する。逆に高さが０．８メートルを下回るなど小さければ、拡大方向に領域を設定する。それら中間であれば、双方に領域を設定する。設定する領域の上限下限は、認識対象の立体物や認識処理の制限などから決定してよい。

（４）センサ分解能は、例えばセンサがカメラ１０１、１０２であれば、距離に応じて１画素あたりのサイズが変わる。そこで、センサ分解能を基に拡大もしくは縮小する範囲を定めることができる。例えば1画素あたりの３次元空間中のサイズが２０ｃｍを超すような遠方においては、拡大もしくは縮小する範囲は１画素、２画素と言った小さな範囲で定める。逆に１画素あたりの３次元空間中のサイズが１ｃｍを切るような近距離においては、１０画素や２０画素と言った大きな範囲で拡大もしくは縮小する。

なお、画像上のサイズは３次元空間中の立体物サイズから逆算して求めても良い。また、立体物領域設定処理４０１において立体物領域５０１の設定に考慮しなかった検知特性情報に関しては、認識倍率設定処理４０２で検知特性情報を用いて認識領域のバリエーションを設定してもよい。その場合、検知特性情報のどの条件に応じて認識領域を拡大するか縮小するかは、立体物領域設定処理４０１で説明した内容と同様である。また、ここで述べた画素数やサイズは一例であり、この範囲に限定するものではない。

図６は認識倍率設定処理４０２の原理を説明する図である。認識倍率設定処理４０２は、立体物領域５０１を基準サイズの認識領域として、これを拡大もしくは縮小した認識領域６０１、６０２を定める。認識領域５０１は基準サイズ、認識領域６０１は、基準サイズを縮小した認識倍率の小さい認識領域、認識領域６０２は、基準サイズを拡大した認識倍率の大きい認識領域である。図６の例では基準サイズに対して拡大もしくは縮小した２種類の認識領域を示したが、この数は認識処理時間に余裕があれば多数のバリエーションを持ってよい。また、検知処理２０８や立体物領域設定処理４０１の設定により、拡大と縮小どちらかのみを設定してもよい。認識領域の拡大量もしくは縮小量は、認識特性情報に基づいて設定する。この場合、立体物領域設定処理４０１と同様に、画像の分解能によっては基準サイズの認識領域と同一となる場合もある。

図７は、認識倍率設定処理４０２における正規化を説明する図である。
図７に示すように、認識領域（５０１、６０１、６０２）を後段の認識処理を実施する場合において正規化する領域を定めている。認識領域は、後述の認識処理において、認識処理を行う範囲を示すものである。認識領域５０１は基準サイズ、認識領域６０１は、基準サイズを縮小した認識倍率の小さい認識領域、認識領域６０２は、基準サイズを拡大した認識倍率の大きい認識領域である。

認識処理においては入力情報の次元数を合わせる必要がある。基準サイズの認識領域５０１は対象の物体を綺麗に捉えている保証が無く、また装置に実装された認識処理の特性によって、どのように捉えていればよいかが変わってくる。そこで、正規化する領域をあらかじめ設定する。図７の例では、認識領域５０１は頭と足がほぼ入っているのに対し、認識倍率の小さい認識領域６０１は頭頂部と手足がはみ出でおり、認識倍率の大きい認識領域６０２は逆に頭頂部や足元に余白ができる。これらの認識領域を同じサイズに正規化すると、図７に示すように、正規化後の認識領域７０１、７０２、７０３となり、後述の認識処理で同様な処理を施すことが可能となる。ただしこの正規化処理は認識倍率設定処理４０２で必ずしも行うものではない。後述の倍率毎走査認識処理４０４や後述の詳細認識処理４０８の処理の一部として実施してよい。

［走査領域設定処理］
次に、図４の走査領域設定処理４０３について説明する。走査領域設定処理４０３は、各認識領域に対して、立体物の配置特性情報に基づいて、認識領域よりも大きな走査領域を設定する。走査領域は画像上の領域として設定され、認識処理においては、設定された走査領域内を認識領域により走査する。すなわち、認識領域は、後述の認識処理において、認識処理を行う範囲を示すものであり、走査領域は、この認識領域を走査領域の範囲内において移動させる範囲である。これにより、認識領域を走査領域の範囲内において移動させながら認識処理を行う。走査領域の大きさを決定する配置特性情報は、例えば、（１）立体物の遠近位置、（２）立体物が存在する路面高さなどである。以下に、これらの配置特性情報について説明する。

（１）立体物の遠近位置は、走査領域の設定を行う場合の指標となる。例えば、立体物が近くに在る場合は、画像上の走査領域は大きく定める。また、立体物が遠方に在る場合は、走査領域は小さく定める。これは、近くに在る場合は、センサ分解能が高く、１画素走査した場合の３次元空間上の走査量が数ｍｍ程度になるのに対し、遠方では１０ｃｍを超える為である。走査領域は、立体物検知によって発生する検知のズレ量などの特性によっても定まる。例えば、立体物の横位置中心をとった場合に最も性能を発揮する認識処理を用いる場合、立体物の横位置中心と、実際の認識対象の横位置中心のズレ量や分散から、走査領域に認識対象の横位置中心が収まるように設定してもよい。

（２）立体物が存在する路面高さは、走査領域の設定を行う場合の指標となる。例えば、路面が上昇しており立体物（歩行者など）が自車よりも高い位置に在る場合は、頭側の隠れが増えて高さが実際より小さく出る。また、立体物（歩行者など）が低い位置に在る場合は、画角などによっては足元が切れる、バンパーで隠れるなどが考えられる。このような状態に合わせて、走査領域を拡大もしくは縮小する。

また、立体物領域設定処理４０１、認識倍率設定処理４０２において立体物領域や認識領域の設定に考慮しなかった検知特性情報や認識特性情報に関しては、これを用いて走査領域設定処理４０３で走査領域を定めてもよい。この場合、どの条件に応じて走査領域を拡大するか縮小するかは、立体物領域設定処理４０１や認識倍率設定処理４０２と同様である。また、ここで述べた画素数やサイズは一例であり、この範囲に限定するものではない。

図８は、走査領域設定処理４０３の原理を説明する図である。走査領域設定処理４０３は、各認識領域５０１、６０１、６０２に対して、走査領域８０１、８０２、８０３をそれぞれ定める。走査領域８０１、８０２、８０３は認識領域５０１、６０１、６０２と同じかそれよりも大きな領域である。ただし走査領域８０１、８０２、８０３内を認識領域５０１、６０１、６０２で走査するため、走査量が多いとは限らない。走査領域８０１、８０２、８０３は配置特性情報から画像上の領域を定める。この時、画像の分解能によっては認識領域と走査領域の画像上が同じになる場合も有る。走査領域は、各認識領域に対して個別で定めるが、処理時間に余裕があるならば、最も走査領域が大きくなる１つを採用しても良い。また、処理時間に余裕ない場合、小さな走査領域１つを各認識領域に適応しても良い。

［倍率毎走査認識処理］
次に、図４に示す倍率毎走査認識処理４０４について説明する。倍率毎走査認識処理４０４では、走査領域８０１、８０２、８０３に対応する画像および視差領域(距離領域)を認識領域５０１、６０１、６０２で走査し、各サイズの走査位置毎に認識処理を実施して、対象の走査位置が立体物であるかを判別する。

ここで、認識処理の性能が十分であるならば、図４の破線４０５に示すように、倍率毎走査認識処理４０４の結果を用いて車両制御処理２１０を実施してもよい。倍率毎走査認識処理４０４は倍率、走査位置などにより複数の結果を有する場合があるが、これは認識結果が最良であった１つを選択するなどの処理によって絞り込みを実施する。

図９は倍率毎走査認識処理４０４の原理を説明する図である。各走査領域８０１、８０２、８０３内を、認識領域５０１、６０１、６０２で走査しながら、認識処理を行う識別器９０１で認識した結果の応答位置９０２を求める。応答位置９０２を図９ではxで示した。応答位置９０２の数が多いほど認識処理が良好であることを示している。走査領域８０１、８０２、８０３内を識別器９０１で認識した結果の一例は、走査領域８０１’、８０２’、８０３’の応答位置９０２で示すように、走査領域８０１’が最も多くなっている。

識別器９０１は機械学習を用いても良いし、ヒューリスティックな閾値判定を用いても良い。この判定結果が十分であるならば、図４の破線４０５に示したように、この結果を用いて認識を終えてよい。その場合、例えば最も認識処理が良好であったものを採用する。

倍率毎走査認識処理４０４において、認識処理の計算コストの削減などにより、認識処理の性能が不十分である場合に、倍率毎走査認識処理４０４の結果を用いて、詳細処理を実施してもよい。本実施形態においては詳細処理として、最適倍率設定処理４０６、詳細認識位置決定処理４０７、詳細認識処理４０８を設けた場合を説明する。

［最適倍率設定処理］
図４に示す最適倍率設定処理４０６は、認識倍率設定処理４０２で作成した複数のサイズの認識領域から、詳細認識処理に最適な認識領域を選択する。選択方法は、例えば走査によって得られた認識処理結果における認識対象と判定された個数やその信頼度や、非認識対象と判定された個数やその信頼度、認識結果の分布などを用い、応答数の量や信頼度を複数のサイズの認識領域間で比較し、最適な認識領域を用いる。最適倍率設定処理４０６は、処理時間に十分な猶予がないならば省略してもよい。

図１０は最適倍率設定処理４０６の原理を説明する図である。複数の倍率の認識結果から、最も応答が良かった最適倍率を選択する。最適倍率は前述の通り、認識処理の走査領域での応答数やその信頼度を用いて選択する。図１０の例では応答数が最も多かった走査領域８０１’を選択しているが、この走査領域８０１’は、基準サイズの走査領域８０１に対応し、基準サイズの走査領域８０１は基準サイズの認識領域５０１に対応している。

［詳細認識位置決定処理］
図４に示す詳細認識位置決定処理４０７は、最適倍率設定処理４０６で得られた最適倍率について、詳細認識を実施する代表位置を決定する。詳細認識は、例えば、倍率毎走査認識処理４０４で得られた認識処理の信頼度が最大の位置を選ぶ。または、平均変位法（Mean Shift法）のようなクラスタリング手段を用いて位置を決定しても良い。最適倍率設定処理４０６を行わない場合、各倍率に対して詳細認識位置決定処理４０７を実施してよい。

図１１は詳細認識位置決定処理４０７の原理を説明する図である。倍率毎走査認識処理４０４から得られた一つ以上の応答位置から、詳細認識処理４０８を行う代表位置１１１を決定する。複数の反応点が存在する場合は、例えばMean Shift法のようなクラスタリング技術を用いる。決定された代表位置１１１を中心とした領域が詳細識別領域となる。

［詳細認識処理］
図４に示す詳細認識処理４０８は、詳細認識位置決定処理４０７で決定した代表位置１１１に対して詳細認識を実施し、対象の種別や信頼度を算出する。もしくは、倍率毎走査認識処理４０４による応答位置に基づいて選択された最適のサイズの認識領域を用いて詳細認識を実施し、対象の種別や信頼度を算出する。詳細認識処理４０８は倍率毎走査認識処理４０４で用いた認識処理と同等性能以上の種別分類性能を有する識別器１２０を用いる。

図１２は、詳細認識処理４０８の原理を説明する図である。詳細認識位置決定処理４０７によって求めた代表位置１１１に対して識別器１２０を用いて詳細な認識処理を行い、立体物の種別を決定する。立体物の種別とは、例えば、歩行者、車両、信号、標識、白線、車のテールランプやヘッドライトなどである。

倍率毎走査認識処理４０４と詳細認識処理４０８で用いる認識処理には、例えば以下のような技術があげられる。予め用意した認識対象らしさを有するテンプレートと認識領域を比較するテンプレートマッチングを用いる技術。輝度画像やＨＯＧやＨａａｒ−Ｌｉｋｅといった特徴量と、サポートベクターマシンやＡｄａ−ＢｏｏｓｔやＤｅｅｐＬｅａｒｎｉｎｇといった機械学習手法を合わせた識別器を利用する技術。また、エッジ形状などを人為的に決めた閾値判定で認識しても良い。倍率毎走査認識処理４０４と詳細認識処理４０８にはこれらを実施するために必要なリサイズ、平滑化、エッジ抽出、正規化、孤立点除去、勾配抽出、色変換、ヒストグラム作成などの画像処理を含む。

（変形例）
本実施形態では、ステレオカメラを用いた画像認識装置１００で説明した。しかし、ステレオカメラを用いない画像認識装置１００’を用いて実現してもよい。
図１３は、画像認識装置１００’における処理動作を示す図である。図２に示した画像認識装置１００と同一の個所には同一の符号を付してその説明を省略する。

画像認識装置１００’は、光学カメラ１３０１とレーダーセンサ１３０２を備えている。これにより、立体物を検知する。光学カメラ１３０１により画像が撮像され、撮像された画像情報について、撮像素子が持つ固有の癖を吸収するための補正などの画像処理２０５を行う。画像処理２０５の処理結果は画像バッファ２０６に蓄えられる。また、レーダーセンサ１３０２により、立体物までの距離が得られる。検知処理１３０３は、立体物までの距離に基づいて、３次元空間上の立体物を検知する。認識処理２０９は、検知処理１３０３により設定された検知領域に対して立体物の種別を特定する認識処理を行う。

レーダーセンサ１３０２から出力される立体物までの距離を入力とする検知処理１３０３は、距離計測に用いるレーダーセンサ１３０２のセンサ特性を考慮した検知処理を行う必要はあるが、検知領域を決定した後の処理は、画像認識装置１００で説明したステレオカメラによる構成と同様にできる。また、画像認識装置１００’は、画像処理２０５において複数の画像を必要としない。

以上説明した実施形態によれば、次の作用効果が得られる。
（１）画像認識装置１００、１００’は、カメラ１０１、１０２によって撮像された画像上に設定された立体物の検知領域３０１に対して、立体物の検知特性情報に基づいて立体物の検知領域３０１を拡大もしくは縮小して立体物領域５０１を設定する立体物領域設定処理４０１と、立体物領域設定処理４０１により設定された立体物領域５０１に対して立体物の種別を特定する認識処理を行う認識処理２０９と、を備える。検知特性情報は、例えば、立体物の識別性、立体物との距離、立体物の大きさ、立体物の想定サイズ、外環境の明るさ、ヘッドライトの向き、立体物が存在する路面の高さ、撮像部のセンサ分解能の少なくとも一つである。これにより、立体物を的確に検知し、認識性能を向上させた画像認識装置を提供できる。

（２）画像認識装置１００、１００’は、カメラ１０１、１０２によって撮像された画像上に設定された立体物の検知領域３０１に対して、立体物の第１の特性情報に基づいて立体物の検知領域３０１を拡大もしくは縮小して立体物領域５０１を設定する立体物領域設定処理４０１と、立体物領域設定処理４０１によって求めた立体物領域５０１を基準サイズとして、立体物の第２の特性情報に基づいて、複数のサイズの認識領域６０１、６０２を定める認識倍率設定処理４０２と、認識倍率設定処理４０２で定めた複数の認識領域６０１、６０２に対して、立体物の第３の特性情報に基づいて認識領域６０１、６０２よりも広い複数の走査領域８０２、８０３を設定する走査領域設定処理４０３と、走査領域設定処理４０３で設定された走査領域８０２、８０３を用いて、認識処理を行う認識処理２０９と、を備える。第１の特性情報乃至第３の特性情報は、例えば、立体物の識別性、立体物との距離、立体物の大きさ、立体物の想定サイズ、外環境の明るさ、ヘッドライトの向き、立体物が存在する路面の高さ、撮像部のセンサ分解能、立体物の限界サイズ、立体物の遠近位置、立体物が存在する路面高さの少なくとも一つである。これにより、立体物を的確に検知し、認識性能を向上させた画像認識装置を提供できる。

本発明は、上記の実施形態に限定されるものではなく、本発明の特徴を損なわない限り、本発明の技術思想の範囲内で考えられるその他の形態についても、本発明の範囲内に含まれる。また、上述の実施形態と変形例を組み合わせた構成としてもよい。

１００、１００’ 画像認識装置、１０１、１０２カメラ、１０３画像入力インタフェース、１０４画像処理部、１０５演算処理部、１０６記憶部、１０７ＣＡＮインタフェース、１０８制御処理部、１０９内部バス、１１０車載ネットワークＣＡＮ

Claims

撮像部によって撮像された画像上に設定された立体物の検知領域に対して、前記立体物の検知特性情報に基づいて前記立体物の検知領域を拡大もしくは縮小して立体物領域を設定する立体物領域設定部と、
前記立体物領域設定部により設定された前記立体物領域に対して前記立体物の種別を特定する認識処理を行う認識処理部と、
を備える画像認識装置。
請求項１に記載の画像認識装置において、
前記検知特性情報は、前記立体物の識別性、前記立体物との距離、前記立体物の大きさ、前記立体物の想定サイズ、外環境の明るさ、ヘッドライトの向き、前記立体物が存在する路面の高さ、前記撮像部のセンサ分解能の少なくとも一つである画像認識装置。
請求項１または請求項２に記載の画像認識装置において、
前記立体物領域設定部によって求めた前記立体物領域を基準サイズとして、前記立体物の認識特性情報に基づいて、複数のサイズの認識領域を定める認識倍率設定部を備え、
前記認識処理部は、前記認識倍率設定部で定められた複数のサイズの前記認識領域に対して、それぞれに前記認識処理を行う画像認識装置。
請求項３に記載の画像認識装置において、
前記認識特性情報は、前記立体物との距離、前記立体物の大きさ、前記立体物の限界サイズ、前記撮像部のセンサ分解能の少なくとも一つである画像認識装置。
請求項３に記載の画像認識装置において、
前記認識倍率設定部で定めた複数の前記認識領域に対して、前記立体物の配置特性情報に基づいて前記認識領域よりも広い複数の走査領域を設定する走査領域設定部を備え、
前記認識処理部は、前記走査領域設定部で設定された前記走査領域を用いて、前記認識処理を行う画像認識装置。
請求項５に記載の画像認識装置において、
前記配置特性情報は、前記立体物の遠近位置、前記立体物が存在する路面高さの少なくとも一つである画像認識装置。
請求項５に記載の画像認識装置において、
複数の前記走査領域を複数の前記認識領域により走査して認識結果の応答位置を求める倍率毎走査認識処理部を備える画像認識装置。
請求項７に記載の画像認識装置において、
前記倍率毎走査認識処理部による前記応答位置に基づいて最適のサイズの前記認識領域を選択する最適倍率設定部を備える画像認識装置。
請求項８に記載の画像認識装置において、
前記最適倍率設定部で選択された前記認識領域に対応する前記走査領域の前記応答位置に基づいて前記認識処理を行う代表位置を決定する詳細認識位置決定処理部を備える画像認識装置。
請求項９に記載の画像認識装置において、
前記最適のサイズの前記認識領域もしくは前記代表位置を用いて前記認識処理を行い、認識対象の前記立体物の種別を特定する詳細認識処理部を備える画像認識装置。
撮像部によって撮像された画像上に設定された立体物の検知領域に対して、前記立体物の第１の特性情報に基づいて前記立体物の検知領域を拡大もしくは縮小して立体物領域を設定する立体物領域設定部と、
前記立体物領域設定部によって求めた前記立体物領域を基準サイズとして、前記立体物の第２の特性情報に基づいて、複数のサイズの認識領域を定める認識倍率設定部と、
前記認識倍率設定部で定めた複数の前記認識領域に対して、前記立体物の第３の特性情報に基づいて前記認識領域よりも広い複数の走査領域を設定する走査領域設定部と、
前記走査領域設定部で設定された前記走査領域を用いて、前記立体物の種別を特定する認識処理を行う認識処理部と、
を備える画像認識装置。
請求項１１に記載の画像認識装置において、
前記第１の特性情報、前記第２の特性情報、および前記第３の特性情報は、それぞれ、前記立体物の識別性、前記立体物との距離、前記立体物の大きさ、前記立体物の想定サイズ、外環境の明るさ、ヘッドライトの向き、前記立体物が存在する路面の高さ、前記撮像部のセンサ分解能、前記立体物の限界サイズ、前記立体物の遠近位置、前記立体物が存在する路面高さの少なくとも一つである画像認識装置。