WO2020241336A1

WO2020241336A1 - 画像認識装置および画像認識方法

Info

Publication number: WO2020241336A1
Application number: PCT/JP2020/019587
Authority: WO
Inventors: 和幸奥池
Original assignee: ソニーセミコンダクタソリューションズ株式会社
Priority date: 2019-05-30
Filing date: 2020-05-18
Publication date: 2020-12-03
Also published as: CN113875217A; DE112020002567T5; KR20220016056A; JP2020198470A; US20220201183A1

Abstract

被写体の認識精度を向上させることができる画像認識装置および画像認識方法を提供する。本開示に係る画像認識装置（イメージセンサ１）は、撮像部（１０）と、認識部（１４）とを有する。撮像部（１０）は、可視光を受光する撮像画素（Ｒ，Ｇｒ，Ｇｂ，Ｂ）と、赤外光を受光する撮像画素（ＩＲ）とを使用し、１フレーム期間に複数の画像を同一露光タイミングで撮像して画像データを生成する。認識部（１４）は、画像データのそれぞれから被写体を認識する。

Description

画像認識装置および画像認識方法

　本開示は、画像認識装置および画像認識方法に関する。

　１フレーム期間に感度が異なる複数の画像を撮像して合成することによりＨＤＲ（High　Dynamic　Range）画像を生成するＨＤＲ撮像モードを備え、ＨＤＲ画像から被写体を認識する撮像装置がある（例えば、特許文献１参照）。

　また、可視光を受光する撮像画素と、赤外光を受光する撮像画素とを使用して撮像した画像を合成することにより、ＨＤＲ画像を生成し、ＨＤＲ画像から被写体を認識する撮像装置もある。

特開２０１４－１０３６４３号公報

　しかしながら、上記の従来技術では、被写体の認識精度が低下することがある。そこで、本開示では、被写体の認識精度を向上させることができる画像認識装置および画像認識方法を提案する。

　本開示に係る画像認識装置は、撮像部と、認識部とを有する。撮像部は、可視光を受光する撮像画素と、赤外光を受光する撮像画素とを使用し、１フレーム期間に複数の画像を同一露光タイミングで撮像して画像データを生成する。認識部は、前記画像データのそれぞれから被写体を認識する。

本開示に係る画素アレイを示す説明図である。一般的なＤＮＮの使用例を示す説明図である。本開示に係るＤＮＮの使用例を示す説明図である。本開示に係る画像認識システムの構成例を示す図である。本開示に係る信号処理部が実行する処理の説明図である。本開示に係る認識部が実行する処理の説明図である。本開示に係る認識部が実行する処理の説明図である。本開示に係る信号処理部が実行する処理の変形例を示す説明図である。本開示に係る認識部が使用するＤＮＮの変形例を示す説明図である。本開示に係る画素アレイの第１変形例を示す説明図である。本開示に係る画素アレイの第２変形例を示す説明図である。本開示に係る画素アレイの第２変形例を採用した場合のＤＮＮの使用例を示す説明図である。本開示に係る画素アレイの第３変形例を示す説明図である。車両制御システムの概略的な構成の一例を示すブロック図である。車外情報検出部及び撮像部の設置位置の一例を示す説明図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

［１．画像認識方法の概要］
　まず、本開示に係る画像認識方法の概要について説明する。本開示に係る画像認識方法では、可視光を受光する撮像画素と、赤外光を受光する撮像画素を使用し、１フレーム期間に複数の画像を同一露光タイミングで撮像して画像データを生成し、画像データのそれぞれから被写体を認識する。ここでの同一露光タイミングで撮像するとは、例えば、複数の画素の露光を別々のタイミングで開始させ、同一のタイミングで終了させて画像を撮像することを意味する。

　複数の画像の撮像には、ＨＤＲ（High　Dynamic　Range）画像の撮像に使用される画素アレイを使用する。図１は、本開示に係る画素アレイを示す説明図である。例えば、図１に示すように、ＨＤＲ画像の撮像に使用される画素アレイＡ１は、赤色光を受光する撮像画素Ｒ、緑色光を受光する撮像画素Ｇｒ、Ｇｂ、青色光を受光する撮像画素Ｂがベイヤ配列されている。

　なお、撮像画素Ｇｒは、撮像画素Ｒが配置される列に設けられて緑色光を受光する撮像画素である。撮像画素Ｇｂは、撮像画素Ｂが配置される列に設けられて緑色光を受光する撮像画素である。

　撮像画素Ｒ、Ｇｒ、Ｇｂ、Ｂは、それぞれ、Ｌ字状に配置される受光面積が同一の３個の撮像素子を備える。撮像素子Ｌは、撮像素子Ｍ、Ｓに比べて露光時間が長い長時間露光素子である。撮像素子Ｓは、撮像素子Ｌ、Ｍに比べて露光時間が短い短時間露光素子である。

　撮像素子Ｍは、撮像素子Ｓよりも露光時間が長く、撮像素子Ｌよりも露光時間が短い中時間露光素子である。また、画素アレイＡ１は、同色の光を受光するＬ字状に配置された撮像素子Ｌ、Ｍ、Ｓによって三方が囲まれる位置に、赤外光を受光する撮像画素となる撮像素子ＩＲを備える。

　撮像素子Ｌは、露光時間が長いので、周囲が暗い場合であっても十分な受光量を得ることができる。これにより、撮像素子Ｌは、輝度が低すぎて通常の露光時間では黒つぶれするような被写体であっても、被写体の像がきれいに写った高感度画像（以下、長時間露光画像という場合がある）を撮像することができる。

　撮像素子Ｓは、露光時間が短いので、周囲が明るい場合であっても飽和することがない。これにより、撮像素子Ｓは、輝度が高すぎて通常の露光時間では白飛びするような被写体であっても、被写体の像がきれいに写った低感度画像（以下、短時間露光画像という場合がある）を撮像することができる。なお、撮像素子Ｍは、一般的なデジタルカメラと同様の露光時間で中感度画像（以下、中時間露光画像という場合がある）を撮像することができる。

　撮像素子ＩＲは、赤外光を受光するので、例えば、肉眼では見え難い暗闇での歩行者や車両、車両のヘッドライトやスポットライトで見え難い歩行者、煙や霧で見え難い物体等の像がきれいに写ったＩＲ（Infrared　Ray）画像を撮像することができる。また、撮像素子ＩＲは、被写体の熱情報を検知することもできる。

　ＨＤＲ画像は、上記した高感度画像、中間度画像、低感度画像、およびＩＲ画像をＨＤＲ合成することによって生成される。このため、ＨＤＲ画像は、暗い被写体、明るい被写体、および肉眼ではみえ難い被写体等の全ての被写体の像がきれいに写った画像となる。

　なお、図１に示す画素アレイＡ１では、露光時間を異ならせることで、受光面積が同一の撮像素子Ｌ、Ｍ、Ｓによって高感度画像、中感度画像、または低感度画像を撮像するが、これは一例である。例えば、画素アレイＡ１は、各撮像画素に積層されるカラーフィルタの透光率を異ならせることで、露光時間を同一にしても、高感度画像、中感度画像、または低感度画像を撮像することができる。

　この場合、画素アレイＡ１では、カラーフィルタの透光率が通常よりも高い撮像画素が高感度撮像画素となり、カラーフィルタの透光率が通常の撮像画素が中感度撮像画素となり、カラーフィルタの透光率が通常よりも低い撮像画素が低感度撮像画素となる。

　なお、露光開始時間を異ならせる方法として、露光開始時間を同一にし露光終了時間を異ならせる方法、露光開始時間を異ならせ露光終了時間を同一にする方法、露光開始時間と終了時間のいずれも異なる時間にする方法を用いても、高感度画像、中感度画像、または低感度画像を撮像することができる。

　かかる画素アレイＡ１によっても、同時に高感度画像および低感度画像を撮像することができるので、両画像をＨＤＲ合成することにより、ＨＤＲ画像を撮像することが可能である。また、撮像画素の受光面積を異ならせることで、カラーフィルタの透光性および露光時間が同一の撮像画素を高感度撮像画素または低感度撮像画素として機能させることもできる。

　ここで、画像データから被写体を認識する方法の一例として、ＤＮＮ（Deep　Neural　Network）を用いる画像認識方法がある。ＤＮＮは、画像データから被写体の特徴（パターン）を認識するように機械学習によって設計された人間の脳神経回路（ニューラルネットワーク）をモデルとした多階層構造のアルゴリズムである。

　図２Ａは、一般的なＤＮＮの使用例を示す説明図である。例えば、ＨＤＲ画像から被写体を認識する場合、図２Ａに示すように、ＨＤＲ合成後のＨＤＲ画像における赤Ｒ、緑Ｇ、青Ｂの各画素の信号Ｒ、Ｇ、Ｂ（ＨＤＲ画像の画像データ）をＤＮＮへ入力すると、ＤＮＮから被写体の認識結果が出力される。

　しかしながら、ＨＤＲ画像には、ＨＤＲ合成が行われたことで、実際には存在しないアーチファクトが写り込むことがある。このため、ＨＤＲ画像における各画素の信号Ｒ、Ｇ、ＢをＤＮＮへ入力すると、アーチファクトの弊害によって、ＤＮＮによる被写体の認識精度が低下することがある。

　そこで、本開示では、ＨＤＲ合成前の高感度画像、中感度画像、低感度画像、およびＩＲ画像のそれぞれから被写体を認識することで、アーチファクトの影響を排除し、被写体の認識精度を向上させる。図２Ｂは、本開示に係るＤＮＮの使用例を示す説明図である。

　図２Ｂに示すように、本開示では、例えば、撮像素子Ｌから出力される長時間露光信号Ｒ、Ｇｒ、Ｇｂ、Ｂ（高感度画像の画像データ）と、撮像素子Ｍから出力される中時間露光信号Ｒ、Ｇｒ、Ｇｂ、Ｂ（中感度画像の画像データ）とをＤＮＮへ入力する。さらに、本開示では、撮像素子Ｓから出力される短時間露光信号Ｒ、Ｇｒ、Ｇｂ、Ｂ（低感度画像の画像データ）と、撮像素子ＩＲから出力される赤外光信号ＩＲｒ、ＩＲｇｒ、ＩＲｇｂ、ＩＲｂ（ＩＲ画像の画像データ）をＤＮＮへ入力する。

　これにより、ＤＮＮは、高感度画像、中感度画像、低感度画像とＩＲ画像から被写体を認識した認識結果とを出力する。

　このとき、ＤＮＮは、アーチファクトを含まない高感度画像、中感度画像、低感度画像およびＩＲ画像から被写体を認識するので、アーチファクトの影響を受けることなく高精度な被写体の認識結果を出力することができる。

　このように、本開示に係る画像認識方法は、可視光を受光する撮像画素と、赤外光を受光する撮像画素を使用し、１フレーム期間に複数の露光時間で撮像し、これら全てを用いて被写体を認識するので被写体の認識精度を向上させることができる。

［２．画像認識システムの構成］
　次に、図３を参照し、本開示に係る画像認識システムの構成について説明する。図３は、本開示に係る画像認識システムの構成例を示す図である。図３に示すように、本開示に係る画像認識システム１００は、画像認識装置の一例であるイメージセンサ１と、アプリケーションプロセッサ（以下、ＡＰ２と記載する）とを有する。

　イメージセンサ１は、撮像部１０と、信号処理部１３と、認識部１４と、データ送信判断部１５と、セレクタ（以下、ＳＥＬ１６と記載する）と、送信部１７とを備える。撮像部１０は、画素アレイＡ１と、Ａ／Ｄ（Analog／Digital）変換部１２とを備える。

　画素アレイＡ１は、撮像素子Ｌ、Ｍ、Ｓ、ＩＲによって、高感度画像、中感度画像、低感度画像、およびＩＲ画像を撮像する。そして、画素アレイＡ１は、撮像素子Ｌ、Ｍ、Ｓ、ＩＲからＡ／Ｄ変換部１２へ受光量に応じたアナログの画素信号を出力する。

　Ａ／Ｄ変換部１２は、画素アレイＡ１から入力されるアナログの画素信号をデジタルの画素信号にＡ／Ｄ変換して高感度画の画像データと、中感度の画像データと、低感度画像の画像データと、赤外光の画像データとを生成し、信号処理部１３へ出力する。

　信号処理部１３は、ＣＰＵ（Central　Processing　Unit）、ＲＯＭ（Read　Only　Memory）、ＲＡＭ（Random　Access　Memory）などを有するマイクロコンピュータや各種の回路を含む。

　信号処理部１３は、Ａ／Ｄ変換部１２から入力される高感度画の画像データと、中感度の画像データと、低感度画像の画像データと、赤外光の画像データとに対して、それぞれ所定の信号処理を実行する。そして、信号処理部１３は、信号処理後の高感度画の画像データと、中感度の画像データと、低感度画像の画像データと、赤外光の画像データとを認識部１４と、ＳＥＬ１６へ出力する。

　ここで、図４を参照し、信号処理部１３が実行する処理の流れについて説明する。図４は、本開示に係る信号処理部が実行する処理の説明図である。図４に示すように、信号処理部１３は、入力される画像データに対して、まず、シェーディング補正を行い、続いて、混色補正を行う。

　その後、信号処理部１３は、画像データに対してデジタルゲイン調整を行い、続いて、ホワイトバランスゲイン調整を行う。その後、信号処理部１３は、画像データに対してデモザイクを行った後、最後にガンマ補正を行い、ガンマ補正後の画像データを出力する。

　なお、デモザイクでは、高感度画像、中感度画像、低感度画像、およびＩＲ画像の各画素の色を周囲の画素の色によって補完する処理を行う。このため、デモザイク前の高感度画像、中感度画像、低感度画像の画像データは、それぞれ４種類の画素信号Ｒ、Ｇｒ、Ｇｂ、Ｂとなるが、デモザイク後の画像データは、３種類の画素信号Ｒ、Ｇ、Ｂとなる。また、デモザイク前のＩＲ画像の画像データは、４種類の画素信号ＩＲｒ、ＩＲｇｒ、ＩＲｇｂ、ＩＲｂとなるが、デモザイク後の画像データは、１種類の画像信号ＩＲとなる。

　図３へ戻り、認識部１４は、ＣＰＵ、ＲＯＭ、ＲＡＭなどを有するマイクロコンピュータや各種の回路を含む。認識部１４は、ＣＰＵがＲＯＭに記憶された物体認識プログラムを、ＲＡＭを作業領域として使用して実行することにより機能する物体認識部３１と、ＲＡＭまたはＲＯＭに設けられる物体認識用データ記憶部３２とを備える。物体認識用データ記憶部３２には、認識対象となる物体の種類毎にＤＮＮが記憶されている。

　物体認識部３１は、設定される認識対象の種類に応じたＤＮＮを物体認識用データ記憶部３２から読出し、画像データをＤＮＮへ入力してＤＮＮから出力される被写体の認識結果をデータ送信判断部１５へ出力し、認識結果のメタデータをＳＥＬ１６へ出力する。

　ここで、図５Ａよび図５Ｂを参照し、認識部１４が行う処理の流れについて説明する。図５Ａおよび図５Ｂは、本開示に係る認識部が実行する処理の説明図である。図５Ａに示すように、認識部１４は、まず、入力される画像データのサイズおよび入力値をＤＮＮ用のサイズおよび入力値に合わせて正規化し、正規化後の画像データをＤＮＮへ入力して物体認識を行う。そして、認識部１４は、ＤＮＮから出力される被写体の認識結果をデータ送信判断部１５へ出力し、認識結果のメタデータをＳＥＬ１６へ出力する。

　このとき、図５Ｂに示すように、認識部１４は、長時間露光信号Ｒ、Ｇ、Ｂと、中時間露光信号Ｒ、Ｇ、Ｂと、短時間露光信号Ｒ、Ｇ、Ｂと、赤外光信号ＩＲとをＤＮＮへ入力する。これにより、認識部１４は、アーチファクトのない高感度画像、中感度画像、低感度画像、およびＩＲ画像のそれぞれから被写体を認識することで、被写体の認識精度を向上させることができる。

　図３へ戻り、データ送信判断部１５は、認識部１４から入力される認識結果に応じてＳＥＬ１６から出力させるデータを切替える制御信号をＳＥＬ１６へ出力する。データ送信判断部１５は、認識部１４によって被写体が認識された場合には、画像データと、認識結果を示すメタデータとを送信部１７へ出力させる制御信号をＳＥＬ１６へ出力する。

　また、データ送信判断部１５は、認識部１４によって被写体が認識されなかった場合、その旨を示す情報（ノーデータ）を送信部１７へ出力させる制御信号をＳＥＬ１６へ出力する。ＳＥＬ１６は、データ送信判断部１５から入力される制御信号に応じて、画像データおよびメタデータのセット、または、ノーデータのいずれかを送信部１７へ出力する。

　送信部１７は、ＡＰ２との間でデータ通信を行う通信Ｉ／Ｆ（インターフェース）であり、ＳＥＬ１６から入力される画像データおよびメタデータのセット、または、ノーデータのいずれかをＡＰ２へ送信する。

　このように、イメージセンサ１は、被写体を認識した場合に限って画像データをＡＰ２へ送信し、被写体を認識しない場合には、画像データをＡＰ２へ送信することがないため、画像データの送信に要する消費電力を低減することができる。

　ＡＰ２は、画像認識システム１００の用途に応じた各種アプリケーションプログラムを実行するＣＰＵ、ＲＯＭ、ＲＡＭなどを有するマイクロコンピュータや各種の回路を含む。ＡＰ２は、受信部２１と、認証部２２と、認証用データ記憶部２３とを備える。

　認証用データ記憶部２３には、イメージセンサ１によって認識された被写体を認証するための認証用プログラムおよび認証用画像データ等が記憶されている。受信部２１は、イメージセンサ１との間でデータ通信を行う通信Ｉ／Ｆである。受信部２１は、イメージセンサ１から画像データおよびメタデータのセット、または、ノーデータのいずれかを受信して認証部２２へ出力する。

　認証部２２は、受信部２１からノーデータが入力される場合には起動せず、画像データおよびメタデータのセットが入力された場合に起動する。認証部２２は、起動すると認証用データ記憶部２３から認証用プログラムを読み出して実行し、イメージセンサ１によって認識された被写体を認証する。

　例えば、認証部２２は、被写体が人であることを示すメタデータと画像データのセットが入力される場合、画像データと人の認証用画像データとを照合し、認識された人が誰かを特定する処理等を行う。

　このとき、認証部２２は、イメージセンサ１によって被写体が人であると高精度に認識されたアーチファクトの影響がない高感度画像、中感度画像、低感度画像、およびＩＲ画像の画像データに基づいて人を特定する。これにより、認証部２２は、認識された人が誰かを的確に特定することができる。なお、上記した実施形態は、一例であり、種々の変形が可能である。次に本開示に係る実施形態に係る変形例について説明する。

［３．信号処理部が実行する処理の変形例］
　図６は、本開示に係る信号処理部が実行する処理の変形例を示す説明図である。図７は、本開示に係るＤＮＮの使用例の変形例を示す説明図である。

　図６に示すように、変形例に係る信号処理部は、入力される画像データに対して、シェーディング補正、混色補正、デジタルゲイン調整、ホワイトバランスゲイン調整、およびガンマ補正を行い、信号処理後の画像データを認識部１４と、ＳＥＬ１６とに出力する。

　このように、信号処理部は、図４に示した信号処理からデモザイクを省略することができる。この場合、認識部１４は、デモザイクが実行されない画像データから被写体を認識する。前述したように、デモザイクが実行されない高感度画像、中感度画像、および低感度画像の画像データは、４種類の画素信号Ｒ、Ｇｒ、Ｇｂ、Ｂとなる。また、デモザイクが実行されないＩＲ画像の画像データは、画素信号ＩＲｒ、ＩＲｇｒ、ＩＲｇｂ、ＩＲｂとなる。

　このため、認識部１４は、長時間露光信号Ｒ、Ｇｒ、Ｇｂ、Ｂと、中時間露光信号Ｒ、Ｇｒ、Ｇｂ、Ｂと、短時間露光信号Ｒ、Ｇｒ、Ｇｂ、Ｂとと、赤外光信号ＩＲｒ、ＩＲｇｒ、ＩＲｇｂ、ＩＲをＤＮＮへ入力する（図２Ｂ参照）。かかる場合、認識部１４は、ＤＮＮの入力チャンネル数が増えるので処理量が増すが、ＤＮＮには、高感度画像、中感度画像、低感度画像、ＩＲ画像の画像データが個別に入力されるので、アーチファクトの影響を受けることなく被写体を高精度に認識することができる。

　なお、他の変形例では、信号処理部自体を省略することもできる。かかる場合にも同様に、認識部１４は、長時間露光信号Ｒ、Ｇｒ、Ｇｂ、Ｂと、中時間露光信号Ｒ、Ｇｒ、Ｇｂ、Ｂと、短時間露光信号Ｒ、Ｇｒ、Ｇｂ、Ｂとと、赤外光信号ＩＲｒ、ＩＲｇｒ、ＩＲｇｂ、ＩＲをＤＮＮへ入力する。このため、認識部１４は、処理量が増すが、信号処理を行わない分、イメージセンサ１全体としての処理量が大幅に低減される。

　なお、上記した実施形態では、データ送信判断部１５は、被写体を認識した場合に、毎回、認識結果のメタデータと画像データとをＳＥＬ１６に出力させたが、バッテリ残量に応じてＳＥＬ１６から出力させるデータを選択してもよい。

　例えば、データ送信判断部１５は、認識部１４によって被写体が認識された場合、バッテリの残量が所定残量以上ある状態の通常モードでは、メタデータと画像データとをＳＥＬ１６から出力させる。また、データ送信判断部１５は、バッテリの残量が所定残量未満の状態の低消費電力モードでは、メタデータのみをＳＥＬ１６から出力させる。これにより、データ送信判断部１５は、バッテリの残量が不足している場合に、イメージセンサ１の消費電力を低く抑えることができる。

［４．認識部による被写体認識の変形例］
　図７は、本開示に係る認識部が使用するＤＮＮの変形例を示す説明図である。図２Ｂおよび図５Ｂに示した例では、認識部１４は、１つのＤＮＮを使用して被写体の認識を行ったが、図７に示すように、２つのＤＮＮを使用することもできる。

　具体的には、長時間露光画像、中時間露光画像、および短時間露光画像には、色彩があるが、ＩＲ画像には、色彩がない。このため、長時間露光画像、中時間露光画像、および短時間露光画像と、ＩＲ画像とでは、画像中の被写体の特徴が異なる。

　そこで、変形例に係る認識部は、第１ＤＮＮと、第２ＤＮＮとを使用して被写体を認識する。第１ＤＮＮは、長時間露光画像、中時間露光画像、および短時間露光画像から被写体を認識することに特化して機械学習された学習モデルである。第２ＤＮＮは、ＩＲ画像から被写体を認識することに特化して機械学習された学習モデル。

　変形例に係る認識部は、第１ＤＮＮへ長時間露光信号Ｒ、Ｇ、Ｂ、中時間露光信号Ｒ、Ｇ、Ｂ、短時間露光信号Ｒ、Ｇ、Ｂを入力して、長時間露光画像、中時間露光画像、および短時間露光画像から被写体を認識する。また、認識部は、第２ＤＮＮへ赤外光信号を入力して、ＩＲ画像から被写体を認識する。これにより、認識部は、被写体の認識精度をさらに向上させることができる。

［５．画素アレイの変形例］
　図８は、本開示に係る画素アレイの第１変形例を示す説明図である。図９は、本開示に係る画素アレイの第２変形例を示す説明図である。図１０は、本開示に係る画素アレイの第２変形例を採用した場合のＤＮＮの使用例を示す説明図である。図１１は、本開示に係る画素アレイの第３変形例を示す説明図である。

　図８に示すように、第１変形例に係る画素アレイＡ２は、図１に示した撮像素子ＩＲの代わりにＴｏＦ（Time　of　Flight）センサを備える。画素アレイＡ２を採用する場合、イメージセンサ１は、被写体へ向けて赤外光を照射する発光部を備える。

　ＴｏＦセンサは、赤外光が照射されてから、被写体に反射した赤外光を受光するまでの時間に基づいて、被写体までの距離を測定するセンサである。イメージセンサ１は、かかる画素アレイＡ２を採用することによって、被写体の認識に加えて、被写体までの距離を測定することができる。

　また、図９に示すように、第２変形例に係る画素アレイＡ３は、赤色光を受光する撮像画素Ｒと、緑色光を受光する撮像画素Ｇと、青色光を受光する撮像画素Ｂと、赤外光を受光する撮像画素ＩＲとを備える。

　撮像画素Ｒは、長時間露光する撮像素子ＲＬと短時間露光する撮像素子ＲＳとを備える。撮像画素Ｇは、長時間露光する撮像素子ＧＬと短時間露光する撮像素子ＧＳとを備える。撮像画素Ｂは、長時間露光する撮像素子ＢＬと短時間露光する撮像素子ＢＳとを備える。

　このように、画素アレイＡ３は、各撮像画素Ｒ、Ｇ、Ｂが、それぞれ２個の撮像素子ＲＬ、ＲＳ，ＧＬ、ＧＳ、ＢＬ、ＢＳを備える。かかる画素アレイＡ３は、一般的には、各撮像画素Ｒ、Ｇ、Ｂが備える全ての撮像素子ＲＬ、ＲＳ，ＧＬ、ＧＳ、ＢＬ、ＢＳの露光時間を同一にし、左右の撮像素子で受光される光の位相差に基づいて焦点を自動調整するオートフォーカスに使用される。

　本開示では、かかる画素アレイＡ３の撮像画素Ｒ、Ｇ、Ｂが備える撮像素子ＲＬ、ＲＳ，ＧＬ、ＧＳ、ＢＬ、ＢＳの露光時間を個別に制御することで、撮像素子ＲＬ、ＧＬ、ＢＬを長時間露光画素、撮像素子ＲＳ，ＧＳ，ＢＳを短時間露光画素として機能させる。

　これにより、画素アレイＡ３は、長時間露光画像および短時間露光画像を撮像することができる。また、画素アレイＡ３は、撮像素子ＩＲを備えるので、長時間露光画像および短時間露光画像と同時にＩＲ画像を撮像することもできる。

　認識部１４は、画素アレイＡ３が採用される場合、図１０に示すように、撮像画素ＲＬ、ＧＬ、ＢＬから出力される長時間露光信号、撮像画素ＲＳ、ＧＳ、ＢＳ出力される短時間露光信号、および撮像素子ＩＲから出力される赤外光信号をＤＮＮへ入力する。これにより、認識部１４は、長時間露光画像、短時間露光画像、およびＩＲ画像のそれぞれから高精度に被写体を認識することができる。

　また、図１１に示すように、第４変形例に係る画素アレイＡ４は、図９に示した画素アレイＡ３と同様に、赤色光を受光する一対の撮像素子Ｒ、Ｒ、緑色光を受光する一対の撮像素子Ｇ、Ｇ、および青色光を受光する撮像素子Ｂ、Ｂを備える。また、画素アレイＡ４は、赤外光を受光する一対の撮像素子ＩＲ、ＩＲを備える。各撮像素子Ｒ、Ｇ、Ｂ、ＩＲは、それぞれ、２個の光電変換素子ＰＤを備える。

　かかる画素アレイＡ４では、例えば、一対の撮像素子Ｒ、Ｒが備える４個の光電変換素子ＰＤのうち、１個を長時間露光、２個を中時間露光、残りの１個を短時間露光させる。また、画素アレイＡ４では、一対の撮像素子Ｇ、Ｇが備える４個の光電変換素子ＰＤのうち、１個を長時間露光、２個を中時間露光、残りの１個を短時間露光させる。

　また、画素アレイＡ４では、例えば、一対の撮像素子Ｂ、Ｂが備える４個の光電変換素子ＰＤのうち、１個を長時間露光、２個を中時間露光、残りの１個を短時間露光させる。これにより、画素アレイＡ４は、長時間露光画像、中時間露光画像、および短時間露光画像を撮像することができる。

　また、画素アレイＡ４は、撮像素子ＩＲ、ＩＲを露光させることで、ＩＲ画像を撮像することができる。かかる画素アレイＡ４が採用される場合、認識部１４は、長時間露光画像、中時間露光画像、短時間露光画像、およびＩＲ画像の画像データをＤＮＮへ入力することにより、アーチファクトの影響を受けることなく、高精度に被写体を認識することができる。

[６．移動体への応用例］
　本開示に係る技術（本技術）は、様々な製品へ応用することができる。例えば、本開示に係る技術は、自動車、電気自動車、ハイブリッド電気自動車、自動二輪車、自転車、パーソナルモビリティ、飛行機、ドローン、船舶、ロボット等のいずれかの種類の移動体に搭載される装置として実現されてもよい。

　図１２は、本開示に係る技術が適用され得る移動体制御システムの一例である車両制御システムの概略的な構成例を示すブロック図である。

　車両制御システム１２０００は、通信ネットワーク１２００１を介して接続された複数の電子制御ユニットを備える。図１２に示した例では、車両制御システム１２０００は、駆動系制御ユニット１２０１０、ボディ系制御ユニット１２０２０、車外情報検出ユニット１２０３０、車内情報検出ユニット１２０４０、及び統合制御ユニット１２０５０を備える。また、統合制御ユニット１２０５０の機能構成として、マイクロコンピュータ１２０５１、音声画像出力部１２０５２、及び車載ネットワークＩ／Ｆ（ｉｎｔｅｒｆａｃｅ）１２０５３が図示されている。

　駆動系制御ユニット１２０１０は、各種プログラムにしたがって車両の駆動系に関連する装置の動作を制御する。例えば、駆動系制御ユニット１２０１０は、内燃機関又は駆動用モータ等の車両の駆動力を発生させるための駆動力発生装置、駆動力を車輪に伝達するための駆動力伝達機構、車両の舵角を調節するステアリング機構、及び、車両の制動力を発生させる制動装置等の制御装置として機能する。

　ボディ系制御ユニット１２０２０は、各種プログラムにしたがって車体に装備された各種装置の動作を制御する。例えば、ボディ系制御ユニット１２０２０は、キーレスエントリシステム、スマートキーシステム、パワーウィンドウ装置、あるいは、ヘッドランプ、バックランプ、ブレーキランプ、ウィンカー又はフォグランプ等の各種ランプの制御装置として機能する。この場合、ボディ系制御ユニット１２０２０には、鍵を代替する携帯機から発信される電波又は各種スイッチの信号が入力され得る。ボディ系制御ユニット１２０２０は、これらの電波又は信号の入力を受け付け、車両のドアロック装置、パワーウィンドウ装置、ランプ等を制御する。

　車外情報検出ユニット１２０３０は、車両制御システム１２０００を搭載した車両の外部の情報を検出する。例えば、車外情報検出ユニット１２０３０には、撮像部１２０３１が接続される。車外情報検出ユニット１２０３０は、撮像部１２０３１に車外の画像を撮像させるとともに、撮像された画像を受信する。車外情報検出ユニット１２０３０は、受信した画像に基づいて、人、車、障害物、標識又は路面上の文字等の物体検出処理又は距離検出処理を行ってもよい。

　撮像部１２０３１は、光を受光し、その光の受光量に応じた電気信号を出力する光センサである。撮像部１２０３１は、電気信号を画像として出力することもできるし、測距の情報として出力することもできる。また、撮像部１２０３１が受光する光は、可視光であっても良いし、赤外線等の非可視光であっても良い。

　車内情報検出ユニット１２０４０は、車内の情報を検出する。車内情報検出ユニット１２０４０には、例えば、運転者の状態を検出する運転者状態検出部１２０４１が接続される。運転者状態検出部１２０４１は、例えば運転者を撮像するカメラを含み、車内情報検出ユニット１２０４０は、運転者状態検出部１２０４１から入力される検出情報に基づいて、運転者の疲労度合い又は集中度合いを算出してもよいし、運転者が居眠りをしていないかを判別してもよい。

　マイクロコンピュータ１２０５１は、車外情報検出ユニット１２０３０又は車内情報検出ユニット１２０４０で取得される車内外の情報に基づいて、駆動力発生装置、ステアリング機構又は制動装置の制御目標値を演算し、駆動系制御ユニット１２０１０に対して制御指令を出力することができる。例えば、マイクロコンピュータ１２０５１は、車両の衝突回避あるいは衝撃緩和、車間距離に基づく追従走行、車速維持走行、車両の衝突警告、又は車両のレーン逸脱警告等を含むＡＤＡＳ（Ａｄｖａｎｃｅｄ　Ｄｒｉｖｅｒ　Ａｓｓｉｓｔａｎｃｅ　Ｓｙｓｔｅｍ）の機能実現を目的とした協調制御を行うことができる。

　また、マイクロコンピュータ１２０５１は、車外情報検出ユニット１２０３０又は車内情報検出ユニット１２０４０で取得される車両の周囲の情報に基づいて駆動力発生装置、ステアリング機構又は制動装置等を制御することにより、運転者の操作に拠らずに自律的に走行する自動運転等を目的とした協調制御を行うことができる。

　また、マイクロコンピュータ１２０５１は、車外情報検出ユニット１２０３０で取得される車外の情報に基づいて、ボディ系制御ユニット１２０２０に対して制御指令を出力することができる。例えば、マイクロコンピュータ１２０５１は、車外情報検出ユニット１２０３０で検知した先行車又は対向車の位置に応じてヘッドランプを制御し、ハイビームをロービームに切り替える等の防眩を図ることを目的とした協調制御を行うことができる。

　音声画像出力部１２０５２は、車両の搭乗者又は車外に対して、視覚的又は聴覚的に情報を通知することが可能な出力装置へ音声及び画像のうちの少なくとも一方の出力信号を送信する。図１２の例では、出力装置として、オーディオスピーカ１２０６１、表示部１２０６２及びインストルメントパネル１２０６３が例示されている。表示部１２０６２は、例えば、オンボードディスプレイ及びヘッドアップディスプレイの少なくとも一つを含んでいてもよい。

　図１３は、撮像部１２０３１の設置位置の例を示す図である。

　図１３では、車両１２１００は、撮像部１２０３１として、撮像部１２１０１，１２１０２，１２１０３，１２１０４，１２１０５を有する。

　撮像部１２１０１，１２１０２，１２１０３，１２１０４，１２１０５は、例えば、車両１２１００のフロントノーズ、サイドミラー、リアバンパ、バックドア及び車室内のフロントガラスの上部等の位置に設けられる。フロントノーズに備えられる撮像部１２１０１及び車室内のフロントガラスの上部に備えられる撮像部１２１０５は、主として車両１２１００の前方の画像を取得する。サイドミラーに備えられる撮像部１２１０２，１２１０３は、主として車両１２１００の側方の画像を取得する。リアバンパ又はバックドアに備えられる撮像部１２１０４は、主として車両１２１００の後方の画像を取得する。撮像部１２１０１及び１２１０５で取得される前方の画像は、主として先行車両又は、歩行者、障害物、信号機、交通標識又は車線等の検出に用いられる。

　なお、図１３には、撮像部１２１０１ないし１２１０４の撮影範囲の一例が示されている。撮像範囲１２１１１は、フロントノーズに設けられた撮像部１２１０１の撮像範囲を示し、撮像範囲１２１１２，１２１１３は、それぞれサイドミラーに設けられた撮像部１２１０２，１２１０３の撮像範囲を示し、撮像範囲１２１１４は、リアバンパ又はバックドアに設けられた撮像部１２１０４の撮像範囲を示す。例えば、撮像部１２１０１ないし１２１０４で撮像された画像データが重ね合わせられることにより、車両１２１００を上方から見た俯瞰画像が得られる。

　撮像部１２１０１ないし１２１０４の少なくとも１つは、距離情報を取得する機能を有していてもよい。例えば、撮像部１２１０１ないし１２１０４の少なくとも１つは、複数の撮像素子からなるステレオカメラであってもよいし、位相差検出用の画素を有する撮像素子であってもよい。

　例えば、マイクロコンピュータ１２０５１は、撮像部１２１０１ないし１２１０４から得られた距離情報を基に、撮像範囲１２１１１ないし１２１１４内における各立体物までの距離と、この距離の時間的変化（車両１２１００に対する相対速度）を求めることにより、特に車両１２１００の進行路上にある最も近い立体物で、車両１２１００と略同じ方向に所定の速度（例えば、０ｋｍ／ｈ以上）で走行する立体物を先行車として抽出することができる。さらに、マイクロコンピュータ１２０５１は、先行車の手前に予め確保すべき車間距離を設定し、自動ブレーキ制御（追従停止制御も含む）や自動加速制御（追従発進制御も含む）等を行うことができる。このように運転者の操作に拠らずに自律的に走行する自動運転等を目的とした協調制御を行うことができる。

　例えば、マイクロコンピュータ１２０５１は、撮像部１２１０１ないし１２１０４から得られた距離情報を元に、立体物に関する立体物データを、２輪車、普通車両、大型車両、歩行者、電柱等その他の立体物に分類して抽出し、障害物の自動回避に用いることができる。例えば、マイクロコンピュータ１２０５１は、車両１２１００の周辺の障害物を、車両１２１００のドライバが視認可能な障害物と視認困難な障害物とに識別する。そして、マイクロコンピュータ１２０５１は、各障害物との衝突の危険度を示す衝突リスクを判断し、衝突リスクが設定値以上で衝突可能性がある状況であるときには、オーディオスピーカ１２０６１や表示部１２０６２を介してドライバに警報を出力することや、駆動系制御ユニット１２０１０を介して強制減速や回避操舵を行うことで、衝突回避のための運転支援を行うことができる。

　撮像部１２１０１ないし１２１０４の少なくとも１つは、赤外線を検出する赤外線カメラであってもよい。例えば、マイクロコンピュータ１２０５１は、撮像部１２１０１ないし１２１０４の撮像画像中に歩行者が存在するか否かを判定することで歩行者を認識することができる。かかる歩行者の認識は、例えば赤外線カメラとしての撮像部１２１０１ないし１２１０４の撮像画像における特徴点を抽出する手順と、物体の輪郭を示す一連の特徴点にパターンマッチング処理を行って歩行者か否かを判別する手順によって行われる。マイクロコンピュータ１２０５１が、撮像部１２１０１ないし１２１０４の撮像画像中に歩行者が存在すると判定し、歩行者を認識すると、音声画像出力部１２０５２は、当該認識された歩行者に強調のための方形輪郭線を重畳表示するように、表示部１２０６２を制御する。また、音声画像出力部１２０５２は、歩行者を示すアイコン等を所望の位置に表示するように表示部１２０６２を制御してもよい。

　以上、本開示に係る技術が適用され得る車両制御システムの一例について説明した。本開示に係る技術は、以上説明した構成のうち、例えば、車外情報検出ユニット１２０３０、撮像部１２０３１、車内情報検出ユニット１２０４０、および運転者状態検出部１２０４１等に適用され得る。例えば、図１の画像認識装置１は、車内情報検出ユニット１２０４０および運転者状態検出部１２０４１に適用することができる。車内情報検出ユニット１２０４０および運転者状態検出部１２０４１に本開示に係る技術を適用することにより、被写体である運転者の認識精度が向上するので、運転者の疲労度合い、集中度合、居眠りしていないか等をより正確に検出することが可能になる。

［７．効果］
　画像認識装置の一例であるイメージセンサ１は、撮像部１０と、認識部１４とを有する。撮像部１０は、可視光を受光する撮像画素Ｒ、Ｇｒ、Ｇｂ、Ｂと、赤外光を受光する撮像画素ＩＲとを使用し、１フレーム期間に複数の画像を同一露光タイミングで撮像して画像データを生成する。認識部は、画像データのそれぞれから被写体を認識する。これにより、イメージセンサ１は、アーチファクトの影響を排除することで、被写体の認識精度を向上させることができる。

　また、撮像部１０は、受光面積が同一であり露光時間が異なる複数の撮像画素Ｒ、Ｇｒ、Ｇｂ、Ｂと、赤外光を受光する撮像画素ＩＲとが２次元に配列された画素アレイＡ１を有する。これにより、イメージセンサ１は、露光時間の異なる画像データおよびＩＲ画像のそれぞれから被写体を認識することで、アーチファクトの影響を受けることなく、高精度に被写体を認識することができる。

　また、画素アレイＡ１は、可視光を受光する長時間露光撮像画素の一例である撮像素子Ｌ、中時間露光撮像画素の一例である撮像素子Ｍ、および短時間露光撮像画素の一例である撮像素子Ｓを有する。これにより、イメージセンサ１は、長時間露光画像、中時間露光画像、および短時間露光画像のそれぞれから被写体を認識することで、アーチファクトの影響を受けることなく、高精度に被写体を認識することができる。

　また、画素アレイＡ３は、各画素が露光時間の異なる２個の撮像素子ＲＬ、ＲＳ，ＧＬ、ＧＳ、ＢＬ、ＢＳによって構成される。これにより、イメージセンサ１は、オートフォーカス用の位相差画素を使用して、長時間露光画像および短時間露光画像を撮像することができる。

　また、画素アレイＡ４は、各画素が２個の撮像素子Ｒ、Ｒ、Ｇ、Ｇ、Ｂ、Ｂによって構成される。各撮像素子Ｒ、Ｇ、Ｂは、露光時間の異なる２個の光電変換素子ＰＤを備える。これにより、イメージセンサ１は、各光電変換素子ＰＤの露光時間を制御することによって、長時間露光画像、中時間露光画像、および短時間露光画像を撮像することができる。

　また、認識部１４は、被写体を認識した場合に、被写体の認識結果および画像データを後段の装置の一例であるＡＰ２へ出力し、被写体を認識しない場合に、その旨を示す情報をＡＰ２へ出力する。これにより、イメージセンサ１は、被写体を認識しない場合に、画像データの出力を行わないので、消費電力を低減することができる。

　また、認識部１４は、バッテリの残量が所定残量以上である場合に、被写体の認識結果および画像データをＡＰ２へ出力し、所定残量未満の場合に、ＡＰ２へ画像データを出力することなく被写体の認識結果を出力する。これにより、イメージセンサ１は、バッテリ残量が所定残量未満である場合に、被写体を認識しても画像データの出力を行わないので、消費電力を低減することができる。

　また、認識部１４は、デモザイク処理が実行された画像データから被写体を認識する。これにより、イメージセンサ１は、ＤＮＮを使用して被写体を認識する場合に、ＤＮＮの入力チャンネル数を低減することによって、処理負荷を低減することができる。

　また、認識部１４は、デモザイク処理が実行されない画像データから被写体を認識する。これにより、イメージセンサ１は、ＤＮＮを使用して被写体を認識する場合に、処理量が増すが、高感度画像、中感度画像、低感度画像、ＩＲ画像の画像データから高精度に被写体を認識することができる。

　また、認識部１４は、撮像部１０から入力される画像データから被写体を認識する。これにより、イメージセンサ１は、ＤＮＮを使用して被写体を認識する場合に、処理量が増すが、信号処理を行わない分、イメージセンサ１全体としての処理量が大幅に低減することができる。

　また、赤外光を受光する撮像画素は、ＴｏＦ（Time　of　Flight）センサである。これにより、イメージセンサ１は、被写体の認識に加えて、被写体までの距離を測定することができる。

　また、画像認識方法は、可視光を受光する撮像画素と、赤外光を受光する撮像画素とを使用し、１フレーム期間に複数の画像を同一露光タイミングで撮像して画像データを生成し、画像データのそれぞれから被写体を認識する。かかる画像認識方法によれば、アーチファクトの影響を排除することで、被写体の認識精度を向上させることができる。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　可視光を受光する撮像画素と、赤外光を受光する撮像画素とを使用し、１フレーム期間に複数の画像を同一露光タイミングで撮像して画像データを生成する撮像部と、
　前記画像データのそれぞれから被写体を認識する認識部と
　を有する画像認識装置。
（２）
　前記撮像部は、
　受光面積が同一であり露光時間が異なる複数の前記撮像画素と、赤外光を受光する撮像画素とが２次元に配列された画素アレイ
　を有する前記（１）に記載の画像認識装置。
（３）
　前記画素アレイは、
　前記可視光を受光する長時間露光撮像画素、中時間露光撮像画素、および短時間露光撮像画素
　を有する前記（２）に記載の画像認識装置。
（４）
　前記画素アレイは、
　各画素が露光時間の異なる２個の光電変換素子によって構成される
　前記（２）に記載の画像認識装置。
（５）
　前記画素アレイは、
　各画素が２個の撮像素子によって構成され、
　各前記撮像素子は、
　露光時間の異なる２個の光電変換素子を備える
　前記（２）に記載の画像認識装置。
（６）
　前記認識部は、
　前記被写体を認識した場合に、前記被写体の認識結果および前記画像データを後段の装置へ出力し、前記被写体を認識しない場合に、その旨を示す情報を後段の装置へ出力する
　前記（１）～（５）のいずれか一つに記載の画像認識装置。
（７）
　前記認識部は、
　バッテリの残量が所定残量以上である場合に、前記被写体の認識結果および前記画像データを後段の装置へ出力し、前記所定残量未満の場合に、前記後段の装置へ前記画像データを出力することなく前記被写体の認識結果を出力する
　前記（６）に記載の画像認識装置。
（８）
　前記認識部は、
　デモザイク処理が実行された前記画像データから前記被写体を認識する
　前記（１）～（７）のいずれか一つに記載の画像認識装置。
（９）
　前記認識部は、
　デモザイク処理が実行されない前記画像データから前記被写体を認識する
　前記（１）～（８）のいずれか一つに記載の画像認識装置。
（１０）
　前記認識部は、
　前記撮像部から入力される前記画像データから前記被写体を認識する
　前記（１）～（８）のいずれか一つに記載の画像認識装置。
（１１）
　前記赤外光を受光する撮像画素は、
　ＴｏＦ（Time　of　Flight）センサである
　前記（１）～（１０）のいずれか一つに記載の画像認識装置。
（１２）
　可視光を受光する撮像画素と、赤外光を受光する撮像画素とを使用し、１フレーム期間に複数の画像を同一露光タイミングで撮像して画像データを生成し、
　前記画像データのそれぞれから被写体を認識する
　画像認識方法。

　１００　画像認識システム
　１　イメージセンサ
　１０　撮像部
　Ａ１、Ａ２、Ａ３、Ａ４　画素アレイ
　１２　Ａ／Ｄ変換部
　１３　信号処理部
　１４　認識部
　１５　データ送信判断部
　１６　ＳＥＬ
　１７　送信部
　２　ＡＰ
　２１　受信部
　２２　認証部
　２３　認証用データ記憶部
　３１　物体認識部
　３２　物体認識用データ記憶部

Claims

　可視光を受光する撮像画素と、赤外光を受光する撮像画素とを使用し、１フレーム期間に複数の画像を同一露光タイミングで撮像して画像データを生成する撮像部と、
　前記画像データのそれぞれから被写体を認識する認識部と
　を有する画像認識装置。
　前記撮像部は、
　受光面積が同一であり露光時間が異なる複数の前記撮像画素と、赤外光を受光する撮像画素とが２次元に配列された画素アレイ
　を有する請求項１に記載の画像認識装置。
　前記画素アレイは、
　前記可視光を受光する長時間露光撮像画素、中時間露光撮像画素、および短時間露光撮像画素
　を有する請求項２に記載の画像認識装置。
　前記画素アレイは、
　各画素が露光時間の異なる２個の撮像素子によって構成される
　請求項２に記載の画像認識装置。
　前記画素アレイは、
　各画素が２個の撮像素子によって構成され、
　各前記撮像素子は、
　露光時間の異なる２個の光電変換素子を備える
　請求項２に記載の画像認識装置。
　前記認識部は、
　前記被写体を認識した場合に、前記被写体の認識結果および前記画像データを後段の装置へ出力し、前記被写体を認識しない場合に、その旨を示す情報を後段の装置へ出力する
　請求項１に記載の画像認識装置。
　前記認識部は、
　バッテリの残量が所定残量以上である場合に、前記被写体の認識結果および前記画像データを後段の装置へ出力し、前記所定残量未満の場合に、前記後段の装置へ前記画像データを出力することなく前記被写体の認識結果を出力する
　請求項６に記載の画像認識装置。
　前記認識部は、
　デモザイク処理が実行された前記画像データから前記被写体を認識する
　請求項１に記載の画像認識装置。
　前記認識部は、
　デモザイク処理が実行されない前記画像データから前記被写体を認識する
　請求項１に記載の画像認識装置。
　前記認識部は、
　前記撮像部から入力される前記画像データから前記被写体を認識する
　請求項１に記載の画像認識装置。
　前記赤外光を受光する撮像画素は、
　ＴｏＦ（Time　of　Flight）センサである
　請求項１に記載の画像認識装置。
　可視光を受光する撮像画素と、赤外光を受光する撮像画素とを使用し、１フレーム期間に複数の画像を同一露光タイミングで撮像して画像データを生成し、
　前記画像データのそれぞれから被写体を認識する
　画像認識方法。