WO2021192682A1

WO2021192682A1 - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: WO2021192682A1
Application number: PCT/JP2021/004911
Authority: WO
Inventors: 昭寿一色
Original assignee: ソニーセミコンダクタソリューションズ株式会社
Priority date: 2020-03-24
Filing date: 2021-02-10
Publication date: 2021-09-30
Also published as: JPWO2021192682A1

Abstract

情報処理装置（２）は、画像（４０）と画像（４０）に含まれるオブジェクトの変化を示す差分画像（５０）とを入力とする学習済みモデル（３３０）を用いて、画像（４０）中のオブジェクトを検出する検出部（３２３）を備え、学習済みモデル（３３０）は、画像（４０）の特徴量を抽出する抽出レイヤ（３３１）と、抽出レイヤ（３３１）の抽出結果、及び、差分画像（５０）に基づいて、画像（４０）中のオブジェクトを検出する検出レイヤ（３３３）と、を含む。

Description

情報処理装置、情報処理方法及びプログラム

　本開示は、情報処理装置、情報処理方法及びプログラムに関する。

　近年、画像認識により画角内に映り込んだオブジェクトを検出する技術が急速に発達してきている。例えば、特許文献１には、背景画像に対して変化した画素を示す差分情報が結合された画像を、ニューラルネットワークを用いた認識器に入力することで、画像に映り込んだオブジェクトを検出する技術が開示されている。

特開２０１７－１９１５０１号公報

　しかしながら、上記従来技術では、背景画像に対して変化した画素であるか否かを示す１ビットの情報のみが画像に結合され、色や形状などのその他の情報が利用されていないため、オブジェクトの検出精度を十分に向上することができていなかった。

　本開示は、オブジェクトの検出精度をより向上することが可能な情報処理装置、情報処理方法及びプログラムを提供することを目的とする。

　本開示の一側面に係る情報処理装置は、画像と画像に含まれるオブジェクトの変化を示す差分画像とを入力とする学習済みモデルを用いて、画像中のオブジェクトを検出する検出部を備え、学習済みモデルは、画像の特徴量を抽出する抽出レイヤと、抽出レイヤの抽出結果、及び、差分画像に基づいて、画像中のオブジェクトを検出する検出レイヤと、を含む。

　本開示の一側面に係る情報処理方法は、画像と画像に含まれるオブジェクトの変化を示す差分画像とを入力とする学習済みモデルを用いて、画像中のオブジェクトを検出することを含み、学習済みモデルは、画像の特徴量を抽出する抽出レイヤと、抽出レイヤの抽出結果、及び、差分画像に基づいて、画像中のオブジェクトを検出する検出レイヤと、を含む。

　本開示の一側面に係るプログラムは、コンピュータを機能させるためのプログラムであって、画像と画像に含まれるオブジェクトの変化を示す差分画像とを入力とする学習済みモデルとを用いて、画像中のオブジェクトを検出する工程と、をコンピュータに実行させ、学習済みモデルは、画像の特徴量を抽出する抽出レイヤと、抽出レイヤの抽出結果、及び、差分画像に基づいて、画像中のオブジェクトを検出する検出レイヤと、を含む。

実施形態に係る撮像装置の概略構成の例を示す図である。撮像装置の外観構成例の概要を示す斜視図である。ＤＳＰの機能ブロックの例を示す図である。オブジェクト検出処理の例を示す図である。学習済みモデルの生成の例を示すフローチャートである。テンプレート画像の生成の例を示すフローチャートである。オブジェクト検出処理の例を示すフローチャートである。変形例に係る撮像装置の概略構成の例を示す図である。変形例に係る撮像装置の概略構成の例を示す図である。変形例に係る撮像装置の概略構成の例を示す図である。変形例に係る撮像装置の概略構成の例を示す図である。車両制御システムの概略的な構成の一例を示すブロック図である。車外情報検出部及び撮像部の設置位置の一例を示す説明図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　以下に示す項目順序に従って本開示を説明する。
　　１．　はじめに
　　２．　実施形態
　　　２．１　撮像装置の構成例
　　　２．２　撮像装置の外観構成例の概要
　　　２．３　ＤＳＰの機能ブロックの例
　　　２．４　オブジェクト検出処理の例
　　　２．５　学習済みモデルの手法の例
　　　２．６　テンプレート画像の生成の例
　　　２．７　検出処理の例
　　３．　変形例
　　４．　効果
　　５．　移動体への応用例

１．　はじめに
　上述のように、従来技術では、背景画像に対して変化した画素であるか否かを示す１ビットの情報のみが画像に結合され、色や形状などのその他の情報がオブジェクト検出に利用されていないため、差分領域の発生の仕方に強く影響を受けた検出結果となる可能性があり、オブジェクトの検出精度を十分に向上することができていなかった。

　また、ニューラルネットワークの生成のために、画像及び差分情報を入力とした学習用データが必要になり、準備に労力がかかる。すなわち、入力画像と差分情報とを結合したデータ形式（例えば、ＲＧＢ画像と差分を表現する１ビットの情報との結合）を入力としているため、ニューラルネット学習時にも差分情報を含むデータが必須となる。ニューラルネットの汎化性能を高めるためには多種多様のデータを用いて学習する必要があるが、多種多様なデータすべてについて差分情報が必要、すなわち連続したフレームが必要となるため、学習データに対する制約が強く、学習用データの準備に労力がかかる。

　本開示の一側面によれば、検出精度を向上することが可能な情報処理装置、情報処理方法及びプログラムが提供される。すなわち、本開示の一側面は、消費電力・計算コストを低減させることを目的に、できるだけ低解像度でかつ広角を撮影した画像を用いて人や物体などのオブジェクト検出を行うことを目的とした認識処理や、センサモジュール上で軽量かつ精度良く認識処理を行うために従来の静止画からオブジェクトを検出する認識器に、時間方向の差分画像の情報を付加情報として利用することで精度向上させることを目的とする。

　例えば、低解像度・広角のシーンでは、検出すべき対象（人等）は、画像の中に非常に小さく写っていたり、広角撮影のために歪んでいたりする可能性があり、それらを一様に認識することは難しい。また、対象と背景のコントラストが小さいシーン、対象者が特異な姿勢のために機械学習ベースのアルゴリズムだけでは検出が難しいシーン、センサモジュール上で実行可能にするために認識器を簡易なものにしている場合など、従来の静止画認識処理だけでは精度が十分に得られないことがある。

　こうした課題に対し、認識器の特徴量抽出後のレイヤに対して差分画像をもとに計算した特徴量マップを四則演算などにより重ね合わせ、その結果を物体認識レイヤに入力することで、静止画の処理だけでは得られない、動体の動き情報を加味することが可能となる。

　この手法では、差分の有無により認識器の入力次元数は変わらず、通常の１チャネル画像(Ｇｒａｙ)や３チャネル画像（ＲＧＢもしくはＹＵＶ等）をそのまま用いた学習が可能であるため、従来の認識器の使い方が可能となり、学習データも特別なものを準備する必要がない。

　また、単なる差分の有無をニューラルネットに入力するのではなく、あるモデルに基づいて差分領域が対象物体らしい形状や色等であるかどうかを評価してから入力するため、差分領域に対する検出精度を高められる。

　さらに、学習時においては、必ずしも差分情報を必要としないため、学習データセットの準備に特別の用意を必要としない。

２．　実施形態
２．１　撮像装置の構成例
　以下、本開示の一実施形態に係る撮像装置について説明する。以下の実施形態では、撮像装置は、カメラなどの電子機器であって、取得された画像データを信号処理する情報処理装置でもある。ただし、撮像装置はそのような電子機器に限定されない。

　図１は、撮像装置の構成例を示すブロック図である。撮像装置２は、撮像ブロック２０及び信号処理ブロック３０を含む。撮像ブロック２０及び信号処理ブロック３０は、接続線ＣＬ１～ＣＬ３によって接続される。

　撮像ブロック２０は、撮像動作を実行することで画像データを生成する。撮像ブロック２０は、撮像部２１、撮像処理部２２、出力制御部２３、出力Ｉ／Ｆ２４及び撮像制御部２５を含む。

　撮像部２１は、二次元に配置された複数の画素を含む。撮像部２１に光学系（不図示）からの光が入射すると、各画素で光電変換が行われ、入射光に対応するアナログの画素信号が出力される。

　撮像処理部２２は、撮像部２１を駆動する。また、撮像処理部２２は、撮像部２１からのアナログの画素信号をディジタルの画素信号に変換し、ディジタルに変換された１フレーム分の画素信号を撮像画像４０として出力する。撮像画像４０は、出力制御部２３に送られるとともに、接続線ＣＬ２を介して信号処理ブロック３０に送られる。撮像画像４０は、動画像における１つのフレームであってよい。

　出力制御部２３は、撮像処理部２２からの撮像画像４０及び／又は信号処理ブロック３０からの信号処理結果６０（後述）を、出力Ｉ／Ｆ２４を介して外部に出力する。

　出力Ｉ／Ｆ２４は、撮像画像４０及び信号処理結果６０を外部に出力するＩ／Ｆである。出力Ｉ／Ｆ２４として、例えばＭＩＰＩ（Mobile　Industry　Processor　Interface）等の比較的高速なＩ／Ｆ等が採用されてよい。

　撮像制御部２５は、通信Ｉ／Ｆ２６及びレジスタ群２７を含む。通信Ｉ／Ｆ２６は、撮像装置２の外部との間で、レジスタ群２７に読み書きする情報等の必要な情報のやり取りを行う。通信Ｉ／Ｆ２６として、例えばＩ２Ｃ（Inter-Integrated　Circuit）等のシリアル通信Ｉ／Ｆ等の第１の通信Ｉ／Ｆが採用されてよい。レジスタ群２７は、撮像部２１による撮像に関する情報、その他の各種情報を記憶する。

　撮像制御部２５は、レジスタ群２７に記憶された撮像情報に従って、撮像処理部２２を制御し、これにより、撮像部２１での画像の撮像を制御する。撮像制御部２５は、接続線ＣＬ１を介して、信号処理ブロック３０のＣＰＵ３１と接続されている。レジスタ群２７に対する情報の読み書きは、ＣＰＵ３１によって行われてよい。

　信号処理ブロック３０は、撮像ブロック２０で得られた撮像画像４０等を用いて、所定の信号処理を行う。信号処理ブロック３０は、ＣＰＵ（Central　Processing　Unit）３１、ＤＳＰ（Digital　Signal　Processor）、メモリ３３、通信Ｉ／Ｆ３４、画像圧縮部３５、入力Ｉ／Ｆ３６及び差分生成部３７を含む。これらの信号処理ブロック３０の構成要素は、相互にバスを介して接続され、必要に応じて情報のやり取りを行う。

　ＣＰＵ３１は、プログラムを実行することにより、ＤＳＰ３２での信号処理により得られる信号処理結果６０を用いて、撮像情報を算出する撮像情報算出部として機能する。ＣＰＵ３１は、算出した撮像情報を、接続線ＣＬ１を介して、撮像制御部２５のレジスタ群２７にフィードバックして記憶させる。

　ＤＳＰ３２は、メモリ３３に記憶されたプログラムを実行することで、撮像処理部２２から、接続線ＣＬ２を介して、信号処理ブロック３０に供給される撮像画像４０、入力Ｉ／Ｆ３６が外部から受け取る情報を用いた信号処理を行う。

　メモリ３３は、ＳＲＡＭ（Static　Random　Access　Memory）、ＤＲＡＭ（Dynamic　RAM）等で構成され、信号処理ブロック３０の処理上必要なプログラム等を記憶する。撮像装置２の動作に必要なプログラム、後述の学習済みモデル３３０及び情報処理プログラム３３５も、メモリ３３に記憶される。

　通信Ｉ／Ｆ３４は、例えば、ＳＰＩ（Serial　Peripheral　Interface）等のシリアル通信Ｉ／Ｆ等の第２の通信Ｉ／Ｆであり、外部との間で、ＣＰＵ３１、ＤＳＰ３２が実行するプログラム等の必要な情報のやりとりを行う。

　画像圧縮部３５には、撮像処理部２２から接続線ＣＬ２を介して、撮像画像４０が供給される。画像圧縮部３５は、撮像画像４０を圧縮する圧縮処理を行い、その撮像画像４０よりもデータ量が少ない圧縮画像を生成する。生成された圧縮画像は、バスに供給される。なお、画像圧縮部３５によって圧縮されない非圧縮画像がバスに供給されてもよい。以下、とくに説明がある場合を除き、圧縮画像及び非圧縮画像をいずれも撮像画像４０と称する。

　入力Ｉ／Ｆ３６は、外部から情報を受け取るＩ／Ｆである。入力Ｉ／Ｆ３６は、例えば、外部のセンサから、その外部のセンサの出力（外部センサ出力）を受け取り、バスを介して、メモリ３３に供給して記憶させる。

　差分生成部３７は、差分画像５０を生成する生成部である。差分画像５０は、撮像画像４０に含まれるオブジェクトの変化を示す画像である。差分画像５０の生成手法は特に限定されない。差分画像５０は撮像画像４０から生成されてよく、この場合、背景差分法、単純差分法等が用いられてよい。先に説明したように撮像画像４０が一つのフレームの場合、他の画像から背景画像を取得したり、他の画像との単純差分画像（フレーム間の単純差分画像等）を取得したりすることができるからである。

　なお、撮像画像４０以外の情報に基づいて差分画像５０が生成されてよく、これについては後に図８を参照して改めて説明する。

　また、差分画像５０は、ＣＰＵ３１又はＤＳＰ３２において生成されてもよい。その場合、図１における差分生成部３７が省略され、撮像処理部２２の出力（撮像画像４０）がバスを介してＣＰＵ３１又はＤＳＰ３２に入力される。

２．２　撮像装置の外観構成例の概要
　図２は、図１の撮像装置２の外観構成例の概要を示す斜視図である。

　撮像装置２は、例えば、図２に示すように、複数のダイが積層された積層構造を有する１チップの半導体装置として構成することができる。

　図２では、撮像装置２は、ダイ５１及び５２の２枚のダイが積層されて構成される。

　図２において、上側のダイ５１には、撮像部２１が搭載され、下側のダイ５２には、撮像処理部２２ないし撮像制御部２５、及び、ＣＰＵ３１ないし差分生成部３７が搭載されている。

　上側のダイ５１と下側のダイ５２とは、例えば、ダイ５１を貫き、ダイ５２にまで到達する貫通孔を形成することにより、又は、ダイ５１の下面側に露出したＣｕ配線と、ダイ５２の上面側に露出したＣｕ配線とを直接接続するＣｕ－Ｃｕ接合を行うこと等により、電気的に接続される。

　ここで、撮像処理部２２において、撮像部２１が出力する画像信号のＡＤ変換を行う方式としては、例えば、列並列ＡＤ方式やエリアＡＤ方式を採用することができる。

　列並列ＡＤ方式では、例えば、撮像部２１を構成する画素の列に対してＡＤＣ(AD　Converter)が設けられ、各列のＡＤＣが、その列の画素の画素信号のＡＤ変換を担当することで、１行の各列の画素の画像信号のＡＤ変換が並列に行われる。列並列ＡＤ方式を採用する場合には、その列並列ＡＤ方式のＡＤ変換を行う撮像処理部２２の一部が、上側のダイ５１に搭載されることがある。

　エリアＡＤ方式では、撮像部２１を構成する画素が、複数のブロックに区分され、各ブロックに対して、ＡＤＣが設けられる。そして、各ブロックのＡＤＣが、そのブロックの画素の画素信号のＡＤ変換を担当することで、複数のブロックの画素の画像信号のＡＤ変換が並列に行われる。エリアＡＤ方式では、ブロックを最小単位として、撮像部２１を構成する画素のうちの必要な画素についてだけ、画像信号のＡＤ変換（読み出し及びＡＤ変換）を行うことができる。

　なお、撮像装置２の面積が大になることが許容されるのであれば、撮像装置２は、１枚のダイで構成することができる。

　また、図２では、２枚のダイ５１及び５２を積層して、１チップの撮像装置２を構成することとしたが、１チップの撮像装置２は、３枚以上のダイを積層して構成することができる。例えば、３枚のダイを積層して、１チップの撮像装置２を構成する場合には、図２のメモリ３３を、別のダイに搭載することができる。

　ここで、センサチップ、メモリチップ、及び、ＤＳＰチップのチップどうしを、複数のバンプで並列に接続した撮像装置（以下、バンプ接続撮像装置ともいう）では、積層構造に構成された１チップの撮像装置２に比較して、厚みが大きく増加し、装置が大型化する。

　さらに、バンプ接続撮像装置では、バンプの接続部分での信号劣化等により、撮像処理部２２から出力制御部２３に撮像画像を出力するレートとして、十分なレートを確保することが困難になることがあり得る。

　積層構造の撮像装置２によれば、以上のような装置の大型化や、撮像処理部２２と出力制御部２３との間のレートとして、十分なレートを確保することができなくなることを防止することができる。

　したがって、積層構造の撮像装置２によれば、ユーザが必要とする情報を出力する撮像装置を小型に構成することを実現することができる。

　ユーザが必要とする情報が、撮像画像である場合には、撮像装置２は、撮像画像を出力することができる。

　また、ユーザが必要とする情報が、撮像画像を用いた信号処理により得られる場合には、撮像装置２は、ＤＳＰ３２において、その信号処理を行うことにより、ユーザが必要とする情報としての信号処理結果を得て出力することができる。

　撮像装置２で行われる信号処理、すなわち、ＤＳＰ３２の信号処理としては、例えば、撮像画像から、所定の認識対象を認識する認識処理を採用することができる。

　また、例えば、撮像装置２は、その撮像装置２と所定の位置関係になるように配置されたＴｏＦ(Time　of　Flight)センサ等の距離センサの出力を、入力Ｉ／Ｆ３６で受け取ることができる。この場合、ＤＳＰ３２の信号処理としては、例えば、入力Ｉ／Ｆ３６で受け取った距離センサの出力から得られる距離画像のノイズを、撮像画像を用いて除去する処理のような、距離センサの出力と撮像画像とを統合して、精度の良い距離を求めるフュージョン処理を採用することができる。

　さらに、例えば、撮像装置２は、その撮像装置２と所定の位置関係になるように配置されたイメージセンサが出力する画像を、入力Ｉ／Ｆ３６で受け取ることができる。この場合、ＤＳＰ３２の信号処理としては、例えば、入力Ｉ／Ｆ３６で受け取った画像と、撮像画像とをステレオ画像として用いた自己位置推定処理(SLAM(Simultaneously　Localization　and　Mapping))を採用することができる。

　以上の構成を備える撮像装置２では、撮像ブロック２０によって取得された撮像画像４０を信号処理ブロック３０で処理し、また、その処理結果である信号処理結果６０を撮像装置２の外部の要素（後述の図ＡＰ等を含む）に出力することができる。本実施形態における信号処理ブロック３０の処理は、撮像画像４０中のオブジェクト検出処理を含む。一実施形態において、オブジェクト検出処理は、ＤＳＰ３２及び差分生成部３７によって実行される。以下では、そのような形態の例を説明する。

２．３　ＤＳＰの機能ブロックの例
　図３は、ＤＳＰ３２の機能ブロックの例を示す図である。ＤＳＰ３２は、入力部３２１と、評価部３２２と、検出部３２３と、出力部３２４とを含む。

　入力部３２１には、撮像画像４０及び差分画像５０が入力される。入力部３２１は、バス（図１）を介して、撮像ブロック２０からの撮像画像４０を取得する。また、入力部３２１は、バスを介して、差分生成部３７からの差分画像５０を取得する。

　評価部３２２は、差分画像５０を評価する。差分画像５０の評価は、例えばテンプレートマッチングを用いて行われる。テンプレートマッチングでは、予め生成された各テンプレート画像と、差分画像５０とのマッチングが行われる。テンプレート画像は、想定されるさまざまなオブジェクトの動作部分の形状を示す画像であってよい。マッチングは、差分画像５０とテンプレート画像とが同一又は類似と判断される場合に成立する。類似の判断は、両画像の相互相関係数などを使用して算出される類似度に基づいて行われてよい。マッチングは、形状に基づいて行われてよいし、色に基づいて行われてもよい。マッチングが成立した差分画像５０は、差分特徴量として評価され、検出部３２３に送られる。

　差分画像５０の評価に先だって、評価部３２２は、差分画像５０に対して２値化処理（differential　binarize）を実行してよい。この場合は、テンプレート画像も同様に２値化処理された画像であり、シルエット形状でのマッチングが行われることになる。２値化処理の他に、モルフォロジー処理、反転処理、確率分布処理、ノイズ低減処理等が実行されてよい。

　検出部３２３は、撮像画像４０中のオブジェクトを検出する。検出部３２３は、入力部３２１に入力された撮像画像４０と差分画像５０とを入力とする学習済みモデル３３０（図１）を用いて、撮像画像４０中のオブジェクトを検出する。学習済みモデル３３０は、撮像画像４０及び差分画像５０に基づいて撮像画像４０中のオブジェクトを検出するように、訓練データを用いて予め生成された学習済みモデルである。学習済みモデル３３０のさらなる詳細については、後に図４を参照して説明する。

　出力部３２４は、検出部３２３の検出結果を出力する。検出結果は、例えば、撮像画像４０及び撮像画像４０中に検出されたオブジェクトの情報を含む。検出結果は、信号処理結果６０（あるいはその一部）として出力される。

２．４　オブジェクト検出処理の例
　図４は、差分生成部３７及びＤＳＰ３２によるオブジェクト検出処理の例を示す図である。この例では、学習済みモデル３３０は、ＣＮＮ（Convolutional　Neural　Network）であり、抽出レイヤ（Feature-extractor）３３１と、検出レイヤ（Object-detection）３３３とを含む。図において、抽出レイヤ３３１と検出レイヤ３３３との接続部分を、ノード３３２と称して概念的に示す。図４には、連続する３つの時系列画像として、順に撮像された撮像画像４０１、撮像画像４０２及び撮像画像４０３が例示される。

　学習済みモデル３３０の抽出レイヤ３３１は、撮像画像４０３から、撮像画像４０３の特徴量を抽出する。抽出レイヤ３３１によって抽出された特徴量は、ノード３３２に送られる。

　一方で、差分生成部３７は、撮像画像４０１、撮像画像４０２及び撮像画像４０３を用いて、差分画像５０を生成する。差分画像５０は、撮像画像４０３における、他の画像（撮像画像４０１及び撮像画像４０２）との差分を示す画像である。評価部３２２は、差分生成部３７によって生成された差分画像５０を評価する。評価部３２２の評価結果（差分特徴量）は、ノード３３２に送られる。

　検出レイヤ３３３は、ノード３３２に送られた抽出レイヤ３３１の抽出結果（撮像画像４０３の特徴量）、及び、評価部３２２の評価結果（撮像画像４０３の差分特徴量）から、撮像画像４０３中のオブジェクトを検出する。ここで、撮像画像４０３の差分特徴量は、新規チャネルとして撮像画像４０３の特徴量と結合され（concatenation）、検出レイヤ３３３に入力されてよい。あるいは、撮像画像４０３の差分特徴量は、撮像画像４０３の特徴量に対する演算処理（四則演算等）によって撮像画像４０３の特徴量に組み込まれたうえで、検出レイヤ３３３に入力されてもよい。いずれの場合も、撮像画像４０３の差分特徴量マップのサイズが、撮像画像４０３の特徴量マップのサイズに適合するように調整されてよい。なお、ここでは抽出レイヤと検出レイヤとが明確にわかれたＣＮＮを例に説明したが、かならずしも抽出レイヤと検出レイヤとがわかれたＣＮＮを用いる必要はない。例えば、１つの機能ブロックから実現されるＣＮＮにおいて、中間レイヤに上記の差分特徴量が結合、あるいは任意の演算処理（四則演算等）によって組み込まれてもよい。

２．５　学習済みモデルの生成の例
　図５は、学習済みモデル３３０の生成の例を示すフローチャートである。このフローチャートの処理は、例えば当業者によって、必要に応じてコンピュータ等の装置を用いて、実行される。

　ステップＳ１において、訓練データを準備する。訓練データの例は、検出の対象となりうる（認識したい）オブジェクト情報と、ラベルとを対応づけた教師データである。オブジェクト情報は、オブジェクトの画像及び差分画像を含む。ラベルは、画像中のオブジェクトを特定するための情報である。

　ステップＳ２において、学習済みモデルのパラメータの学習を行う。具体的に、先のステップＳ１で準備した訓練データを用いて、学習済みモデル３３０のパラメータの学習を行う。学習済みモデル３３０が画像認識用のＣＮＮの場合、パラメータは、ＣＮＮの係数である。訓練データは、異なる組み合わせの教師データからなる複数の訓練データであってよく、この場合、各々が対応する訓練データについて最適化された複数のパラメータが得られる。

　ステップＳ３において、学習済みモデル３３０の性能を確認する。例えば、検証用あるいは評価用のデータを用いて、学習済みモデル３３０によるオブジェクトの検出精度を確認する。先のステップＳ２において複数のパラメータが得られた場合には、各パラメータで構成された学習済みモデル３３０の検出性能をそれぞれ確認する。

　ステップＳ４において、最も性能の良かったパラメータを保存する。すなわち、先のステップＳ３において、各パラメータで構成された学習済みモデル３３０のそれぞれの検出性能を比較し、最も性能の良いパラメータを、学習済みモデル３３０のパラメータとして保存する。

　ステップＳ４の処理が完了した後、フローチャートの処理は終了する。

２．６　テンプレート画像の生成の例
　図６は、テンプレート画像の生成の例を示すフローチャートである。このフローチャートの処理は、例えば当業者によって、必要に応じてコンピュータ等の装置を用いて、実行される。

　ステップＳ１１において、差分画像を取得する。例えば、想定されるさまざまなオブジェクトに関する時系列画像を準備し、それらの時系列画像から差分画像を取得する。

　ステップＳ１２において、先のステップＳ１１において取得した差分画像に対して、２値化処理を実行する。この他に、モルフォロジー処理、反転処理、確率分布処理、ノイズ低減処理等を実行してもよい。

　ステップＳ１３において、先のステップＳ１２で２値化処理を実行した画像を用いて、テンプレート画像を作成する。なお、同じオブジェクトの同じ部分についての複数の画像が存在する場合には、それらの統計値（平均値など）を用いてテンプレート画像を生成してもよい。

　ステップＳ１３の処理が完了した後、フローチャートの処理は終了する。

２．７　検出処理の例
　図７は、検出処理の例を示すフローチャートである。検出処理は、ＤＳＰ３２がメモリ３３に記憶された情報処理プログラム３３５(図１)を実行することによって行われる。

　ステップＳ２１において、入力画像を取得する。すなわち、撮像画像４０が、入力部３２１に入力される。

　ステップＳ２１の処理が完了した後は、ステップＳ２２～Ｓ２５の処理と、ステップＳ２６の処理とが並列に実行される。

　ステップＳ２２において、差分画像を取得する。すなわち、差分画像５０が、入力部３２１に入力される。

　ステップＳ２３において、２値化処理を実行する。すなわち、評価部３２２が、先のステップＳ２２で入力された差分画像５０を２値化する。２値化処理の他に、モルフォロジー処理、反転処理、確率分布処理、ノイズ低減処理等が実行されてもよい。

　ステップＳ２４において、テンプレートとのマッチングを行う。すなわち、評価部３２２が、先のステップＳ２３において２値化処理が実行された差分画像５０と、先に図６を参照して説明したように作成されたテンプレート画像とのマッチングを行う。マッチングが成立した差分画像５０が、評価結果（差分特徴量）として得られる。

　ステップＳ２５において、差分特徴量マップのサイズを調整する。具体的に、検出部３２３が、先のステップＳ２４において評価結果（差分特徴量）として得られた差分画像５０のマップサイズを、撮像画像４０のマップサイズに適合するよう調整する。ステップＳ２５の処理の完了後、ステップＳ２７に処理が進められる。

　ステップＳ２６において、特徴量を抽出する。具体的に、学習済みモデル３３０の抽出レイヤ３３１が、先のステップＳ３１で取得された撮像画像４０の特徴量を抽出する。ステップＳ２６の処理の完了後、ステップＳ２７に処理が進められる。

　ステップＳ２７において、特徴量マップをマージする。具体的に、検出部３２３が、先のステップＳ２５で調整された差分特徴量マップと、先のステップＳ２６で取得された特徴量マップとを結合する。

　ステップＳ２８において、オブジェクトを検出する。具体的に、検出レイヤ３３３が、先のステップＳ２１で取得された撮像画像４０と、先のステップＳ２７でマージされた特徴量マップ（すなわち、撮像画像４０の特徴量及び差分特徴量）とを用いて、撮像画像４０中のオブジェクトを検出する。

　ステップＳ２８の処理の完了後、フローチャートの処理は終了する。

　以上、本開示の実施形態について説明したが、本開示の実施形態は上述の例に限定されない。

３．　変形例
　図８は、変形例に係る撮像装置の構成例を示すブロック図である。図８に示す撮像装置２Ａは、撮像装置２（図１）と比較して、差分生成部３７に代えて、差分生成部３７Ａ１及び差分生成部３７Ａ２を備える点において相違する。ただし、差分生成部３７Ａ２は省略されてもよい。

　差分生成部３７Ａ１は、例えば、ＤＶＳ（Dynamic　Vision　Sensor）であり、撮像部２１の撮像対象、すなわち撮像画像４０における変化（例えば輝度差分情報）を検出する。このような差分生成部３７Ａ１の検出結果も、差分画像５０の一態様である。差分画像５０は、入力Ｉ／Ｆ３６を介して信号処理ブロック３０に供給される。差分画像５０は、入力Ｉ／Ｆ３６から直接的にバスに供給されてもよいし、差分生成部３７Ａ２がある場合には差分生成部３７Ａ２を介してバスに供給されてもよい。

　差分生成部３７Ａ２は、例えば、差分生成部３７Ａ１から出力された差分画像５０におけるフリッカ成分や暗電流等に起因したノイズを除去する。

　このように、差分生成部３７Ａ１を用いることによっても、差分画像５０を生成することができる。ＤＶＳである差分生成部３７Ａ１によれば、ただちに差分画像５０が得られるので、差分生成部３７（図１）のように撮像画像４０から差分画像５０を生成する処理が省略できる。また、差分画像５０を生成するための時系列画像（複数フレームの撮像情報）を保持する必要もない。

　図９は、別の変形例に係る撮像装置の構成例を示すブロック図である。図９に示す撮像装置２Ｂは、撮像装置２（図１）と比較して、撮像ブロック２０及び信号処理ブロック３０に代えて、撮像ブロック２０Ｂ及び信号処理ブロック３０Ｂを備える点において相違する。具体的に、撮像装置２Ｂは、信号処理ブロック３０Ｂではなく、撮像ブロック２０Ｂの撮像制御部２５Ｂ内に差分生成部３７を備える。差分生成部３７は撮像制御部２５Ｂに送られる撮像画像４０を用いて差分画像５０を生成する。生成された差分画像５０は、接続線ＣＬ１を介して、ＣＰＵ３１ひいてはＤＳＰ３２に送られる。

　上記実施形態では、撮像画像４０中のオブジェクト検出処理が、撮像装置内で実行される例について説明した。この場合、撮像装置においてすべての処理を行い、その結果のみを後段、すなわち撮像装置の外部（アプリケーションプロセッサ（Application　Processor：ＡＰ）等を含む）に送ることで、後段での処理負荷が軽くなるというメリットがある。送られる情報量が少ないので、低速ＩＦで良く、また、ＡＰ側でＩＳＰを起動する必要がなく、ＮＰＵ（Neural　network　Processing　Unit）などに直接入力できるというメリットもある。ただし、オブジェクト検出処理の一部が撮像装置２の外部で実行されてもよい。

　例えば、学習済みモデルの一部が撮像装置の外部（後段）に設けられた構成とすることもできる。図１０は、そのような変形例に係る撮像装置の概略構成の例を示す図である。図１０に示す撮像装置２Ｃでは、メモリ３３Ｃに記憶された学習済みモデル３３０Ｃ及び情報処理プログラム３３５Ｃによって、先に説明した抽出レイヤ３３１による抽出及び評価部３２２による評価が、撮像装置２Ｃ内で実行される。抽出レイヤ３３１による抽出結果及び評価部３２２による評価結果等は、信号処理結果６０として、出力Ｉ／Ｆ２４を介して、アプリケーションプロセッサ７０Ｃに送られる。撮像装置２Ｃは、検出レイヤ３３３に相当する構成を、アプリケーションプロセッサ７０Ｃ内に備えている。アプリケーションプロセッサ７０Ｃは、例えば、ＣＰＵ（Central　Processing　Unit）等を用いて構成され、オペレーティングシステムや各種アプリケーションソフトウエア等を実行する。このアプリケーションプロセッサ７０Ｃには、ＧＰＵ（Graphics　Processing　Unit）やベースバンドプロセッサなどの機能が搭載されていてもよい。アプリケーションプロセッサ７０Ｃは、撮像画像中のオブジェクト検出の他、画像データや機械学習結果に対し必要に応じた種々処理を実行したり、ユーザへの表示を実行したり、所定のネットワーク８０を介して外部のクラウドサーバ９０へ送信したりする。

　なお、ネットワーク８０には、例えば、インターネットや、有線ＬＡＮ（Local　Area　Network）又は無線ＬＡＮや、移動体通信網や、Ｂｌｕｅｔｏｏｔｈ（登録商標）など、種々のネットワークを適用することができる。また、画像データや機械学習結果の送信先は、クラウドサーバ９０に限定されず、単一で動作するサーバや、各種データを保管するファイルサーバや、携帯電話機等の通信端末など、通信機能を有する種々の情報処理装置（システム）であってよい。

　撮像装置２Ｃの構成によれば、アプリケーションプロセッサ７０Ｃにおいて特徴量を使って各種ユースケースに合わせた認識処理ができるので、汎用性が高まる。

　また、例えば、すべてのオブジェクト認識処理が撮像装置２の後段で実行されてよい。図１１は、そのような変形例に係る撮像装置の概略構成を示す図である。図１１に示す撮像装置２Ｄは、撮像装置２（図１）と比較して、信号処理ブロック３０に代えて信号処理ブロック３０Ｄを備える点において相違する。信号処理ブロック３０Ｄは、差分生成部３７を備えておらず、また、メモリ３３Ｄ内に学習済みモデル３３０及び情報処理プログラム３３５（図１）を有してもいない。撮像装置２Ｄは、差分生成部３７、学習済みモデル３３０及び情報処理プログラム３３５に対応する構成を、アプリケーションプロセッサ７０Ｄ内に備えている。すなわち撮像装置２Ｄにおいては、すべてのオブジェクト認識処理がアプリケーションプロセッサ７０Ｄで実行される。この場合、オブジェクト検出処理を実行するように構成された専用の撮像装置（あるいはＤＳＰ）は不要であり、汎用の撮像装置とアプリケーションプロセッサとを組み合わせることによって、オブジェクト検出処理が実現できる。

４．　効果
　以上説明した撮像装置（情報処理装置の一態様）は、例えば次のように特定される。すなわち、図１～図４に例示するように、撮像装置２は、検出部３２３を備える。検出部３２３は、撮像画像４０と撮像画像４０に含まれるオブジェクトの変化を示す差分画像５０とを入力とする学習済みモデル３３０を用いて、撮像画像４０中のオブジェクトを検出する。学習済みモデル３３０は、抽出レイヤ３３１と、検出レイヤ３３３とを含む。抽出レイヤ３３１は、撮像画像４０の特徴量を抽出する。検出レイヤ３３３は、入力部３２１の抽出結果、及び、差分画像５０に基づいて、撮像画像４０中のオブジェクトを検出する。

　上記撮像装置２によれば、撮像画像４０の特徴量だけでなく、差分画像５０にも基づいて、撮像画像４０中のオブジェクトが検出される。したがって、オブジェクトの検出精度を向上させることが可能になる。

　図４に例示されるように、撮像装置２は、評価部３２２をさらに備えてよい。評価部３２２は、差分画像５０を評価する。検出レイヤ３３３は抽出レイヤ３３１の抽出結果、及び、評価部３２２の評価結果に基づいて、撮像画像４０中のオブジェクトを検出してよい。このように差分画像５０の評価結果を用いることにより、オブジェクトの検出精度を向上させることができる。

　評価部３２２は、差分画像５０の形状を評価してよい。差分画像５０の形状の評価結果を用いることにより、オブジェクトの検出精度を向上させることができる。

　評価部３２２は、差分画像５０の色を評価してよい。差分画像５０の色の評価結果を用いることにより、オブジェクトの検出精度を向上させることができる。

　評価部３２２は、テンプレートマッチングを行うことにより、差分画像５０を評価してよい。例えばこのように差分画像５０を評価することによって、オブジェクトの検出精度を向上させることができる。

　撮像装置２は、差分生成部３７をさらに備えてよい。差分生成部３７は、差分画像５０を生成する生成部である。これにより、撮像装置２において差分画像５０を生成することができる。

　差分生成部３７は、背景差分法を用いて差分画像５０を生成してよい。例えばこのようにして、差分画像５０を生成することができる。

　差分生成部３７は、単純差分法を用いて差分画像５０を生成してよい。例えばこのようにして、差分画像５０を生成することができる。

　差分生成部３７は、ＤＶＳ（Dynamic　Vision　Sensor）であってよい。ＤＶＳによってただちに差分画像５０を得ることで、例えば撮像画像４０から差分画像５０を生成する処理を省略することができる。また、差分画像５０を生成するための時系列画像（複数フレームの撮像情報）の保持を不要とすることができる。

　撮像装置２は、撮像ブロック２０をさらに備えてよい。撮像ブロック２０は、撮像画像４０を取得する撮像部である。これにより、撮像装置２において撮像画像４０を取得することができる。

　例えば図７に示す情報処理方法も、本開示の一態様である。すなわち、情報処理方法は、撮像画像４０と撮像画像４０に含まれるオブジェクトの変化を示す差分画像５０とを入力とする学習済みモデル３３０を用いて、撮像画像４０中の前記オブジェクトを検出すること（ステップＳ２８）を含む。学習済みモデル３３０は、撮像画像４０の特徴量を抽出する抽出レイヤ３３１と、抽出レイヤ３３１の抽出結果、及び、差分画像５０に基づいて、撮像画像４０中のオブジェクトを検出する検出レイヤ３３３と、を含む。このような情報処理方法によっても、これまで説明した情報処理装置と同様に、オブジェクトの検出精度を向上させることが可能になる。

　例えば図１に示す情報処理プログラム３３５も、本開示の一態様である。すなわち、情報処理プログラム３３５は、コンピュータを機能させるためのプログラムである。図７に例示するように、プログラムは、撮像画像４０と撮像画像４０に含まれるオブジェクトの変化を示す差分画像５０とを入力する学習済みモデル３３０とを用いて、撮像画像４０中のオブジェクトを検出する工程（ステップＳ２８）を、コンピュータに実行させる。学習済みモデル３３０は、撮像画像４０の特徴量を抽出する抽出レイヤ３３１と、抽出レイヤ３３１の抽出結果、及び、差分画像５０に基づいて、撮像画像４０中のオブジェクトを検出する検出レイヤ３３３と、を含む。このようなプログラムによっても、これまで説明した情報処理装置と同様に、オブジェクトの検出精度を向上させることが可能になる。

５．　移動体への応用例
　本開示に係る技術（本技術）は、様々な製品へ応用することができる。例えば、本開示に係る技術は、自動車、電気自動車、ハイブリッド電気自動車、自動二輪車、自転車、パーソナルモビリティ、飛行機、ドローン、船舶、ロボット等のいずれかの種類の移動体に搭載される装置として実現されてもよい。

　図１２は、本開示に係る技術が適用され得る移動体制御システムの一例である車両制御システムの概略的な構成例を示すブロック図である。

　車両制御システム１２０００は、通信ネットワーク１２００１を介して接続された複数の電子制御ユニットを備える。図１２に示した例では、車両制御システム１２０００は、駆動系制御ユニット１２０１０、ボディ系制御ユニット１２０２０、車外情報検出ユニット１２０３０、車内情報検出ユニット１２０４０、及び統合制御ユニット１２０５０を備える。また、統合制御ユニット１２０５０の機能構成として、マイクロコンピュータ１２０５１、音声画像出力部１２０５２、及び車載ネットワークＩ／Ｆ（Interface）１２０５３が図示されている。

　駆動系制御ユニット１２０１０は、各種プログラムにしたがって車両の駆動系に関連する装置の動作を制御する。例えば、駆動系制御ユニット１２０１０は、内燃機関又は駆動用モータ等の車両の駆動力を発生させるための駆動力発生装置、駆動力を車輪に伝達するための駆動力伝達機構、車両の舵角を調節するステアリング機構、及び、車両の制動力を発生させる制動装置等の制御装置として機能する。

　ボディ系制御ユニット１２０２０は、各種プログラムにしたがって車体に装備された各種装置の動作を制御する。例えば、ボディ系制御ユニット１２０２０は、キーレスエントリシステム、スマートキーシステム、パワーウィンドウ装置、あるいは、ヘッドランプ、バックランプ、ブレーキランプ、ウィンカー又はフォグランプ等の各種ランプの制御装置として機能する。この場合、ボディ系制御ユニット１２０２０には、鍵を代替する携帯機から発信される電波又は各種スイッチの信号が入力され得る。ボディ系制御ユニット１２０２０は、これらの電波又は信号の入力を受け付け、車両のドアロック装置、パワーウィンドウ装置、ランプ等を制御する。

　車外情報検出ユニット１２０３０は、車両制御システム１２０００を搭載した車両の外部の情報を検出する。例えば、車外情報検出ユニット１２０３０には、撮像部１２０３１が接続される。車外情報検出ユニット１２０３０は、撮像部１２０３１に車外の画像を撮像させるとともに、撮像された画像を受信する。車外情報検出ユニット１２０３０は、受信した画像に基づいて、人、車、障害物、標識又は路面上の文字等の物体検出処理又は距離検出処理を行ってもよい。

　撮像部１２０３１は、光を受光し、その光の受光量に応じた電気信号を出力する光センサである。撮像部１２０３１は、電気信号を画像として出力することもできるし、測距の情報として出力することもできる。また、撮像部１２０３１が受光する光は、可視光であっても良いし、赤外線等の非可視光であっても良い。

　車内情報検出ユニット１２０４０は、車内の情報を検出する。車内情報検出ユニット１２０４０には、例えば、運転者の状態を検出する運転者状態検出部１２０４１が接続される。運転者状態検出部１２０４１は、例えば運転者を撮像するカメラを含み、車内情報検出ユニット１２０４０は、運転者状態検出部１２０４１から入力される検出情報に基づいて、運転者の疲労度合い又は集中度合いを算出してもよいし、運転者が居眠りをしていないかを判別してもよい。

　マイクロコンピュータ１２０５１は、車外情報検出ユニット１２０３０又は車内情報検出ユニット１２０４０で取得される車内外の情報に基づいて、駆動力発生装置、ステアリング機構又は制動装置の制御目標値を演算し、駆動系制御ユニット１２０１０に対して制御指令を出力することができる。例えば、マイクロコンピュータ１２０５１は、車両の衝突回避あるいは衝撃緩和、車間距離に基づく追従走行、車速維持走行、車両の衝突警告、又は車両のレーン逸脱警告等を含むＡＤＡＳ（Advanced　Driver　Assistance　System）の機能実現を目的とした協調制御を行うことができる。

　また、マイクロコンピュータ１２０５１は、車外情報検出ユニット１２０３０又は車内情報検出ユニット１２０４０で取得される車両の周囲の情報に基づいて駆動力発生装置、ステアリング機構又は制動装置等を制御することにより、運転者の操作に拠らずに自律的に走行する自動運転等を目的とした協調制御を行うことができる。

　また、マイクロコンピュータ１２０５１は、車外情報検出ユニット１２０３０で取得される車外の情報に基づいて、ボディ系制御ユニット１２０３０に対して制御指令を出力することができる。例えば、マイクロコンピュータ１２０５１は、車外情報検出ユニット１２０３０で検知した先行車又は対向車の位置に応じてヘッドランプを制御し、ハイビームをロービームに切り替える等の防眩を図ることを目的とした協調制御を行うことができる。

　音声画像出力部１２０５２は、車両の搭乗者又は車外に対して、視覚的又は聴覚的に情報を通知することが可能な出力装置へ音声及び画像のうちの少なくとも一方の出力信号を送信する。図１２の例では、出力装置として、オーディオスピーカ１２０６１、表示部１２０６２及びインストルメントパネル１２０６３が例示されている。表示部１２０６２は、例えば、オンボードディスプレイ及びヘッドアップディスプレイの少なくとも一つを含んでいてもよい。

　図１３は、撮像部１２０３１の設置位置の例を示す図である。

　図１３では、撮像部１２０３１として、撮像部１２１０１、１２１０２、１２１０３、１２１０４、１２１０５を有する。

　撮像部１２１０１、１２１０２、１２１０３、１２１０４、１２１０５は、例えば、車両１２１００のフロントノーズ、サイドミラー、リアバンパ、バックドア及び車室内のフロントガラスの上部等の位置に設けられる。フロントノーズに備えられる撮像部１２１０１及び車室内のフロントガラスの上部に備えられる撮像部１２１０５は、主として車両１２１００の前方の画像を取得する。サイドミラーに備えられる撮像部１２１０２、１２１０３は、主として車両１２１００の側方の画像を取得する。リアバンパ又はバックドアに備えられる撮像部１２１０４は、主として車両１２１００の後方の画像を取得する。車室内のフロントガラスの上部に備えられる撮像部１２１０５は、主として先行車両又は、歩行者、障害物、信号機、交通標識又は車線等の検出に用いられる。

　なお、図１３には、撮像部１２１０１ないし１２１０４の撮影範囲の一例が示されている。撮像範囲１２１１１は、フロントノーズに設けられた撮像部１２１０１の撮像範囲を示し、撮像範囲１２１１２，１２１１３は、それぞれサイドミラーに設けられた撮像部１２１０２，１２１０３の撮像範囲を示し、撮像範囲１２１１４は、リアバンパ又はバックドアに設けられた撮像部１２１０４の撮像範囲を示す。例えば、撮像部１２１０１ないし１２１０４で撮像された画像データが重ね合わせられることにより、車両１２１００を上方から見た俯瞰画像が得られる。

　撮像部１２１０１ないし１２１０４の少なくとも１つは、距離情報を取得する機能を有していてもよい。例えば、撮像部１２１０１ないし１２１０４の少なくとも１つは、複数の撮像素子からなるステレオカメラであってもよいし、位相差検出用の画素を有する撮像素子であってもよい。

　例えば、マイクロコンピュータ１２０５１は、撮像部１２１０１ないし１２１０４から得られた距離情報を基に、撮像範囲１２１１１ないし１２１１４内における各立体物までの距離と、この距離の時間的変化（車両１２１００に対する相対速度）を求めることにより、特に車両１２１００の進行路上にある最も近い立体物で、車両１２１００と略同じ方向に所定の速度（例えば、０km/h以上）で走行する立体物を先行車として抽出することができる。さらに、マイクロコンピュータ１２０５１は、先行車の手前に予め確保すべき車間距離を設定し、自動ブレーキ制御（追従停止制御も含む）や自動加速制御（追従発進制御も含む）等を行うことができる。このように運転者の操作に拠らずに自律的に走行する自動運転等を目的とした協調制御を行うことができる。

　例えば、マイクロコンピュータ１２０５１は、撮像部１２１０１ないし１２１０４から得られた距離情報を元に、立体物に関する立体物データを、２輪車、普通車両、大型車両、歩行者、電柱等その他の立体物に分類して抽出し、障害物の自動回避に用いることができる。例えば、マイクロコンピュータ１２０５１は、車両１２１００の周辺の障害物を、車両１２１００のドライバが視認可能な障害物と視認困難な障害物とに識別する。そして、マイクロコンピュータ１２０５１は、各障害物との衝突の危険度を示す衝突リスクを判断し、衝突リスクが設定値以上で衝突可能性がある状況であるときには、オーディオスピーカ１２０６１や表示部１２０６２を介してドライバに警報を出力することや、駆動系制御ユニット１２０１０を介して強制減速や回避操舵を行うことで、衝突回避のための運転支援を行うことができる。

　撮像部１２１０１ないし１２１０４の少なくとも１つは、赤外線を検出する赤外線カメラであってもよい。例えば、マイクロコンピュータ１２０５１は、撮像部１２１０１ないし１２１０４の撮像画像中に歩行者が存在するか否かを判定することで歩行者を認識することができる。かかる歩行者の認識は、例えば赤外線カメラとしての撮像部１２１０１ないし１２１０４の撮像画像における特徴点を抽出する手順と、物体の輪郭を示す一連の特徴点にパターンマッチング処理を行って歩行者か否かを判別する手順によって行われる。マイクロコンピュータ１２０５１が、撮像部１２１０１ないし１２１０４の撮像画像中に歩行者が存在すると判定し、歩行者を認識すると、音声画像出力部１２０５２は、当該認識された歩行者に強調のための方形輪郭線を重畳表示するように、表示部１２０６２を制御する。また、音声画像出力部１２０５２は、歩行者を示すアイコン等を所望の位置に表示するように表示部１２０６２を制御してもよい。

　以上、本開示に係る技術が適用され得る車両制御システムの一例について説明した。本開示に係る技術は、以上説明した構成のうち、撮像部１２０３１に適用され得る。撮像部１２０３１に本開示に係る技術を適用することにより、より見やすい撮像画像を得ることができるため、ドライバの疲労を軽減することが可能になる。

　なお、本開示に記載された効果は、あくまで例示であって、開示された内容に限定されない。他の効果があってもよい。

　以上、本開示の実施形態について説明したが、本開示の技術的範囲は、上述の実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

　また、本明細書に記載された各実施形態における効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　画像と前記画像に含まれるオブジェクトの変化を示す差分画像とを入力とする学習済みモデルを用いて、前記画像中の前記オブジェクトを検出する検出部を備え、
　前記学習済みモデルは、
　　前記画像の特徴量を抽出する抽出レイヤと、
　　前記抽出レイヤの抽出結果、及び、前記差分画像に基づいて、前記画像中の前記オブジェクトを検出する検出レイヤと、
　を含む、
　情報処理装置。
（２）
　前記差分画像を評価する評価部をさらに備え、
　前記検出レイヤは、前記抽出レイヤの抽出結果、及び、前記評価部の評価結果に基づいて、前記画像中のオブジェクトを検出する、
　（１）に記載の情報処理装置。
（３）
　前記評価部は、前記差分画像の形状を評価する、
　（２）に記載の情報処理装置。
（４）
　前記評価部は、前記差分画像の色を評価する、
　（２）又は（３）に記載の情報処理装置。
（５）
　前記評価部は、テンプレートマッチングを行うことにより、前記差分画像を評価する、
　（２）～（４）のいずれかに記載の情報処理装置。
（６）
　前記差分画像を生成する生成部をさらに備える、
　（１）～（５）のいずれかに記載の情報処理装置。
（７）
　前記生成部は、背景差分法を用いて前記差分画像を生成する、
　（６）に記載の情報処理装置。
（８）
　前記生成部は、単純差分法を用いて前記差分画像を生成する、
　（６）に記載の情報処理装置。
（９）
　前記生成部は、ＤＶＳ（Dynamic　Vision　Sensor）である、
　（６）に記載の情報処理装置。
（１０）
　前記画像を取得する撮像部をさらに備える、
　（１）～（９）のいずれかに記載の情報処理装置。
（１１）
　画像と前記画像に含まれるオブジェクトの変化を示す差分画像とを入力とする学習済みモデルを用いて、前記画像中の前記オブジェクトを検出することを含み、
　前記学習済みモデルは、
　　前記画像の特徴量を抽出する抽出レイヤと、
　　前記抽出レイヤの抽出結果、及び、差分画像に基づいて、前記画像中の前記オブジェクトを検出する検出レイヤと、
　を含む、
　情報処理方法。
（１２）
　コンピュータを機能させるためのプログラムであって、
　画像と前記画像に含まれるオブジェクトの変化を示す差分画像とを入力とする学習済みモデルとを用いて、前記画像中の前記オブジェクトを検出する工程、
　を前記コンピュータに実行させ、
　前記学習済みモデルは、
　　画像の特徴量を抽出する抽出レイヤと、
　　前記抽出レイヤの抽出結果、及び、差分画像に基づいて、前記画像中の前記オブジェクトを検出する検出レイヤと、
　を含む、
　プログラム。

　　２　撮像装置
　２０　撮像ブロック
　２１　撮像部
　２２　撮像処理部
　２３　出力制御部
　２４　出力Ｉ／Ｆ
　２５　撮像制御部
　２６　通信Ｉ／Ｆ
　２７　レジスタ群
　３０　信号処理ブロック
　３１　ＣＰＵ
　３２　ＤＳＰ
　３３　メモリ
　３４　通信Ｉ／Ｆ
　３５　画像圧縮部
　３６　入力Ｉ／Ｆ
　３７　差分生成部
　４０　撮像画像
　５０　差分画像
　５１　ダイ
　５２　ダイ
　６０　信号処理結果
　７０　アプリケーションプロセッサ
　８０　ネットワーク
　９０　クラウドサーバ
３３０　学習済みモデル
３３１　抽出レイヤ
３３２　ノード
３３３　検出レイヤ
３３５　情報処理プログラム

Claims

　画像と前記画像に含まれるオブジェクトの変化を示す差分画像とを入力とする学習済みモデルを用いて、前記画像中の前記オブジェクトを検出する検出部を備え、
　前記学習済みモデルは、
　　前記画像の特徴量を抽出する抽出レイヤと、
　　前記抽出レイヤの抽出結果、及び、前記差分画像に基づいて、前記画像中の前記オブジェクトを検出する検出レイヤと、
　を含む、
　情報処理装置。
　前記差分画像を評価する評価部をさらに備え、
　前記検出レイヤは、前記抽出レイヤの抽出結果、及び、前記評価部の評価結果に基づいて、前記画像中のオブジェクトを検出する、
　請求項１に記載の情報処理装置。
　前記評価部は、前記差分画像の形状を評価する、
　請求項２に記載の情報処理装置。
　前記評価部は、前記差分画像の色を評価する、
　請求項２に記載の情報処理装置。
　前記評価部は、テンプレートマッチングを行うことにより、前記差分画像を評価する、
　請求項２に記載の情報処理装置。
　前記差分画像を生成する生成部をさらに備える、
　請求項１に記載の情報処理装置。
　前記生成部は、背景差分法を用いて前記差分画像を生成する、
　請求項６に記載の情報処理装置。
　前記生成部は、単純差分法を用いて前記差分画像を生成する、
　請求項６に記載の情報処理装置。
　前記生成部は、ＤＶＳ（Dynamic　Vision　Sensor）である、
　請求項６に記載の情報処理装置。
　前記画像を取得する撮像部をさらに備える、
　請求項１に記載の情報処理装置。
　画像と前記画像に含まれるオブジェクトの変化を示す差分画像とを入力とする学習済みモデルを用いて、前記画像中の前記オブジェクトを検出することを含み、
　前記学習済みモデルは、
　　前記画像の特徴量を抽出する抽出レイヤと、
　　前記抽出レイヤの抽出結果、及び、差分画像に基づいて、前記画像中の前記オブジェクトを検出する検出レイヤと、
　を含む、
　情報処理方法。
　コンピュータを機能させるためのプログラムであって、
　画像と前記画像に含まれるオブジェクトの変化を示す差分画像とを入力とする学習済みモデルとを用いて、前記画像中の前記オブジェクトを検出する工程、
　を前記コンピュータに実行させ、
　前記学習済みモデルは、
　　画像の特徴量を抽出する抽出レイヤと、
　　前記抽出レイヤの抽出結果、及び、差分画像に基づいて、前記画像中の前記オブジェクトを検出する検出レイヤと、
　を含む、
　プログラム。