WO2023095666A1

WO2023095666A1 - 信号処理装置および信号処理方法、並びに固体撮像素子

Info

Publication number: WO2023095666A1
Application number: PCT/JP2022/042321
Authority: WO
Inventors: 清剛花田
Original assignee: ソニーセミコンダクタソリューションズ株式会社
Priority date: 2021-11-29
Filing date: 2022-11-15
Publication date: 2023-06-01

Abstract

本開示は、より信号処理能力の向上を図ることができるようにする信号処理装置および信号処理方法、並びに固体撮像素子に関する。信号処理装置は、チャネル数に応じた個数の第１の演算器を有し、それぞれの第１の演算器において入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによってチャネル数分の積和演算結果を取得する積和演算処理部と、フィルタ数に応じた個数の第２の演算器を有し、それぞれの第２の演算器において積和演算結果を用いた畳み込み演算処理を行うことによってフィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理を行う畳み込み演算処理部とを備える。本技術は、例えば、積層型のCMOSイメージセンサに適用できる。

Description

信号処理装置および信号処理方法、並びに固体撮像素子

　本開示は、信号処理装置および信号処理方法、並びに固体撮像素子に関し、特に、より信号処理能力の向上を図ることができるようにした信号処理装置および信号処理方法、並びに固体撮像素子に関する。

　近年、CMOS（Complementary Metal Oxide Semiconductor）イメージセンサなどの固体撮像素子の高機能化が進んでおり、例えば、撮像された画像の画素データに対して畳み込み演算を施してエンコード済みの画素データを出力することができる。

　例えば、特許文献１には、畳み込みデータを抽出するプロセス中に、複数のデータ処理ユニットにより、複数の畳み込みウィンドウ内の画像データを並行して抽出する技術が開示されている。

特開２０２１－２２３６２号公報

　ところで、上述したような畳み込み演算を施す信号処理について、さらなる信号処理能力の向上が求められている。

　本開示は、このような状況に鑑みてなされたものであり、より信号処理能力の向上を図ることができるようにするものである。

　本開示の一側面の信号処理装置は、チャネル数に応じた個数の第１の演算器を有し、それぞれの前記第１の演算器において入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによって前記チャネル数分の積和演算結果を取得する積和演算処理部と、フィルタ数に応じた個数の第２の演算器を有し、それぞれの前記第２の演算器において前記積和演算結果を用いた畳み込み演算処理を行うことによって前記フィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理を行う畳み込み演算処理部とを備える。

　本開示の一側面の信号処理方法は、チャネル数に応じた個数の第１の演算器を有する積和演算処理部と、フィルタ数に応じた個数の第２の演算器を有する畳み込み演算処理部とを備える信号処理装置が、それぞれの前記第１の演算器において入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによって前記チャネル数分の積和演算結果を取得することと、それぞれの前記第２の演算器において前記積和演算結果を用いた畳み込み演算処理を行うことによって前記フィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理を行うこととを含む。

　本開示の一側面の固体撮像素子は、チャネル数に応じた個数の第１の演算器を有し、それぞれの前記第１の演算器において入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによって前記チャネル数分の積和演算結果を取得する積和演算処理部と、フィルタ数に応じた個数の第２の演算器を有し、それぞれの前記第２の演算器において前記積和演算結果を用いた畳み込み演算処理を行うことによって前記フィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理を行う畳み込み演算処理部とを有する信号処理部を備える。

　本開示の一側面においては、チャネル数に応じた個数の第１の演算器それぞれにおいて入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによってチャネル数分の積和演算結果が取得され、フィルタ数に応じた個数の第２の演算器それぞれにおいて積和演算結果を用いた畳み込み演算処理を行うことによってフィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理が行われる。

本技術を適用した撮像素子の一実施の形態の構成例を示すブロック図である。画素信号に対する処理について説明する図である。記憶部およびエンコード部の構成例を説明するブロック図である。演算器の構成例を示すブロック図である。演算器の構成例を示すブロック図である。並列積和演算について説明する図である。畳み込み演算で用いられる演算式の一例を示す図である。３つのフィルタを用いて行われる畳み込み演算処理について説明する図である。第１の演算処理について説明する図である。第２の演算処理について説明する図である。入力画像の転送方法について説明する図である。畳み込み演算処理の第１の処理例を説明するフローチャートである。畳み込み演算処理の第２の処理例を説明するフローチャートである。積層型の撮像素子の構成例について説明する。撮像装置の構成例を示すブロック図である。イメージセンサを使用する使用例を示す図である。

　以下、本技術を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。

　＜撮像素子の構成例＞
　図１は、本技術を適用した撮像素子の一実施の形態の構成例を示すブロック図である。

　図１に示すように、撮像素子１１は、撮像部２１、撮像処理部２２、記憶部２３、DMA処理部２４、エンコード部２５、送信部２６、受信部２７、および制御部２８が、バスを介して接続されて構成される。

　撮像部２１は、複数の画素がセンサ面に行列状に配置されて構成され、それぞれの画素が受光した光の光量に応じた画素信号を撮像処理部２２に供給する。

　撮像処理部２２は、撮像部２１から供給される画素信号に対して、例えば、デモザイク処理などの撮像処理を施し、その撮像処理の結果として得られる画素データを記憶部２３に供給する。

　記憶部２３は、例えば、DRAM（Dynamic Random Access Memory）などにより構成され、撮像処理部２２から供給される画素データを記憶する。

　DMA（Direct Memory Access）処理部２４は、記憶部２３からエンコード部２５へ直接的に画素データを転送する際のメモリアクセスに関する処理を実行する。

　エンコード部２５は、DMA処理部２４によるメモリアクセスに従って記憶部２３から転送されてくる画素データに対する畳み込み演算処理を行うことで、撮像部２１により撮像された画像をエンコードする。そして、エンコード部２５は、エンコード済みの画素データを記憶部２３に記憶させる。なお、エンコード部２５の詳細な構成については、図３を参照して後述する。

　送信部２６は、エンコード済みの画素データを記憶部２３から読み出して、撮像素子１１の外部（例えば、記録媒体や表示部など）へ送信する。

　受信部２７は、例えば、図示しない制御装置から送信されてくる制御データなどを受信し、制御部２８に供給する。

　制御部２８は、制御データに従って撮像素子１１を構成する各ブロックに対する制御を行い、撮像素子１１による撮像を実行する。

　図２は、撮像部２１から出力される画素信号に対する処理について説明する図である。

　例えば、撮像部２１は、ベイヤ配列画素を備えた構成、または、Raw画素を備えた構成を採用することができ、それぞれの構成で、通常走査または間引き走査で画素信号を出力することができる。

　ベイヤ配列画素の撮像部２１は、２×２配列の４つの画素に対して、左上の画素に赤色Ｒのカラーフィルタ、右上の画素に緑色Ｇのカラーフィルタ、左下の画素に緑色Ｇのカラーフィルタ、および、右下の画素に青色Ｂのカラーフィルタが配置される配置パターンが、行方向および列方向に繰り返されるように設けられて構成される。そして、ベイヤ配列画素の撮像部２１では、それぞれの色に応じた波長域の光の輝度値を表す画素信号Ｒ、画素信号Ｇ、および画素信号Ｂが画素から出力される。

　例えば、ベイヤ配列画素の撮像部２１において通常走査で画素信号を出力する場合、全ての画素から画素信号が出力される。従って、撮像部２１から出力される左上隅の２×２配列の画素から出力される画素信号は、画素信号Ｒ００、画素信号Ｇ０１、画素信号Ｇ１０、および画素信号Ｂ１１となる。

　また、ベイヤ配列画素の撮像部２１において間引き走査で画素信号を出力する場合、図示するように破線の丸印が付けられた一部の画素が選択対象となって、それらの画素から画素信号が出力される。従って、撮像部２１から出力される左上隅の２×２配列の画素から出力される画素信号は、画素信号Ｒ００、画素信号Ｇ０３、画素信号Ｇ３０、および画素信号Ｂ３３となる。なお、間引き走査で画素信号を出力する場合において、選択対象となっていない画素の画素加算を行って、画素加算された画素信号を出力してもよい。

　そして、ベイヤ配列画素の撮像部２１から出力された画素信号は、例えば、撮像処理部２２においてデモザイク処理が施され、その処理により取得される画素データｚが、記憶部２３に記憶される。

　一方、Raw画素の撮像部２１は、ベイヤ配列画素のようなカラーフィルタが設けられずに構成され、全ての波長域の光の輝度値を表す画素信号ｚが画素から出力される。

　例えば、Raw画素の撮像部２１において通常走査で画素信号を出力する場合、全ての画素から画素信号が出力される。従って、撮像部２１から出力される左上隅の２×２画素の画素信号は、画素信号ｚ００、画素信号ｚ０１、画素信号ｚ１０、および画素信号ｚ１１となる。これらの画素信号ｚは、撮像処理部２２において処理が施されることなく、画素データｚとして用いられる。

　また、Raw画素の撮像部２１において間引き走査で画素信号を出力する場合、図示するように破線の丸印が付けられた一部の画素が選択対象となって、それらの画素から画素信号が出力される。従って、撮像部２１から出力される左上隅の２×２画素の画素信号は、画素信号ｚ００、画素信号ｚ０２、画素信号ｚ２０、および画素信号ｚ２２となる。これらの画素信号ｚは、撮像処理部２２において処理が施されることなく、画素データｚとして用いられる。なお、間引きされた画像も、デコード時に元の解像度に復元することが可能である。

　図３は、記憶部２３およびエンコード部２５の構成例を説明するブロック図である。

　記憶部２３は、ラインメモリ３１、フレームメモリ３２、およびネットワークデータメモリ３３を備えて構成される。

　ラインメモリ３１は、撮像処理部２２から供給される画素データを画像の１ラインごとに記憶する。フレームメモリ３２は、ラインメモリ３１から供給される１ラインごとの画素データを記憶し、１フレーム分の画素データを記憶する。ネットワークデータメモリ３３は、例えば、エンコード部２５から出力されるエンコード済みの画素データを記憶する。

　エンコード部２５は、入力データバッファ４１、畳み込み演算処理部４２、および出力データバッファ４３を備えて構成される。

　入力データバッファ４１は、DMA処理部２４によるメモリアクセスに従って記憶部２３のフレームメモリ３２から転送される画素データを一時的に記憶し、順次、畳み込み演算処理部４２に画素データを入力する。

　畳み込み演算処理部４２は、入力データバッファ４１を介して入力される画素データが表す画素値（以下、入力画素値と称する）に対して畳み込み演算処理を行う。例えば、畳み込み演算処理部４２は、フィルタ数Ｍに応じた個数の演算器４４－１乃至４４－Ｍを有して構成され、入力画素値に対する畳み込み演算処理を行うことによってフィルタ数Ｍ分の畳み込み層出力画素値を取得する。そして、畳み込み演算処理部４２は、フィルタ数Ｍ分の畳み込み層出力画素値を、エンコード済みの画素データとして出力データバッファ４３に出力する。なお、演算器４４の詳細な構成については、図４を参照して後述する。

　出力データバッファ４３は、畳み込み演算処理部４２から供給されるエンコード済みの画素データを一時的に記憶し、DMA処理部２４によるメモリアクセスに従って順次、フレームメモリ３２のネットワークデータメモリ３３に出力する。

　図４は、演算器４４の構成例を示すブロック図である。

　演算器４４は、積和演算処理部５１、加算器５２、および乗算器５３を備えて構成される。

　積和演算処理部５１は、入力データバッファ４１を介して供給される入力画素値に対して積和演算処理を行う。例えば、積和演算処理部５１は、チャネル数Ｋに応じた個数の演算器５４－１乃至５４－Ｋを有して構成され、入力画素値に対する積和演算処理を行うことによってチャネル数Ｋ分の積和演算結果を取得し、加算器５２に供給する。

　加算器５２は、積和演算処理部５１から供給されるチャネル数Ｋ分の積和演算結果を加算し、入力データバッファ４１を介して供給されるバイアス値を加算する演算を行い、その演算の結果として得られる畳み込み値を、乗算器５３に供給する。

　乗算器５３は、加算器５２から供給される畳み込み値を、入力データバッファ４１を介して供給される活性化演算子に入力することによって活性化演算を行い、その活性化演算の結果として得られる畳み込み層出力画素値を出力データバッファ４３に出力する。

　図５は、演算器５４の構成例を示すブロック図である。

　演算器５４は、データバッファ６１、シフトレジスタ６２、フィルタバッファ６３、乗算器６４、および加算器６５を備えて構成される。

　データバッファ６１には、入力データバッファ４１を介して入力画素値ｚとなる画素データが供給され、データバッファ６１は、フィルタサイズに従ったサイズの配列の入力画素値ｚを逐次的に記憶し、適宜、乗算器６４に入力画素値ｚを供給する。図示する例では、３×３配列の９個の入力画素値ｚがデータバッファ６１に記憶されている。

　シフトレジスタ６２は、データバッファ６１に記憶された１行目および２行目の入力画素値ｚが入力され、制御部２８による制御に従ったシフト値で入力画素値ｚをシフトして、それぞれデータバッファ６１の２行目および３行目に出力する。なお、図示するシフトレジスタ６２の構成は例示であって、１行目および２行目の入力画素値ｚが入力される以外の構成であってもよい。

　フィルタバッファ６３には、入力データバッファ４１を介してフィルタ係数ｈとなる重みデータが供給され、フィルタバッファ６３は、フィルタサイズに従ったサイズの配列のフィルタ係数ｈを逐次的に記憶し、適宜、乗算器６４にフィルタ係数ｈを供給する。図示する例では、３×３配列の９個のフィルタ係数ｈがフィルタバッファ６３に記憶されている。

　乗算器６４は、データバッファ６１から供給される３×３配列の入力画素値ｚと、フィルタバッファ６３から供給される３×３配列のフィルタ係数ｈとを乗算する演算を行い、その演算の結果として得られる乗算値を加算器６５に供給する。

　加算器６５は、乗算器６４から供給される３×３配列分の乗算値を加算する演算を行うことによって積和演算結果を取得して、図４の加算器５２に供給する。

　また、図６に示すように、乗算器６４および加算器６５は、入力画素値ｚとフィルタ係数ｈとを並べ替えて、並列積和演算（ベクトル演算）を行ってもよい。

　＜畳み込み層の演算＞
　図７乃至図１０を参照して、エンコード部２５において実行される畳み込み演算について説明する。

　図７には、畳み込み演算で用いられる演算式の一例が示されている。

　図示するように、畳み込み値ｕ_ｉｊｍは、入力画素値ｚ_{ｉ＋ｐ，ｊ＋ｑ，ｋ} ^{（ｌ－１）}とフィルタ係数ｈ_ｐｑｋｍとを積和演算して積和演算結果を取得し、入力画像のチャネル数Ｋ分の積和演算結果およびバイアス値ｂ_ｉｊｍを加算することによって求められる。そして、畳み込み層出力画素値ｚ_ｉｊｍ ^（ｌ）は、畳み込み値ｕ_ｉｊｍを活性化演算子ｆ（・）に入力して行われる活性化演算によって求められる。

　図８を参照して、入力画像の画像サイズが縦Ｗ×横Ｗであって、チャネル数Ｋの入力画像がエンコード部２５の演算器５４－１乃至５４－Ｋそれぞれに入力され、３つのフィルタ（フィルタ数Ｍ＝３）を用いて行われる畳み込み演算処理について説明する。なお、入力画像の画像サイズは、縦および横が同一のサイズである必要はない。

　第１のフィルタ（ｍ＝０）では、それぞれの演算器５４の乗算器６４（図５）が、Ｈ×Ｈ配列の入力画素値ｚ_{ｉ＋ｐ，ｊ＋ｑ，ｋ} ^{（ｌ－１）}と、Ｈ×Ｈ配列のフィルタ係数ｈ_ｐｑｋ０とを乗算する演算を行う。この一点鎖線で囲われた領域における演算は、図７の演算式において一点鎖線で囲われた領域の演算に対応する。

　そして、第１のフィルタ（ｍ＝０）では、それぞれの演算器５４の加算器６５（図５）が、乗算器６４による演算の結果として得られるＨ×Ｈ配列の乗算値を加算する演算を行うことによって積和演算結果を取得して加算器５２（図４）に供給する。加算器５２は、チャネル数Ｋ分の積和演算結果およびバイアス値ｂ_ｉｊ０を加算する演算を行って畳み込み値ｕ_ｉｊ０を取得し、乗算器５３が、畳み込み値ｕ_ｉｊ０を活性化演算子ｆ（・）に入力して活性化演算を行うことによって畳み込み層出力画素値ｚ_ｉｊ０ ^（ｌ）を取得する。この破線で囲われた領域における演算は、図７の演算式において破線で囲われた領域の演算に対応する。

　また、第１のフィルタ（ｍ＝０）と同様に、第２のフィルタ（ｍ＝１）および第３のフィルタ（ｍ＝２）においても、畳み込み層出力画素値ｚ_ｉｊ１ ^（ｌ）および畳み込み層出力画素値ｚ_ｉｊ２ ^（ｌ）を取得することができる。

　このように、畳み込み演算は、フィルタごとに、一点鎖線で囲われた部分に対応する第１の演算処理である積和演算と、破線で囲われた部分に対応する第２の演算処理である和演算および活性化演算とに分解することができる。

　図９を参照して、第１の演算処理について説明し、図１０を参照して、第２の演算処理について説明する。また、図９および図１０には、赤色Ｒの画像、緑色Ｇの画像、および青色Ｂの画像が用いられ、チャネル数Ｋが３である場合の処理例が示されている。

　図９に示すように、例えば、赤色Ｒの画像の入力画素値が、記憶部２３から入力データバッファ４１を介して、演算器５４－ｋ（例えば、ｋ＝０）のシフトレジスタ６２に格納される。そして、シフトレジスタ６２からフィルタ演算の対象となる対象画素の３×３配列分の入力画素値（例えば、R00,R01,R02,R10,R11,R12,R20,R21,R22）がデータバッファ６１に格納される。また、フィルタバッファ６３には、３×３配列分のフィルタ係数（例えば、h00,h01,h02,h10,h11,h12,h20,h21,h22）が格納される。そして、乗算器６４によって、データバッファ６１に格納されている入力画素値とフィルタバッファ６３に格納されているフィルタ係数とが乗算され、その乗算結果が、加算器６５によって加算されることにより取得された積和演算結果が出力される。

　同様に、緑色Ｇの画像が演算器５４－ｋ（例えば、ｋ＝１）に入力され、青色Ｂの画像が演算器５４－ｋ（例えば、ｋ＝２）に入力され、それぞれ積和演算結果が出力される。

　このように、第１の演算処理として、対象画素に対してフィルタ演算を行う積和演算が行われる。

　図１０に示すように、チャネル数に応じて並列的に第１の演算処理が行われることで出力される積和演算結果（ｋ＝０）、積和演算結果（ｋ＝１）、および積和演算結果（ｋ＝２）が、加算器５２によって加算される。さらに、加算器５２によってバイアス値ｂが加算されることで畳み込み値ｕが取得され、乗算器５３によって、畳み込み値ｕを活性化演算子ｆ（・）に入力して活性化演算が行われる。これにより、畳み込み層出力画素値ｚ^（ｌ）が出力される。

　このように、第２の演算処理として、チャネルごとに行われた第１の演算処理の処理結果を加算する和演算、および、活性化演算子ｆ（・）に従った活性化演算が行われる。また、フィルタ数に応じて並列的に第２の演算処理が行われる。

　＜入力画像の転送方法＞
　図１１を参照して、入力画像の転送方法について説明する。

　例えば、撮像素子１１では、撮像部２１において１ラインごとに撮像することで得られる入力画像の画素データが記憶部２３に供給され、ラインメモリ３１を介してフレームメモリ３２に記憶される。そして、DMA処理部２４によるメモリアクセスに従って、フレームメモリ３２から入力データバッファ４１に入力画像の画素データが転送される。

　図１１のＡは、フィルタ係数の個数に応じた入力画像の画素データを転送する第１の転送方法（シフトレジスタ６２は使用しない転送方法）を説明する図である。

　図１１のＡには、３×３配列のフィルタサイズが用いられてフィルタ係数の個数である９個の画素データが転送され、スライド数が１画素である場合の例が示されている。例えば、一点鎖線で囲われた９個の画素データがフレームメモリ３２から入力データバッファ４１に転送される。そして、それらの９個の画素データに対する畳み込み演算処理が完了すると、スライド数である１画素分だけシフトして、二点鎖線で囲われた９個の画素データがフレームメモリ３２から入力データバッファ４１に転送される。

　図１１のＢは、入力画像を複数のタイルに分割し、それらのタイルごとに画素データを転送する第２の転送方法を説明する図である。

　図１１のＢには、入力画像を４つのタイルに分割した場合の例が示されている。例えば、破線で囲われている画素データが１つのタイルとされ、そのタイルの画素データがフレームメモリ３２から入力データバッファ４１に転送される。そして、そのタイルの画素データに対する畳み込み演算処理が完了すると、次のタイルを処理対象として、次のタイルの画素データがフレームメモリ３２から入力データバッファ４１に転送される。

　図１１のＣは、入力画像の全ての画素データを転送する第３の転送方法を説明する図である。

　図１１のＣにおいて破線で囲われている入力画像の全ての画素データが、フレームメモリ３２から入力データバッファ４１に転送される。

　＜畳み込み演算処理の処理例＞
　図１２は、エンコード部２５において実行される畳み込み演算処理の第１の処理例について説明するフローチャートである。第１の処理例では、図１１のＡを参照して説明したように、フィルタ係数の個数に応じて入力画像の画素データを転送する第１の転送方法が用いられる。

　ステップＳ１１において、DMA処理部２４によるメモリアクセスに従って、フィルタ係数の個数に応じた入力画像の画素データが、記憶部２３のフレームメモリ３２から畳み込み演算処理部４２の入力データバッファ４１に転送される。

　ステップＳ１２において、畳み込み演算処理部４２では、フィルタ数Ｍに応じた個数の演算器４４－１乃至４４－Ｍが、ステップＳ１１で入力データバッファ４１に転送された個数の入力画像の画素データに対する畳み込み演算処理を行う。

　ステップＳ１３において、演算器４４－１乃至４４－Ｍそれぞれの積和演算処理部５１では、チャネル数Ｋに応じた個数の演算器５４－１乃至５４－Ｋが、ステップＳ１１で入力データバッファ４１に転送された個数の入力画像の画素データとフィルタ係数との積和演算処理を行う。なお、ステップＳ１３の積和演算処理は、ステップＳ１２の畳み込み演算処理の一部として行うことができる。

　ステップＳ１４において、畳み込み演算処理部４２は、ステップＳ１１で入力データバッファ４１に転送された入力画像分の畳み込み演算処理が完了したか否かを判定する。

　ステップＳ１４において、入力画像分の畳み込み演算処理が完了していないと判定された場合、処理はステップＳ１５に進む。

　ステップＳ１５において、DMA処理部２４は、記憶部２３のフレームメモリ３２から畳み込み演算処理部４２の入力データバッファ４１へ転送する画素データを、スライド数に応じてシフトする。その後、処理はステップＳ１１に戻り、そのシフトに従って次の画素データが転送され、以下、同様の処理が繰り返して行われる。

　一方、ステップＳ１４において、入力画像分の畳み込み演算処理が完了したと判定された場合、畳み込み演算処理は終了される。

　図１３は、エンコード部２５において実行される畳み込み演算処理の第２の処理例について説明するフローチャートである。第２の処理例では、図１１のＢを参照して説明したように、タイルごとに画素データを転送する第２の転送方法が用いられる。

　ステップＳ２１において、DMA処理部２４によるメモリアクセスに従って、１つのタイル分の入力画像の画素データが、記憶部２３のフレームメモリ３２から畳み込み演算処理部４２の入力データバッファ４１に転送される。

　ステップＳ２２において、畳み込み演算処理部４２では、フィルタ数Ｍに応じた個数の演算器４４－１乃至４４－Ｍが、ステップＳ２１で入力データバッファ４１に転送された１つのタイル分の入力画像の画素データに対する畳み込み演算処理を行う。

　ステップＳ２３において、演算器４４－１乃至４４－Ｍそれぞれの積和演算処理部５１では、チャネル数Ｋに応じた個数の演算器５４－１乃至５４－Ｋが、ステップＳ２１で入力データバッファ４１に転送された１つのタイル分の入力画像の画素データとフィルタ係数との積和演算処理を行う。このとき、図５を参照して説明したように、演算器５４では、データバッファ６１に記憶されるフィルタサイズに従ったサイズの画素データが積和演算処理の対象とされ、残りの画素データは、シフトレジスタ６２に保持される。なお、ステップＳ２３の積和演算処理は、ステップＳ２２の畳み込み演算処理の一部として行うことができる。

　ステップＳ２４において、演算器５４は、ステップＳ１１で入力データバッファ４１に転送された入力画像分の畳み込み演算処理が完了したか否かを判定する。

　ステップＳ２４において、入力画像分の畳み込み演算処理が完了していないと判定された場合、ステップＳ２５に進む。ステップＳ２５において、演算器５４は、シフトレジスタ６２に保持されている画素データを、制御部２８による制御に従ったシフト値に応じてスライドさせ、そのスライド後にデータバッファ６１に記憶された画素データを積和演算処理の対象とする。そして、処理はステップＳ２３に戻り、積和演算処理が継続して行われる。

　一方、ステップＳ２４において、入力画像分の畳み込み演算処理が完了したと判定された場合、ステップＳ２６に進む。ステップＳ２６において、畳み込み演算処理部４２は、全てのタイルに対する畳み込み演算処理が終了してタイリングが完成したか否かを判定する。

　ステップＳ２６において、タイリングが完了していないと判定された場合、処理はステップＳ２７に進む。ステップＳ２７において、DMA処理部２４は、記憶部２３のフレームメモリ３２から畳み込み演算処理部４２の入力データバッファ４１へ転送する画素データについて、次のタイルを処理対象とする。その後、処理はステップＳ１１に戻り、次のタイルの画素データが転送され、以下、同様の処理が繰り返して行われる。

　一方、ステップＳ２６において、タイリングが完了したと判定された場合、畳み込み演算処理は終了される。

　なお、図１３を参照して説明した畳み込み演算処理を、図１１のＣを参照して説明したような入力画像の全ての画素データを転送する第３の転送方法に適用してもよく、この場合、ステップＳ２６およびＳ２７の処理を省略して、ステップＳ２４の処理で入力画像分の畳み込み演算処理が完了したと判定されると畳み込み演算処理が終了される。

　＜積層型の撮像素子の構成例＞
　図１４は、積層型の撮像素子１１の構成例について説明する図である。

　図１４のＡに示す積層型の撮像素子１１Ａは、複数の画素がセンサ面に行列状に配置される撮像部２１が設けられたセンサ基板７１と、エンコード部２５などが設けられたロジック基板７２とが積層された積層構造となっている。

　図１４のＢに示す積層型の撮像素子１１Ｂは、積層型の撮像素子１１Ａと同様にセンサ基板７１およびロジック基板７２が積層されるのに加えて、記憶部２３などが設けられたメモリ基板７３が積層された積層構造となっている。

　例えば、積層型の撮像素子１１Ａおよび積層型の撮像素子１１Ｂでは、それぞれの基板の間における電気的および機械的な接続に、TSV（through-silicon via）を利用した構造や、Cu-Cu接合を利用した構造などを採用することができる。

　＜電子機器の構成例＞
　上述したような撮像素子１１は、例えば、デジタルスチルカメラやデジタルビデオカメラなどの撮像システム、撮像機能を備えた携帯電話機、または、撮像機能を備えた他の機器といった各種の電子機器に適用することができる。

　図１５は、電子機器に搭載される撮像装置の構成例を示すブロック図である。

　図１５に示すように、撮像装置１０１は、光学系１０２、撮像素子１０３、信号処理回路１０４、モニタ１０５、およびメモリ１０６を備えて構成され、静止画像および動画像を撮像可能である。

　光学系１０２は、１枚または複数枚のレンズを有して構成され、被写体からの像光（入射光）を撮像素子１０３に導き、撮像素子１０３の受光面（センサ部）に結像させる。

　撮像素子１０３としては、上述した撮像素子１１が適用される。撮像素子１０３には、光学系１０２を介して受光面に結像される像に応じて、一定期間、電子が蓄積される。そして、撮像素子１０３に蓄積された電子に応じた信号が信号処理回路１０４に供給される。

　信号処理回路１０４は、撮像素子１０３から出力された画素信号に対して各種の信号処理を施す。信号処理回路１０４が信号処理を施すことにより得られた画像（画像データ）は、モニタ１０５に供給されて表示されたり、メモリ１０６に供給されて記憶（記録）されたりする。

　このように構成されている撮像装置１０１では、上述した撮像素子１１を適用することで、例えば、より高速に画像を撮像することができる。

　＜イメージセンサの使用例＞
　図１６は、上述のイメージセンサ（撮像素子）を使用する使用例を示す図である。

　上述したイメージセンサは、例えば、以下のように、可視光や、赤外光、紫外光、X線等の光をセンシングする様々なケースに使用することができる。

　・ディジタルカメラや、カメラ機能付きの携帯機器等の、鑑賞の用に供される画像を撮影する装置
　・自動停止等の安全運転や、運転者の状態の認識等のために、自動車の前方や後方、周囲、車内等を撮影する車載用センサ、走行車両や道路を監視する監視カメラ、車両間等の測距を行う測距センサ等の、交通の用に供される装置
　・ユーザのジェスチャを撮影して、そのジェスチャに従った機器操作を行うために、TVや、冷蔵庫、エアーコンディショナ等の家電に供される装置
　・内視鏡や、赤外光の受光による血管撮影を行う装置等の、医療やヘルスケアの用に供される装置
　・防犯用途の監視カメラや、人物認証用途のカメラ等の、セキュリティの用に供される装置
　・肌を撮影する肌測定器や、頭皮を撮影するマイクロスコープ等の、美容の用に供される装置
　・スポーツ用途等向けのアクションカメラやウェアラブルカメラ等の、スポーツの用に供される装置
　・畑や作物の状態を監視するためのカメラ等の、農業の用に供される装置

　＜構成の組み合わせ例＞
　なお、本技術は以下のような構成も取ることができる。
（１）
　チャネル数に応じた個数の第１の演算器を有し、それぞれの前記第１の演算器において入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによって前記チャネル数分の積和演算結果を取得する積和演算処理部と、
　フィルタ数に応じた個数の第２の演算器を有し、それぞれの前記第２の演算器において前記積和演算結果を用いた畳み込み演算処理を行うことによって前記フィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理を行う畳み込み演算処理部と
　を備える信号処理装置。
（２）
　前記第２の演算器それぞれが、前記積和演算処理部を有して構成される
　上記（１）に記載の信号処理装置。
（３）
　前記第１の演算器は、
　　フィルタサイズに従ったサイズの前記入力画素値を逐次的に記憶するデータバッファと、
　　前記フィルタサイズに従ったサイズの前記フィルタ係数を逐次的に記憶するフィルタバッファと、
　　前記データバッファに記憶されている前記入力画素値と前記フィルタバッファに記憶されている前記フィルタ係数とを乗算することによって前記フィルタサイズに応じた所定数の乗算値を求める第１の乗算器と、
　　前記第１の乗算器により求められた所定数の前記乗算値を加算することで前記積和演算結果を求める第１の加算器
　を有する
　上記（１）または（２）に記載の信号処理装置。
（４）
　前記第２の演算器は、
　　前記積和演算処理部から出力される前記チャネル数分の前記積和演算結果それぞれを加算し、所定のバイアス値を加算することによって畳み込み値を求める第２の加算器と、　　前記畳み込み値を、所定の活性化演算子に入力して前記積和演算結果を求める第２の乗算器と
　をさらに有する
　上記（１）から（３）までのいずれかに記載の信号処理装置。
（５）
　前記畳み込み演算処理部に入力される前記入力画素値を一時的に記憶する入力バッファをさらに備え、
　前記入力画像を記憶する記憶部から前記入力バッファへ、前記フィルタ係数の個数に応じた前記入力画素値が転送される
　上記（１）から（４）までのいずれかに記載の信号処理装置。
（６）
　前記畳み込み演算処理部に入力される前記入力画素値を一時的に記憶する入力バッファをさらに備え、
　前記入力画像を記憶する記憶部から前記入力バッファへ、前記入力画像を複数のタイルに分割した前記タイルごとに前記入力画素値が転送される
　上記（１）から（４）までのいずれかに記載の信号処理装置。
（７）
　チャネル数に応じた個数の第１の演算器を有する積和演算処理部と、フィルタ数に応じた個数の第２の演算器を有する畳み込み演算処理部とを備える信号処理装置が、
　それぞれの前記第１の演算器において入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによって前記チャネル数分の積和演算結果を取得することと、
　それぞれの前記第２の演算器において前記積和演算結果を用いた畳み込み演算処理を行うことによって前記フィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理を行うことと
　を含む信号処理方法。
（８）
　チャネル数に応じた個数の第１の演算器を有し、それぞれの前記第１の演算器において入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによって前記チャネル数分の積和演算結果を取得する積和演算処理部と、
　フィルタ数に応じた個数の第２の演算器を有し、それぞれの前記第２の演算器において前記積和演算結果を用いた畳み込み演算処理を行うことによって前記フィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理を行う畳み込み演算処理部と
　を有する信号処理部を備える固体撮像素子。
（９）
　複数の画素がセンサ面に行列状に配置される撮像部が設けられたセンサ基板と、前記信号処理部が設けられたロジック基板とが積層された積層構造である
　上記（８）に記載の固体撮像素子。
（１０）
　前記撮像部から出力される画素信号に基づいた画素データを記憶する記憶部が設けられたメモリ基板がさらに積層された積層構造である
　上記（９）に記載の固体撮像素子。

　なお、本実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　１１　撮像素子，　２１　撮像部，　２２　撮像処理部，　２３　記憶部，　２４　DMA処理部，　２５　エンコード部，　２６　送信部，　２７　受信部，　２８　制御部，　３１　ラインメモリ，　３２　フレームメモリ，　３３　ネットワークデータメモリ，　４１　入力データバッファ，　４２　畳み込み演算処理部，　４３　出力データバッファ，　４４　演算器，　５１　積和演算処理部，　５２　加算器，　５３　乗算器，　５４　演算器，　６１　データバッファ，　６２　シフトレジスタ，　６３　フィルタバッファ，　６４　乗算器，　６５　加算器，　７１　センサ基板，　７２　ロジック基板，　７３　メモリ基板

Claims

　チャネル数に応じた個数の第１の演算器を有し、それぞれの前記第１の演算器において入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによって前記チャネル数分の積和演算結果を取得する積和演算処理部と、
　フィルタ数に応じた個数の第２の演算器を有し、それぞれの前記第２の演算器において前記積和演算結果を用いた畳み込み演算処理を行うことによって前記フィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理を行う畳み込み演算処理部と
　を備える信号処理装置。
　前記第２の演算器それぞれが、前記積和演算処理部を有して構成される
　請求項１に記載の信号処理装置。
　前記第１の演算器は、
　　フィルタサイズに従ったサイズの前記入力画素値を逐次的に記憶するデータバッファと、
　　前記フィルタサイズに従ったサイズの前記フィルタ係数を逐次的に記憶するフィルタバッファと、
　　前記データバッファに記憶されている前記入力画素値と前記フィルタバッファに記憶されている前記フィルタ係数とを乗算することによって前記フィルタサイズに応じた所定数の乗算値を求める第１の乗算器と、
　　前記第１の乗算器により求められた所定数の前記乗算値を加算することで前記積和演算結果を求める第１の加算器
　を有する
　請求項１に記載の信号処理装置。
　前記第２の演算器は、
　　前記積和演算処理部から出力される前記チャネル数分の前記積和演算結果それぞれを加算し、所定のバイアス値を加算することによって畳み込み値を求める第２の加算器と、　　前記畳み込み値を、所定の活性化演算子に入力して前記積和演算結果を求める第２の乗算器と
　をさらに有する
　請求項１に記載の信号処理装置。
　前記畳み込み演算処理部に入力される前記入力画素値を一時的に記憶する入力バッファをさらに備え、
　前記入力画像を記憶する記憶部から前記入力バッファへ、前記フィルタ係数の個数に応じた前記入力画素値が転送される
　請求項１に記載の信号処理装置。
　前記畳み込み演算処理部に入力される前記入力画素値を一時的に記憶する入力バッファをさらに備え、
　前記入力画像を記憶する記憶部から前記入力バッファへ、前記入力画像を複数のタイルに分割した前記タイルごとに前記入力画素値が転送される
　請求項１に記載の信号処理装置。
　チャネル数に応じた個数の第１の演算器を有する積和演算処理部と、フィルタ数に応じた個数の第２の演算器を有する畳み込み演算処理部とを備える信号処理装置が、
　それぞれの前記第１の演算器において入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによって前記チャネル数分の積和演算結果を取得することと、
　それぞれの前記第２の演算器において前記積和演算結果を用いた畳み込み演算処理を行うことによって前記フィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理を行うことと
　を含む信号処理方法。
　チャネル数に応じた個数の第１の演算器を有し、それぞれの前記第１の演算器において入力画像の画素データである入力画素値とフィルタ係数との積和演算処理を行うことによって前記チャネル数分の積和演算結果を取得する積和演算処理部と、
　フィルタ数に応じた個数の第２の演算器を有し、それぞれの前記第２の演算器において前記積和演算結果を用いた畳み込み演算処理を行うことによって前記フィルタ数分の畳み込み層出力画素値を取得して、エンコード済みの画素データとして出力する畳み込み演算処理を行う畳み込み演算処理部と
　を有する信号処理部を備える固体撮像素子。
　複数の画素がセンサ面に行列状に配置される撮像部が設けられたセンサ基板と、前記信号処理部が設けられたロジック基板とが積層された積層構造である
　請求項８に記載の固体撮像素子。
　前記撮像部から出力される画素信号に基づいた画素データを記憶する記憶部が設けられたメモリ基板がさらに積層された積層構造である
　請求項９に記載の固体撮像素子。