JP2022018997A - 固体撮像素子、撮像装置、および、情報処理システム - Google Patents

固体撮像素子、撮像装置、および、情報処理システム Download PDF

Info

Publication number
JP2022018997A
JP2022018997A JP2020122492A JP2020122492A JP2022018997A JP 2022018997 A JP2022018997 A JP 2022018997A JP 2020122492 A JP2020122492 A JP 2020122492A JP 2020122492 A JP2020122492 A JP 2020122492A JP 2022018997 A JP2022018997 A JP 2022018997A
Authority
JP
Japan
Prior art keywords
tensor
output
input
dnn
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020122492A
Other languages
English (en)
Inventor
ハリ ジャガディシュ
Jagadeesh Hareesh
和幸 奥池
Kazuyuki Okuchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Semiconductor Solutions Corp
Original Assignee
Sony Semiconductor Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Semiconductor Solutions Corp filed Critical Sony Semiconductor Solutions Corp
Priority to JP2020122492A priority Critical patent/JP2022018997A/ja
Priority to US18/004,769 priority patent/US20230260244A1/en
Priority to PCT/JP2021/018717 priority patent/WO2022014141A1/ja
Publication of JP2022018997A publication Critical patent/JP2022018997A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/147Details of sensors, e.g. sensor lenses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/84Arrangements for image or video recognition or understanding using pattern recognition or machine learning using probabilistic graphical models from image or video features, e.g. Markov models or Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/87Arrangements for image or video recognition or understanding using pattern recognition or machine learning using selection of the recognition techniques, e.g. of a classifier in a multiple classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/955Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/617Upgrading or updating of programs or applications for camera control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/70SSIS architectures; Circuits associated therewith
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/70SSIS architectures; Circuits associated therewith
    • H04N25/76Addressed sensors, e.g. MOS or CMOS sensors
    • H04N25/78Readout circuits for addressed sensors, e.g. output amplifiers or A/D converters

Abstract

【課題】画像認識処理を行う固体撮像素子において、汎用性を向上させる。【解決手段】処理部は、出力テンソルのフォーマットが異なる複数のDNN(Deep Neural Network)のいずれかを選択する。デジタル信号処理部は、選択されたDNNを用いて入力テンソルに対する画像認識処理を行って出力テンソルを生成する。出力インターフェースは、生成された出力テンソルをデコードするためのデコードパラメータと出力テンソルとを出力する。【選択図】図5

Description

本技術は、固体撮像素子に関する。詳しくは、画像認識処理の結果を出力する固体撮像素子、撮像装置、および、情報処理システムに関する。
従来より、画像認識や音声認識などの様々な分野において、DNN(Deep Neural Network)が用いられている。例えば、画像データを撮像し、その画像データに対してDNNを用いて画像認識処理を行う撮像装置が提案されている(例えば、特許文献1参照。)。この撮像装置は、画像認識処理の結果をメタデータとして画像データとともにアプリケーションサーバに出力する。
特開2020-22054号公報
上述の従来技術では、撮像装置が画像認識処理を行うことにより、アプリケーションサーバが画像認識処理を行う場合と比較して、アプリケーションサーバの処理量や、処理の遅延時間の削減を図っている。ここで、DNNの入力データや出力データのフォーマット(データ数、データのタイプやデータサイズなど)は、DNNの処理内容に応じて決定され、通常、出荷時以降は変更されない。しかしながら、出荷時のままでは認識精度が不足する場合や認識対象を変える場合などに、DNNの処理内容の変更を要することがある。そして、その処理内容の変更に起因して入出力データのフォーマットの変更が必要になることがある。上述の撮像装置では、DNNの入出力データのフォーマットを変更することができず、汎用性が低いという問題がある。
本技術はこのような状況に鑑みて生み出されたものであり、画像認識処理を行う固体撮像素子において、汎用性を向上させることを目的とする。
本技術は、上述の問題点を解消するためになされたものであり、その第1の側面は、出力テンソルのフォーマットが異なる複数のDNN(Deep Neural Network)のいずれかを選択する処理部と、上記選択されたDNNを用いて入力テンソルに対する画像認識処理を行って上記出力テンソルを生成するデジタル信号処理部と、上記生成された出力テンソルをデコードするためのデコードパラメータと上記出力テンソルとを出力する出力インターフェースとを具備する固体撮像素子である。これにより、固体撮像素子の汎用性が向上するという作用をもたらす。
また、この第1の側面において、上記複数のDNNのそれぞれを上記デジタル信号処理部に実行させるためのパラメータをDNNパラメータとして受け取る入力インターフェースをさらに具備し、上記デジタル信号処理部は、上記DNNパラメータに基づいて上記画像認識処理を行ってもよい。これにより、複数のDNNが実行されるという作用をもたらす。
また、この第1の側面において、上記出力インターフェースは、上記入力テンソルをさらに出力してもよい。これにより、入力テンソルが固体撮像素子の外部で処理されるという作用をもたらす。
また、この第1の側面において、上記入力テンソルを所定の領域に記憶するメモリをさらに具備し、上記出力インターフェースは、上記メモリから読み出された上記入力テンソルを出力し、上記デコードパラメータは、上記画像認識処理が完了するまでに、上記領域が上書きされるべきでないか否かを示す持続性フラグを含むものであってもよい。これにより、DNNが1フレーム期間内に完了しない場合に対応することができるという作用をもたらす。
また、この第1の側面において、上記出力インターフェースは、それぞれにヘッダが付加された上記入力テンソルおよび上記出力テンソルを出力してもよい。これにより、ヘッダが固体撮像素子の外部で処理されるという作用をもたらす。
また、この第1の側面において、上記入力テンソルに付加された上記ヘッダは、上記入力テンソルが有効であるか否かを示す有効フラグを含み、上記出力テンソルに付加された上記ヘッダは、上記出力テンソルが有効であるか否かを示す有効フラグを含むものであってもよい。これにより、固体撮像素子の外部の誤動作が防止されるという作用をもたらす。
また、この第1の側面において、上記入力テンソルに付加された上記ヘッダと、上記入力テンソルに対応する出力テンソルに付加された上記ヘッダとは、同一の値のフレームカウントを含むものであってもよい。これにより、固体撮像素子の外部で、入力テンソルと出力テンソルとを対応付けることができるという作用をもたらす。
また、この第1の側面において、上記入力テンソルは、第1および第2の入力テンソルを含み、上記複数のDNNは、第1および第2のDNNを含み、上記デジタル信号処理部は、上記第1の入力テンソルに対して上記第1のDNNを使用し、上記第2の入力テンソルに対して上記第2のDNNを使用してもよい。これにより、複数のDNNが順に実行されるという作用をもたらす。
また、この第1の側面において、上記デジタル信号処理部は、上記入力テンソルに対する画像認識処理を行って上記出力テンソルを生成し、上記出力インターフェースは、上記入力テンソルが生成される所定のフレーム期間の経過後に上記出力テンソルを出力してもよい。これにより、DNNが1フレーム期間内に完了しない場合に対応することができるという作用をもたらす。
また、この第1の側面において、上記デジタル信号処理部は、フレームをメモリに保持するキャプチャ期間の開始前に上記画像認識処理を中断し、上記キャプチャ期間の経過後に上記画像認識処理を再開してもよい。これにより、バンドノイズが抑制されるという作用をもたらす。
また、本技術の第2の側面は、入力テンソルに対する画像認識処理により生成された出力テンソルと、出力テンソルをデコードするためのデコードパラメータとを含むメタデータである。これにより、出力テンソルがデコードされるという作用をもたらす。
また、本技術の第3の側面は、出力テンソルのフォーマットが異なる複数のDNN(Deep Neural Network)のいずれかを選択する処理部と、上記選択されたDNNを用いて入力テンソルに対する画像認識処理を行って上記出力テンソルを生成するデジタル信号処理部と、上記生成された出力テンソルをデコードするためのデコードパラメータと上記出力テンソルとを出力する出力インターフェースと、上記デコードパラメータを用いて上記出力された出力テンソルをデコードするアプリケーションプロセッサとを具備する撮像装置である。これにより、撮像装置の汎用性が向上するという作用をもたらす。
また、本技術の第4の側面は、出力テンソルのフォーマットが異なる複数のDNN(Deep Neural Network)のいずれかを選択する処理部と、上記選択されたDNNを用いて入力テンソルに対する画像認識処理を行って上記出力テンソルを生成するデジタル信号処理部と、上記生成された出力テンソルをデコードするためのデコードパラメータと上記出力テンソルとを出力する出力インターフェースと、上記複数のDNNのそれぞれに対応する上記デコードパラメータを受け取る入力インターフェースと、上記デコードパラメータのそれぞれを生成して上記入力インターフェースに供給するコンバータとを具備する情報処理システムである。これにより、情報処理システムの汎用性が向上するという作用をもたらす。
本技術の実施の形態における情報処理システムの一構成例を示すブロック図である。 本技術の実施の形態におけるイメージセンサの一構成例を示すブロック図である。 本技術の実施の形態におけるインターフェースの一構成例を示すブロック図である。 本技術の実施の形態におけるDNNコンバーターの機能を説明するための図である。 本技術の実施の形態における情報処理システムの処理手順を説明するための図である。 本技術の実施の形態におけるMIPI(Mobile Industry Processor Interface)規格に準拠したインターフェースを介して転送されるデータの一例を示す図である。 本技術の実施の形態におけるMIPI規格のモバイルフォーマットの一例である。 本技術の実施の形態におけるMIPI規格のAV(Audio Visual)フォーマットの一例である。 本技術の実施の形態における入力テンソルを含むメタデータのデータフォーマットの一例である。 本技術の実施の形態における入力テンソルに対応するメタデータの詳細を説明するための図である。 本技術の実施の形態における入力テンソルの一構成例を示す図である。 本技術の実施の形態における入力テンソルの別の例を示す図である。 本技術の実施の形態における出力テンソルを含むメタデータのデータフォーマットの一例である。 本技術の実施の形態における出力テンソルに対応するメタデータの詳細を説明するための図である。 本技術の実施の形態における出力テンソルの一構成例を示す図である。 本技術の実施の形態におけるDNNパラメータ内のネットワークに関連するデータの一例を示す図である。 本技術の実施の形態におけるDNNパラメータ内の次元に関連するデータの一例を示す図である。 本技術の実施の形態におけるDNNパラメータ内のテンソルに関連するデータの一例を示す図である。 本技術の実施の形態におけるDNNパラメータ内の入力テンソルおよび出力テンソルに関連するデータの一例を示す図である。 本技術の実施の形態におけるDNNパラメータ内のメモリ詳細に関連するデータの一例を示す図である。 本技術の実施の形態におけるAP(Application Processor)パラメータ内のネットワークに関連するデータの一例を示す図である。 本技術の実施の形態におけるAPパラメータ内の次元に関連するデータの一例を示す図である。 本技術の実施の形態におけるAPパラメータ内のテンソルに関連するデータの一例を示す図である。 本技術の実施の形態におけるAPパラメータ内の入力テンソルおよび出力テンソルに関連するデータの一例を示す図である。 本技術の実施の形態におけるRAW画像の出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態における出力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態の第1の変形例における1枚目のRAW画像の出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態の第1の変形例における1枚目に対応する出力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態の第1の変形例における2枚目のRAW画像の出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態の第1の変形例における2枚目に対応する出力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態の第2の変形例における1枚目の入力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態の第2の変形例における2枚目のRAW画像の出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態の第2の変形例における1枚目に対応する出力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態の第3の変形例における1枚目の入力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態の第3の変形例における2枚目のRAW画像の出力までのイメージセンサの動作の一例を示すタイミングチャートである。 本技術の実施の形態の第3の変形例における1枚目に対応する出力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。
以下、本技術を実施するための形態(以下、実施の形態と称する)について説明する。説明は以下の順序により行う。
1.実施の形態(デコードのためのパラメータを出力する例)
2.第1の変形例(フレーム毎にDNNを変更し、デコードのためのパラメータを出力する例)
3.第2の変形例(入力テンソルの次のフレームで出力テンソルとデコードのためのパラメータとを出力する例)
4.第3の変形例(キャプチャ中にDNNを中断し、デコードのためのパラメータを出力する例)
<1.実施の形態>
[情報処理システムの構成例]
図1は、本技術の実施の形態における情報処理システムの一構成例を示すブロック図である。この情報処理システムは、画像認識処理を行うためのシステムであり、撮像装置100およびDNNコンバーター300を備える。
撮像装置100は、画像データを撮像し、その画像データに対する画像認識処理を行うものである。この撮像装置100は、光学部110、イメージセンサ200、アプリケーションプロセッサ120およびフラッシュメモリ130を備える。
光学部110は、入射光を集光してイメージセンサ200に導くものである。
イメージセンサ200は、光電変換により画像データを撮像し、その画像データに対する画像認識処理を行うものである。このイメージセンサ200は、アプリケーションプロセッサ120の制御に従って画像データを撮像し、その画像データに対する画像認識処理を行う。そして、イメージセンサ200は、処理結果を含むデータをアプリケーションプロセッサ120に信号線129を介して出力する。なお、イメージセンサ200は、特許請求の範囲に記載の固体撮像素子の一例である。
また、イメージセンサ200は、信号線139を介してフラッシュメモリ130から、画像認識処理に必要なデータを撮像前に読み出して保持しておく。
アプリケーションプロセッサ120は、画像認識処理の処理結果をデコードし、そのデコード結果に基づいて様々なアプリケーションを実行するものである。
DNNコンバーター300は、画像認識処理に必要なデータを生成するものである。このDNNコンバーター300は、生成したデータを信号線309を介して撮像前にフラッシュメモリ130に書き込む。
[イメージセンサの構成例]
図2は、本技術の実施の形態におけるイメージセンサ200の一構成例を示すブロック図である。このイメージセンサ200は、画素アレイ211、アナログデジタル変換部212、露光制御部213、画像信号処理部214、SRAM(Static Random Access Memory)215を備える。また、イメージセンサ200は、CPU(Central Processing Unit)216、ハードウェアアクセラレータ217、セレクタ218およびデジタル信号処理部219を備える。また、イメージセンサ200は、入力インターフェース251、254および256と、出力インターフェース252、253および255とを備える。これらの回路は、例えば、単一の半導体チップに設けられる。
なお、イメージセンサ200内の上述の回路を、積層された複数の半導体チップに分散して配置することもできる。この場合、例えば、上側の半導体チップと下側の半導体チップとが積層され、上側に画素アレイ211が配置され、それ以外の回路が下側に配置される。
画素アレイ211には、複数の画素が二次元格子状に配列される。画素のそれぞれは、光電変換によりアナログの画素信号を生成し、アナログデジタル変換部212に供給する。
アナログデジタル変換部212は、アナログの画素信号のそれぞれをデジタル信号に変換するものである。このアナログデジタル変換部212には、列ごと、あるいは、画素ごとにADC(Analog to Digital Converter)が設けられる。ADCのそれぞれは、対応する画素信号をAD(Analog to Digital)変換してデジタル信号を生成する。これらのデジタル信号を配列した画像データは、RAW画像としてセレクタ218および画像信号処理部214に供給される。
画像信号処理部214は、RAW画像に対して各種の画像処理を行うものである。画像処理として、レンズシェーディング補正、ホワイトバランスゲイン補正、デモザイク処理、リニアマトリックス処理、ガンマ補正、縮小処理、画像クロッピング処理、および、歪補正などが実行される。これらの処理は、いずれか1つ以上が実行される。画像処理後の画像を以下、「入力テンソル」と称する。画像信号処理部214は、処理前のRAW画像と、処理後の入力テンソルとをSRAM215に書き込む。
また、画像信号処理部214は、RAW画像に基づいて、環境光の照度を求める。例えば、画像信号処理部214は、RAW画像の少なくとも一部の領域のデジタル信号の統計量(合計値)を演算し、その演算結果を照度のデータとして露光制御部213に供給する。
露光制御部213は、照度に基づいて画素アレイ211の露光時間を制御するものである。
SRAM215は、RAW画像などの各種のデータを記憶するものである。このSRAM215は、RAW画像の他、入力テンソル、出力テンソル、ネットワーク重み、DNNプログラムコード、DNNパラメータ、APパラメータ、およびマニフェストなどが書き込まれる。DNNパラメータ、APパラメータおよびプログラムは、暗号化してSRAM215に保持しておくことが望ましい。暗号化されている場合、デジタル信号処理部219は、そのパラメータやプログラムを読み出した際に復号する。
出力テンソルは、画像認識処理で用いられるDNNから出力されるテンソルであり、画像認識処理の処理結果を示すデータである。
ネットワーク重みは、DNN内のニューラルから出力された値に乗算される係数である。
DNNプログラムコードは、デジタル信号処理部219にDNNを実行させるためプログラムを記載したコードである。
DNNパラメータは、デジタル信号処理部219に画像認識処理を実行させるためのパラメータであり、DNNの次元、ネットワーク重み、入力出力テンソルに関する情報などを含む。
APパラメータは、入力テンソルおよび出力テンソルをアプリケーションプロセッサ120がデコードするためのパラメータである。
マニフェストは、ネットワーク重み、DNNプログラムコード、DNNパラメータおよびAPパラメータを格納したファイルのサイズやロードアドレスに関する情報である。
CPU216は、イメージセンサ200内の回路を制御するものである。このCPU216には、入力インターフェース251を介してアプリケーションプロセッサ120からのコマンドが入力される。CPU216は、そのコマンドに従ってデジタル信号処理部219を制御し、画像認識処理を実行させる。
ここで、デジタル信号処理部219は、出力テンソルのフォーマットとアルゴリズムとが異なるM(Mは、整数)個のDNNを用いて画像認識処理を実行する機能を有する。DNNの入力テンソルおよび出力テンソルのフォーマットは、DNNの処理内容(アルゴリズムなど)に応じて決定される。CPU216は、それらのDNNのいずれかを選択し、デジタル信号処理部219に指示して実行させる。実行するDNNの切り替えは、例えば、撮像中(言い換えれば、動的)でなく、撮像停止中(言い換えれば、静的)に行われる。DNNの切り替えは、切り替え前のDNNでは認識精度が不足する場合や、認識対象を変える場合などに必要に応じて行われる。
前述のDNNパラメータおよびAPパラメータは、それぞれ、M個のグループに分割される。m(mは、0乃至M-1の整数)番目のグループは、m番目のDNNに対応するパラメータの集合である。ネットワーク重みも同様にM個のグループに分割される。DNNプログラムコードは、複数のDNNで共通のものを用いることができ、M個以下のDNNプログラムコードが保持される。
なお、イメージセンサ200は、各種のデータをSRAM215に記憶しているが、SRAM以外のメモリに記憶することもできる。なお、SRAM215は、特許請求の範囲のメモリの一例である。
ハードウェアアクセラレータ217は、入力テンソルに対して、必要に応じて画像の回転処理を行うものである。例えば、文字認識を行う際に、認識精度を向上させる目的で回転処理が行われる。ハードウェアアクセラレータ217は、SRAM215から処理対象の入力テンソルを読み出し、回転後の入力テンソルにより更新する。
セレクタ218は、RAW画像と、SRAM215に保持されたデータとの中から、データを選択してアプリケーションプロセッサ120に出力するものである。このセレクタ218は、RAW画像に対応する入力テンソルおよび出力テンソルを、それらのテンソルに対応するAPパラメータとともにSRAM215からメタデータとして読み出す。そして、セレクタ218は、RAW画像およびメタデータのうち少なくとも一方を出力インターフェース252を介してアプリケーションプロセッサ120に出力する。セレクタ218は、画像データおよびメタデータの一方のみを選択して出力することもできるし、画像データおよびメタデータの両方を選択して出力することもできる。
デジタル信号処理部219は、CPU216により選択されたDNNを用いて画像認識処理を行うものである。このデジタル信号処理部219は、マニフェストを参照し、選択されたDNNに対応するDNNパラメータ、ネットワーク重み、入力テンソルおよびDNNプログラムコードをSRAM215から読み出す。m番目のDNNが選択された際には、m番目のグループ内のDNNパラメータなどが読み出される。
そして、デジタル信号処理部219は、読み出したデータ(DNNパラメータなど)に基づいて、入力テンソルに対する画像認識処理を行い、出力テンソルを生成する。デジタル信号処理部219は、生成した出力テンソルをSRAM215に書き込む。
出力インターフェース253は、出力テンソルを、対応するAPパラメータとともにメタデータとしてアプリケーションプロセッサ120に出力するものである。m番目のDNNが選択された際には、m番目のグループ内のAPパラメータが出力される。
入力インターフェース254は、ダウンロードプログラムなどの様々なデータをアプリケーションプロセッサ120から受け取り、SRAM215に供給するものである。
出力インターフェース255は、SRAM215に保持されたデータをフラッシュメモリ130に出力するものである。
入力インターフェース256は、APパラメータやDNNパラメータなどのデータをフラッシュメモリ130から受け取り、SRAM215に供給するものである。
入力インターフェース251として、例えば、I2C(Inter-Integrated Circuit)規格に準拠したインターフェースが用いられる。出力インターフェース252として、例えば、MIPI規格に準拠したインターフェースが用いられる。出力インターフェース253および入力インターフェース254として、例えば、SPI(Serial Peripheral Interface)規格に準拠したインターフェースが用いられる。出力インターフェース255および入力インターフェース256として、例えば、SPI規格に準拠したインターフェースが用いられる。
[インターフェースの構成例]
図3は、本技術の実施の形態におけるインターフェースの一構成例を示すブロック図である。イメージセンサ200には、前述の出力インターフェース252、入力インターフェース254、出力インターフェース253および入力インターフェース251が設けられる。
また、アプリケーションプロセッサ120には、入力インターフェース121、出力インターフェース122、入力インターフェース123および出力インターフェース124が設けられる。
出力インターフェース252には、MIPI規格における送信回路が配置され、入力インターフェース121には、その規格の受信回路が配置される。同図における「MIPI_Tx」は、送信回路を示し、「MIPI_Rx」は受信回路を示す。これらの出力インターフェース252および入力インターフェース121を介して、ビデオデータおよびメタデータが転送される。ビデオデータは、連続して撮像された複数のRAW画像(言い換えれば、フレーム)を含む。メタデータは、フレームごとに生成され、転送される。
入力インターフェース254は、SPI規格のスレーブとして機能し、出力インターフェース122は、SPI規格のマスタとして機能する。これらの入力インターフェース254および出力インターフェース122を介して、ダウンロードプログラム、ネットワークデータや歪補正制御点などが転送される。
出力インターフェース253は、SPI規格のマスタとして機能し、入力インターフェース123は、SPI規格のスレーブとして機能する。これらの出力インターフェース253および入力インターフェース123を介して、メタデータが転送される。このメタデータには、入力テンソルは含まれず、出力テンソルと対応するAPパラメータとが含まれる。
入力インターフェース251は、I2C規格のスレーブとして機能し、出力インターフェース124は、I2C規格のマスタとして機能する。これらの入力インターフェース251および出力インターフェース124を介して、CPU216に対するコマンドや、アプリケーションプロセッサ120のステータスなどが転送される。
イメージセンサ200は、ビデオデータおよびメタデータの両方を出力することもできるし、メタデータのみを出力することもできる。ビデオデータおよびメタデータの両方を出力する際には、同図に例示したようにMIPI規格のインターフェースが用いられ、メタデータのみを出力する際には、SPI規格のインターフェースが用いられる。ビデオデータ(RAW画像)を送信するか否かの設定は、CPU216により撮像開始前に行われる。
このほか、イメージセンサ200は、RAW画像の撮像のたびに以下のいずれかのデータを出力することができる。
(1)RAW画像のみ
(2)入力テンソルおよびAPパラメータのみ
(3)出力テンソルおよびAPパラメータのみ
(4)(1)から(3)の組合せ
これらの出力設定は、I2C規格のインターフェースを介してアプリケーションプロセッサ120がコマンドを送信し、CPU216が、そのコマンドに従ってレジスタに設定することにより行われる。データが入力テンソルおよび出力テンソルのいずれであるかは、後述する識別子フラグにより設定される。
なお、イメージセンサ200およびアプリケーションプロセッサ120には、SPI規格およびMIPI規格の両方のインターフェースが設けられているが、これらの規格の一方のインターフェースのみを設けることもできる。
図4は、本技術の実施の形態におけるDNNコンバーター300の機能を説明するため
の図である。DNNコンバーター300には、公的なフレームワークにより開発されたM個のDNNモデルのそれぞれの仕様を示すデータが入力される。DNNコンバーター300は、入力されたデータを、ネットワーク重み、DNNプログラムコード、DNNパラメータ、APパラメータおよびマニフェストに変換する。
例えば、DNN1およびDNN2の2つのモデルが入力された場合、DNNコンバーター300は、DNN1に対応するネットワーク重みと、DNN2に対応するネットワーク重みとを出力する。また、DNNコンバーター300は、DNN1およびDNN2で共通のDNNプログラムコードと、DNNパラメータ、APパラメータおよびマニフェストを出力する。DNNパラメータとして、複数のパラメータが生成される。このDNNパラメータの集合は、DNN1に対応するグループと、DNN2に対応するグループとに分割される。同様に、複数のAPパラメータが生成され、その集合は、DNN1に対応するグループと、DNN2に対応するグループとに分割される。
DNNコンバーター300は、生成したデータを、撮像の開始前にイメージセンサ200内のフラッシュメモリ130に書き込む。このDNNコンバーター300は、オフライン変換ツールなどにより実現される。
図5は、本技術の実施の形態における情報処理システムの処理手順を説明するための図である。撮像の開始前にDNNコンバーター300は、APパラメータおよびDNNパラメータなどのデータを生成し、フラッシュメモリ130(不図示)に書き込む。フラッシュメモリ130内のデータは、イメージセンサ200により撮像前に読み出され、SRAM215内に保持される。
アプリケーションプロセッサ120により撮像開始が指示されると、画素アレイ211内の画素のそれぞれは、アナログの画素信号を生成してアナログデジタル変換部212に出力する。
アナログデジタル変換部212は、画素信号のそれぞれをデジタル信号に変換し、それらを配列したRAW画像を画像信号処理部214に供給する。
画像信号処理部214は、RAW画像をSRAM215にバッファリングして、そのRAW画像に対してデモザイク処理などの画像処理を実行し、入力テンソルを生成する。入力テンソルは、SRAM215に書き込まれる。
ハードウェアアクセラレータ217は、SRAM215から入力テンソルを読み出し、その入力テンソルを必要に応じて回転し、SRAM215を更新する。
CPU216は、出力テンソルのフォーマットが異なるM個のDNNのいずれかを選択し、選択したDNNの実行をデジタル信号処理部219に指示する。なお、CPU216は、特許請求の範囲に記載の処理部の一例である。
デジタル信号処理部219は、指示されたDNNに対応するネットワーク重み、DNNパラメータやDNNプログラムコードをSRAM215から読み出す。そして、デジタル信号処理部219は、読み出したデータに基づいて、CPU216により選択されたDNNを用いて入力テンソルに対する画像認識処理を実行し、出力テンソルを生成する。出力テンソルはSRAM215に書き込まれる。
SPI規格の出力インターフェース253は、CPU216の制御に従って、生成された出力テンソルと、そのテンソルをデコードするためのAPパラメータとをSRAM215からメタデータとして読み出し、アプリケーションプロセッサ120に出力する。
アプリケーションプロセッサ120は、APパラメータを用いて出力テンソルをデコードする。
なお、RAW画像や入力テンソルも出力する際には、MIPI規格の出力インターフェース252が用いられる。
ここで、出力インターフェース253がAPパラメータを出力せず、出力テンソルのみを出力する比較例を想定する。この比較例では、DNNを切り替えた際に、出力テンソルのフォーマットが変更されるため、アプリケーションプロセッサ120は、出力テンソルをデコードすることができなくなってしまう。
これに対して、出力インターフェース253が出力テンソルとともにAPパラメータを出力する情報処理システムでは、アプリケーションプロセッサ120が、そのAPパラメータにより出力テンソルをデコードすることができる。このため、情報処理システムは、出力テンソルのフォーマットが異なる様々なDNNに対応することができ、システムの汎用性を向上させることができる。
また、出力インターフェース253が入力テンソルおよびAPパラメータを出力する場合、DNNが切り替えられたときであっても、アプリケーションプロセッサ120は、APパラメータにより入力テンソルをデコードすることができる。
また、イメージセンサ200が画像認識処理を行うため、その処理をアプリケーションプロセッサ120が行う場合と比較して、アプリケーションプロセッサ120の処理量や、処理の遅延時間を削減することができる。
図6は、本技術の実施の形態におけるMIPI規格に準拠したインターフェースを介して転送されるデータの一例を示す図である。同図に例示するように、入力テンソルは、MIPI規格における仮想チャネルを介して転送される。出力テンソルは、入力テンソルと異なる仮想チャネルを介して転送される。
図7は、本技術の実施の形態におけるMIPI規格のモバイルフォーマットの一例である。同図における太線で囲んだDSP結果エリアに、図6に例示したデータが格納される。
図8は、本技術の実施の形態におけるMIPI規格のAVフォーマットの一例である。同図における太線で囲んだDSP結果エリアに、図6に例示したデータが格納される。
なお、SPI規格のインターフェースを用いる場合、SPI仕様により定義された転送設定に従ってデータが順に転送される。SPI規格のインターフェースの転送速度は、MIPI規格より遅いため、SPI規格のインターフェースを用いる場合、RAW画像は送信されない。
[メタデータの構成例]
図9は、本技術の実施の形態における入力テンソルを含むメタデータのデータフォーマットの一例である。このメタデータは、ヘッダ、APパラメータおよび入力テンソルを含む。ヘッダは、有効フラグ、フレームカウント、最大ライン長、APパラメータのサイズ、ネットワークID(IDentifier)、および、識別子フラグを含む。また、メタデータにおいて、空いた領域には、ゼロがパディングされる。ヘッダにおいて空いた領域は、リザーブドの領域として用いられる。
有効フラグは、入力テンソルが有効であるか否かを示すフラグである。
フレームカウントは、CPU216がRAW画像(フレーム)の撮像回数を計数した際の計数値である。このフレームカウントは、入力テンソルが出力されたフレームと出力テンソルが出力されたフレームとが異なる際に、入力テンソルに対応する出力テンソルを特定するために用いられる。入力テンソルが出力されたフレームと、出力テンソルが出力されたフレームとが異なるケースについては、後述の変形例で説明する。
最大ライン長は、MIPI設定に依存するMIPIラインの長さである。APパラメータのサイズは、APパラメータ全体のサイズであり、単位は、例えば、バイトである。
ネットワークIDは、入力テンソルが入力されたDNNを識別するための識別子である。識別子フラグは、ヘッダが付加されたテンソルが入力テンソルおよび出力テンソルのいずれであるかを示すフラグである。
上述の有効フラグ、フレームカウント、最大ライン長、APパラメータのサイズ、および、識別子フラグは、CPU216により設定される。また、ネットワークIDは、アプリケーションプロセッサ120により設定される。
図10は、本技術の実施の形態における入力テンソルに対応するメタデータの詳細を説明するための図である。ライン番号が「1」のラインに、ヘッダおよびAPパラメータが格納される。ライン番号が「2」以降のラインは、ボディ領域であり、入力テンソルが格納される。
有効フラグには、1バイトが割り当てられる。有効フラグが「0」である場合、データが無効であることを示す。有効フラグが「1」乃至「255」である場合、データが有効であることを示す。
フレームカウントには、1バイトが割り当てられる。複数のRAW画像を連続して撮像中(言い換えれば、ストリーム中)において、「0」乃至「244」の値が計数される。ストリームを停止するスタンバイ中において、フレームカウントに「255」が設定される。
最大ライン長には、2バイトが割り当てられる。RAW画像がフルサイズである場合、最大ライン長に「2560」が設定される。RAW画像がフルサイズより小さいV2H2のサイズである場合、最大ライン長に「2010」が設定される。RAW画像がV2H2より小さいV4H4のサイズである場合、最大ライン長に「1008」が設定される。
APパラメータのサイズには、2バイトが割り当てられる。このサイズの単位は、バイトである。
ネットワークIDには、1バイトが割り当てられる。16進数で「0」乃至「M-1」がネットワークIDに設定される。Mは、使用中にサポートされるDNNの最大数である。
識別子フラグには、1バイトが割り当てられる。「0」の識別子フラグは、ヘッダが付加されたテンソルが入力テンソルであることを示す。
リザーブドには、3バイトが割り当てられる。
APパラメータには、996バイトが割り当てられる。このAPパラメータは、ネットワーク目録、入力テンソルパラメータ、および、出力テンソルパラメータを含む。APパラメータの詳細については後述する。
図11は、本技術の実施の形態における入力テンソルの一構成例を示す図である。同図におけるR(Red)、G(Green)およびB(Blue)の領域は、赤色、緑色および青色の画素データが格納された領域を示す。灰色の領域は、パディング領域を示す。0乃至227番目の列と、256乃至1792番目の列とに64ラインの画素データが配列される。2048乃至2560番目の列には、63ラインの画素データが配列される。これにより、227×227×3の入力テンソルが構成される。
図12は、本技術の実施の形態における入力テンソルの別の例を示す図である。0乃至300番目の列と、320乃至1280番目の列とに90ラインの画素データが配列される。2240乃至2560番目の列には、89ラインの画素データが配列される。これにより、300×300×3の入力テンソルが構成される。
図11および図12に例示したように、入力テンソルのフォーマットは、メモリ(SRAM215)を効率的に用いるために、一般的な画像のフォーマットと異なるものとなる。このため、入力テンソルのデコードにAPパラメータが必要となる。
図13は、本技術の実施の形態における出力テンソルを含むメタデータのデータフォーマットの一例である。このメタデータは、ヘッダ、APパラメータおよび出力テンソルを含む。ヘッダの構成は、図9に例示したものと同様である。
イメージセンサ200は、入力テンソルおよび出力テンソルの両方を出力する場合には、図9に例示したデータと、図13に例示したデータとの両方をメタデータとして出力する。すなわち、入力テンソル、出力テンソルのそれぞれにヘッダが付加される。出力テンソルのみを出力する場合、イメージセンサ200は、図13に例示したメタデータを出力する。
図14は、本技術の実施の形態における出力テンソルに対応するメタデータの詳細を説明するための図である。識別子フラグには、ヘッダが付加されたテンソルが出力テンソルであることを示す「1」の値が設定される。
図15は、本技術の実施の形態における出力テンソルの一構成例を示す図である。同図において、白色の領域は、要素が格納された領域を示す。灰色の領域は、パディング領域を示す。出力テンソルの次元をNとすると、0番目の配列は、70個の要素を含み、0乃至69番目のアドレスに格納される。1番目の配列は、96乃至165番目のアドレスに格納される。N-1番目の配列は、494乃至563番目のアドレスに格納される。同図に例示するように、各配列は、シリアル化されてSRAM215に書き込まれる。
また、同図に例示したように、出力テンソルのフォーマットは、メモリ(SRAM215)を効率的に用いるために、一般的なフォーマットと異なるものとなる。このため、出力テンソルのデコードにAPパラメータが必要となる。
図16は、本技術の実施の形態におけるDNNパラメータ内のネットワークに関連するデータの一例を示す図である。このDNNパラメータは、DNNごとに、ネットワーク、次元、テンソル、入力テンソル、出力テンソルおよびメモリ詳細に関するパラメータを含む。
ネットワークに関するデータは、「ネットワークID」、「ネットワーク名称」、「ネットワークタイプ」、「入力テンソル」および「出力テンソル」の要素を含む。
「ネットワークID」として、ネットワーク(DNN)ごとに一意な識別子が記述される。ネットワーク名称として、文字列のネットワークの名称が記述される。「ネットワークタイプ」として、その機能性に基づくDNNのタイプが記述される。「入力テンソル」として、DNNに入力される入力テンソルの配列が記述される。「出力テンソル」として、DNNから出力される出力テンソルの配列が記述される。
図17は、本技術の実施の形態におけるDNNパラメータ内の次元に関連するデータの一例を示す図である。次元に関連するデータは、「テンソル目録」、「サイズ」、「シリアル化順序」および「パディング」の要素を含む。
「テンソル目録」として、次元順序が記述される。この次元順序は、フレームワーク内の意味的順序に相当する。次元順序は、0から開始され、0は、最速の実行中次元である。「サイズ」として、次元のサイズ、次元内の要素の数が記述される。ただし、パディングは除外される。「シリアル化順序」として、シリアル化されてメモリに書き込まれるときの次元の順序が記述される。シリアル化順序は0から開始され、0は、最速の実行中次元である。「パディング」の要素として、パディングとして追加された要素の数が記述される。
図18は、本技術の実施の形態におけるDNNパラメータ内のテンソルに関連するデータの一例を示す図である。テンソルに関連するデータは、「テンソル目録」、「名称」、「次元の数」、「次元の配列」、「要素当たりのビット数」、「シフト」、「スケール」、および、「タイプ」の要素を含む。
「テンソル目録」として、一意な識別子が記述される。この識別子は、ゼロからスタートするため、インデックスとして使用することができる。「名称」として、テンソルの名称が記述される。「次元の配列」として、次元オブジェクトの配列が記述される。「要素当たりのビット数」として、テンソルの要素当たりのビット数が記述される。「シフト」の要素として、固定小数点から浮動小数点への逆量子化のためのシフト値が記述される。「スケール」の要素として、固定小数点から浮動小数点への逆量子化のためのスケール値が記述される。「タイプ」として、テンソル内の要素のデータタイプが、符号付き、および、符号なしのいずれであるかが記述される。
図19は、本技術の実施の形態におけるDNNパラメータ内の入力テンソルおよび出力テンソルに関連するデータの一例を示す図である。入力テンソルに関連するデータは、「テンソル」、「SRAM内のオフセット」、および、「持続性フラグ」の要素を含む。
「テンソル」の要素として、上述のテンソルオブジェクトが記述される。「SRAM内のオフセット」として、SRAM215内のメモリオフセットアドレスが記述される。「持続性フラグ」として、DNNの実行が完了するまで入力テンソルメモリ領域が上書きされるべきでないか否かを示すフラグが記述される。入力テンソルメモリ領域は、SRAM215内において、入力テンソルが書き込まれる領域を示す。上書きされない場合に持続性フラグに「0」が設定され、上書きされる場合に「1」が設定される。
通常は、持続性フラグに「0」が設定される。ただし、DNNの実行に時間がかかり、垂直同期信号の周期内に終了しない場合は、持続性フラグに「1」が設定される。持続性フラグに「1」が設定されるケースについては、変形例で後述する。
また、出力テンソルに関連するデータは、「テンソル」、および、「SRAM内のオフセット」の要素を含む。
「テンソル」の要素として上述のテンソルオブジェクトが記述される。また、「SRAM内のオフセット」として、SRAM215内のメモリオフセットアドレスが記述される。
図20は、本技術の実施の形態におけるDNNパラメータ内のメモリ詳細に関連するデータの一例を示す図である。メモリ詳細に関するデータは、「総メモリ」、「係数メモリ」、「ランタイムメモリ」、および、「予約メモリ」の要素を含む。
「総メモリ」の要素として、上述のテンソルオブジェクトが書き込まれたメモリサイズが記述される。「係数メモリ」の要素として、SRAM215内のネットワーク重みが書き込まれたメモリサイズが記述される。「ランタイムメモリ」の要素として、ランタイムメモリのサイズが記述される。「予約メモリ」の要素として、ユーザの特殊なユースケースのために予約されたメモリサイズが記述される。
図21は、本技術の実施の形態におけるAPパラメータ内のネットワークに関連するデータの一例を示す図である。APパラメータ内のネットワークに関するデータは、DNNパラメータと同様に、「ネットワークID」、「ネットワーク名称」、「ネットワークタイプ」、「入力テンソル」および「出力テンソル」の要素を含む。
図22は、本技術の実施の形態におけるAPパラメータ内の次元に関連するデータの一例を示す図である。APパラメータ内の次元に関連するデータは、DNNパラメータと同様に、「テンソル目録」、「サイズ」、「シリアル化順序」および「パディング」の要素を含む。DNNパラメータと異なり、APパラメータにおいて、メモリ詳細に関するデータは、アプリケーションプロセッサ120にとって不要なデータであるため、記述されない。
図23は、本技術の実施の形態におけるAPパラメータ内のテンソルに関連するデータの一例を示す図である。APパラメータ内のテンソルに関連するデータは、DNNパラメータと同様に、「テンソル目録」、「名称」、「次元の数」、「次元の配列」、「要素当たりのビット数」、「シフト」、「スケール」、および、「タイプ」の要素を含む。
図24は、本技術の実施の形態におけるAPパラメータ内の入力テンソルおよび出力テンソルに関連するデータの一例を示す図である。入力テンソルに関連するデータは、「テンソル」、および、「持続性フラグ」の要素を含む。また、出力テンソルに関連するデータは、「テンソル」の要素を含む。DNNパラメータと異なり、APパラメータにおいて、オフセットアドレスは、アプリケーションプロセッサ120にとって不要なデータであるため、記述されない。
図16乃至図24に例示したように、DNNパラメータのうち、アプリケーションプロセッサ120で必要な一部のデータがAPパラメータとして用いられる。言い換えれば、APパラメータは、DNNパラメータのサブセットである。
図25は、本技術の実施の形態におけるRAW画像の出力までのイメージセンサ200の動作の一例を示すタイミングチャートである。この動作は、例えば、画像認識を行うための所定のアプリケーションが実行されたときに開始される。同図以降において、「ADC」は、アナログデジタル変換部212内のADCを示す。「HW Acc」は、ハードウェアアクセラレータ217を示す。「DSP」は、デジタル信号処理部219を示す。
タイミングT0において、垂直同期信号XVSが立ち下がったものとする。タイミングT0乃至T1の期間において、CPU216は、M個のDNNのうち、実行すべきDNNを選択してレジスタに設定する。
タイミングT2乃至T4の期間において、アナログデジタル変換部212が、AD変換によりRAW画像を生成する。画像信号処理部214(不図示)およびハードウェアアクセラレータ217は、RAW画像に対して各種の画像処理を前処理として行い、入力テンソルを生成する。また、RAW画像は、タイミングT2乃至T4の期間内に、出力インターフェース252から出力される。タイミングT3において、入力テンソルのSRAM215への書き込みが開始される。タイミングT4以降の処理については、後述する。
図26は、本技術の実施の形態における出力テンソルの出力までのイメージセンサ200の動作の一例を示すタイミングチャートである。前処理の完了したタイミングT4において、ハードウェアアクセラレータ217は、CPU216に割込み信号を供給する。
CPU216は、タイミングT5において、デジタル信号処理部219に画像認識処理の開始を通知する。タイミングT5乃至T10の期間内に、デジタル信号処理部219は、入力テンソルをSRAM215から読み出し、入力テンソルに対する画像認識処理をDNNを用いて行う。このとき、ネットワーク重み、DNNプログラムコード、および、DNNパラメータもSRAM215から読み出される。
また、CPU216は、タイミングT6乃至T7の期間に、DMA(Direct Memory Access)転送のための設定を行う。タイミングT7乃至T8の期間に、DMAコントローラ(不図示)は、その設定に従って、SRAM215から出力インターフェース252へ入力テンソルをDMA転送する。
また、デジタル信号処理部219は、タイミングT9において、SRAM215に出力テンソルを書き戻し、タイミングT10において、CPU216に画像認識処理の終了を通知する。
CPU216は、タイミングT10乃至T11の期間に、DMA転送のための設定を行う。タイミングT11乃至T12の期間に、DMAコントローラは、その設定に従って、SRAM215から出力インターフェース252へ出力テンソルをDMA転送する。
タイミングT13において、垂直同期信号XVSは立ち下がる。タイミングT13以降は、垂直同期信号XVSに同期して、同様の処理が繰り返し実行される。タイミングT0乃至T13の期間(言い換えれば、垂直同期信号XVSの周期)を、以下、「フレーム期間」と称する。
図25および図26に例示したように、1フレーム期間(垂直同期信号XVSの周期)内に、DNNによる画像認識処理が完了する。そして、RAW画像および入力テンソルが出力されたフレーム期間内に、その入力テンソルに対応する出力テンソルが出力される。
このように、本技術の実施の形態によれば、出力インターフェース252が、デコードのためのAPパラメータと出力テンソルとを出力するため、出力フォーマットの異なるDNNに切り替えられても、後段の回路は、出力テンソルをデコードすることができる。これにより、デジタル信号処理部219は、出力フォーマットの異なる様々なDNNを用いることができ、情報処理システムの汎用性が向上する。
<2.第1の変形例>
上述の実施の形態では、デジタル信号処理部219が、ストリーム中において単一のDNNを用いて画像認識処理を行い、DNNの切り替えは、ストリーム停止中に行っていた。しかし、単一のDNNでは、情報処理システムの汎用性や利便性が不足することがある。例えば、複数の物体を認識する場合、アルゴリズムの異なる複数のDNNが必要なことがあり、単一のDNNでは対応が困難となる。この実施の形態の第1の変形例のイメージセンサ200は、ストリーム中にDNNを切り替える点において実施の形態と異なる。
図27は、本技術の実施の形態の第1の変形例における1枚目のRAW画像の出力までのイメージセンサ200の動作の一例を示すタイミングチャートである。この実施の形態の第1の変形例のデジタル信号処理部219は、DNN1およびDNN2の2つのDNNを実行することができるものとする。
CPU216は、タイミングT0乃至T1の期間内にDNN1を選択し、レジスタに設定する。そして、タイミングT2乃至T4の期間において、アナログデジタル変換部212が、AD変換により1枚目のRAW画像を生成する。
図28は、本技術の実施の形態の第1の変形例における1枚目に対応する出力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。
タイミングT5乃至T10の期間内に、デジタル信号処理部219は、1枚目の入力テンソルをSRAM215から読み出し、その入力テンソルに対する画像認識処理をDNN1を用いて行う。また、デジタル信号処理部219は、タイミングT9において、SRAM215に、DNN1に対応する出力テンソルを書き戻す。
DNN1に対応する入力テンソルおよび出力テンソルのそれぞれには、DNN1を示すネットワークIDを含むヘッダが付加される。
図29は、本技術の実施の形態の第1の変形例における2枚目のRAW画像の出力までのイメージセンサ200の動作の一例を示すタイミングチャートである。
CPU216は、タイミングT13乃至T14の期間内にDNN2を選択し、レジスタに設定する。そして、タイミングT15乃至T17の期間において、アナログデジタル変換部212が、AD変換により2枚目のRAW画像を生成する。
図30は、本技術の実施の形態の第1の変形例における2枚目に対応する出力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。
タイミングT18乃至T23の期間内に、デジタル信号処理部219は、2枚目の入力テンソルをSRAM215から読み出し、その入力テンソルに対する画像認識処理をDNN2を用いて行う。また、デジタル信号処理部219は、タイミングT22において、SRAM215に、DNN2に対応する出力テンソルを書き戻す。
DNN2に対応する入力テンソルおよび出力テンソルのそれぞれには、DNN2を示すネットワークIDを含むヘッダが付加される。
図27乃至図30に例示したように、最初のフレーム期間内にイメージセンサ200は、DNN1を実行し、次のフレーム期間内にDNN2を実行する。以降は、同様の処理が繰り返し実行される。このように、2フレームの周期で、DNN1およびDNN2が交互に実行される。なお、イメージセンサ200は、3つ以上のM個のDNNを1つずつ順番に、Mフレームの周期で実行することもできる。これらの複数のDNNの実行により、単一のDNNを用いる場合よりもシステムの汎用性や利便性が向上する。
このように、本技術の実施の形態の第1の変形例によれば、デジタル信号処理部219は、ストリーム中に複数のDNNを1つずつ順に実行するため、単一のDNNを実行する場合と比較して、システムの汎用性や利便性を向上させることができる。
<3.第2の変形例>
上述の実施の形態では、デジタル信号処理部219が1フレーム期間(すなわち、垂直同期信号の周期)内にDNNによる画像認識処理を完了していた。しかしながら、画像認識処理の実行時間は、DNNのアルゴリズムにより異なり、1フレーム期間内に完了しないことがある。この実施の形態の第2の変形例のイメージセンサ200は、入力テンソルが生成されたフレーム期間の経過後に、その入力テンソルに対応する出力テンソルを出力する点において実施の形態と異なる。
図31は、本技術の実施の形態の第2の変形例における1枚目の入力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。タイミングT4までの期間内に、1枚目のRAW画像が出力される。
タイミングT5においてデジタル信号処理部219は、1枚目の入力テンソルに対する画像認識処理を開始する。この画像認識処理は、最初のフレーム期間内に完了しないものとする。
また、タイミングT7乃至T8の期間に、DMAコントローラ(不図示)は、レジスタの設定に従って、SRAM215から出力インターフェース252へ1枚目の入力テンソルをDMA転送する。この入力テンソルに付加されるヘッダは、「0」以外が設定された有効フラグと、「1」が設定された持続性フラグと、1枚目に対応する値(例えば、「0」)のフレームカウンタとを含む。
また、タイミングT11乃至T12の期間に、DMAコントローラは、レジスタの設定に従って、SRAM215から出力インターフェース252へ、無効な出力テンソルをDMA転送する。この出力テンソルに含まれるヘッダは、「0」が設定された有効フラグを含む。
図32は、本技術の実施の形態の第2の変形例における2枚目のRAW画像の出力までのイメージセンサの動作の一例を示すタイミングチャートである。タイミングT15乃至T17の期間において、アナログデジタル変換部212が、AD変換により2枚目のRAW画像を生成する。前処理後の2枚目の入力テンソルは、この時点ではSRAM215に書き込まれない。
図33は、本技術の実施の形態の第2の変形例における1枚目に対応する出力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。デジタル信号処理部219は、SRAM215から1枚目の入力テンソルを削除する。
タイミングT20乃至T21の期間に、DMAコントローラ(不図示)は、レジスタの設定に従って、SRAM215から出力インターフェース252へ、無効な入力テンソルをDMA転送する。この入力テンソルに含まれるヘッダは、「0」が設定された有効フラグを含む。このタイミングT21の直後に、2枚目の入力テンソルがSRAM215の入力テンソルメモリ領域に上書きされる。すなわち、DNNの実行が完了する前に、入力テンソルメモリ領域が上書きされる。
また、デジタル信号処理部219は、タイミングT22において、SRAM215に出力テンソルを書き戻し、タイミングT23において、CPU216に画像認識処理の終了を通知する。そして、タイミングT24乃至T25の期間に、DMAコントローラは、レジスタの設定に従って、SRAM215から出力インターフェース252へ出力テンソルをDMA転送する。この出力テンソルに付加されるヘッダは、「0」以外が設定された有効フラグと、1枚目に対応する値(例えば、「0」)のフレームカウンタとを含む。
図31乃至図33に例示したように、DNNが1フレーム期間内に完了しないことがある。この場合、DNNの実行が開始されたフレーム期間内にRAW画像および入力テンソルのみが出力され、出力テンソルは、そのフレーム期間が経過した後(例えば、次のフレーム)に出力される。なお、DNNが完了するまでに2フレーム期間以上を要する場合、イメージセンサ200は、タイミングT26の後に出力テンソルを出力することもできる。
ヘッダが持続性フラグを含むため、アプリケーションプロセッサ120は、そのフラグを参照して、入力テンソルが出力されるフレームと、出力テンソルが出力されるフレームとが異なることを把握することができる。
なお、フレーム期間内にDNNが完了しないケースが想定されない場合には、ヘッダから持続性フラグを削減することができる。
また、入力テンソルおよび出力テンソルのヘッダが有効フラグを含むため、最初のフレーム期間内の出力テンソルと、次のフレーム期間内の入力テンソルとを無効にし、システムの誤動作を防止することができる。
なお、フレーム期間内にDNNが完了しないケースが想定されない場合には、ヘッダから有効フラグを削減することができる。
また、入力テンソルのヘッダ内のフレームカウントと、その入力テンソルに対応する出力テンソルのヘッダ内のフレームカウントとが同一に設定される。これにより、フレーム期間内にDNNが完了しない場合であっても、アプリケーションプロセッサ120は、フレームカウントを参照して、出力テンソルに対応する入力テンソルを特定することができる。
なお、フレーム期間内にDNNが完了しないケースが想定されない場合には、ヘッダからフレームカウントを削減することができる。また、フレーム期間内にDNNが完了しない場合であっても、アプリケーションプロセッサ120が、DNNが完了するタイミングを推定することができる場合、ヘッダからフレームカウントを削減することができる。
上述のように、持続性フラグ、有効フラグおよびフレームカウントをヘッダが含むため、アプリケーションプロセッサ120は、それらを参照して1フレーム期間内にDNNが完了しないケースに対応することができる。
このように、本技術の第2の変形例によれば、ヘッダ内に持続性フラグ、有効フラグおよび持続性フラグを含むため、情報処理システムは、1フレーム期間内にDNNが完了しないケースに対応することができる。
<4.第3の変形例>
上述の実施の形態の第2の変形例では、RAW画像(フレーム)をSRAM215内に保持している間(言い換えれば、キャプチャ中)にデジタル信号処理部219がDNNの実行を継続していた。しかし、この構成では、キャプチャ中に、DNNの実行によるメモリアクセスが発生することがあり、そのメモリアクセスに起因してバンドノイズが生じるおそれがある。この実施の形態の第3の変形例のイメージセンサ200は、キャプチャ中に、DNNの実行を中断する点において第2の変形例と異なる。
図34は、本技術の実施の形態の第3の変形例における1枚目の入力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。
タイミングT5乃至T10の期間内に、デジタル信号処理部219は、入力テンソルをSRAM215から読み出し、入力テンソルに対する画像認識処理をDNNを用いて行う。CPU216は、タイミングT9において、デジタル信号処理部219に画像認識処理の中断を指示し、タイミングT10において、デジタル信号処理部219は、画像認識処理を中断して中断完了をCPU216に通知する。
また、タイミングT7乃至T8の期間に、DMAコントローラ(不図示)は、レジスタの設定に従って、SRAM215から出力インターフェース252へ1枚目の入力テンソルをDMA転送する。この入力テンソルに付加されるヘッダは、「0」以外が設定された有効フラグと、「1」が設定された持続性フラグと、1枚目に対応する値(例えば、「0」)のフレームカウンタとを含む。
そして、CPU216は、タイミングT10乃至T11の期間に、DMA転送のための設定を行う。タイミングT11乃至T12の期間に、DMAコントローラは、その設定に従って、SRAM215から出力インターフェース252へ無効な出力テンソルをDMA転送する。この出力テンソルに含まれるヘッダは、「0」が設定された有効フラグを含む。
図35は、本技術の実施の形態の第3の変形例における2枚目のRAW画像の出力までのイメージセンサの動作の一例を示すタイミングチャートである。
タイミングT15乃至T17の期間において、アナログデジタル変換部212が、AD変換によりRAW画像を生成する。画像信号処理部214(不図示)およびハードウェアアクセラレータ217は、2枚目のRAW画像に対して各種の画像処理を前処理として行い、2枚目の入力テンソルを生成する。この前処理において、画像信号処理部214は、SRAM215にRAW画像を一時的に保持(キャプチャ)する。このタイミングT15乃至T17の期間を以下、キャプチャ期間と称する。このキャプチャ期間内は、DNNによる画像認識処理が中断しているため、バンドノイズが抑制される。なお、前処理後の2枚目の入力テンソルは、この時点ではSRAM215に書き込まれない。
図36は、本技術の実施の形態の第3の変形例における1枚目に対応する出力テンソルの出力までのイメージセンサの動作の一例を示すタイミングチャートである。
キャプチャ期間経過後のタイミングT18において、CPU216は、デジタル信号処理部219に、中断するまでの計算履歴を供給し、画像認識処理の再開を指示する。デジタル信号処理部219は、画像認識処理を再開し、タイミングT22において、SRAM215にDNN2に対応する出力テンソルを書き戻す。
また、タイミングT20乃至T21の期間に、DMAコントローラ(不図示)は、レジスタの設定に従って、SRAM215から出力インターフェース252へ、無効な入力テンソルをDMA転送する。この入力テンソルに含まれるヘッダは、「0」が設定された有効フラグを含む。このタイミングT21の直後に、2枚目の入力テンソルがSRAM215の入力テンソルメモリ領域に上書きされる。すなわち、DNNの実行が完了する前に、入力テンソルメモリ領域が上書きされる。
そして、タイミングT24乃至T25の期間に、DMAコントローラは、その設定に従って、SRAM215から出力インターフェース252へ出力テンソルをDMA転送する。この出力テンソルに付加されるヘッダは、「0」以外が設定された有効フラグと、1枚目に対応する値(例えば、「0」)のフレームカウンタとを含む。
図34乃至図36に例示したように、デジタル信号処理部219は、フレームをSRAM215に保持するキャプチャ期間の開始前に画像認識処理を中断し、キャプチャ期間の経過後に画像認識処理を再開する。これにより、キャプチャ中に、DNNの実行によるメモリアクセスが発生することが無くなり、そのメモリアクセスに起因するバンドノイズを抑制することができる。
なお、実施の形態の第2、第3の変形例に、第1の変形例を適用することもできる。この場合、例えば、4フレームの周期のうち2フレームでDNN1が実行され、残りの2フレームでDNN2が実行される。
このように、本技術の第3の変形例によれば、デジタル信号処理部219は、キャプチャ期間の開始前に画像認識処理を中断し、キャプチャ期間の経過後に再開するため、キャプチャ中に、DNNの実行によるメモリアクセスが発生することが無くなる。これにより、キャプチャ中のメモリアクセスに起因するバンドノイズを抑制することができる。
なお、上述の実施の形態は本技術を具現化するための一例を示したものであり、実施の形態における事項と、特許請求の範囲における発明特定事項とはそれぞれ対応関係を有する。同様に、特許請求の範囲における発明特定事項と、これと同一名称を付した本技術の実施の形態における事項とはそれぞれ対応関係を有する。ただし、本技術は実施の形態に限定されるものではなく、その要旨を逸脱しない範囲において実施の形態に種々の変形を施すことにより具現化することができる。
なお、本明細書に記載された効果はあくまで例示であって、限定されるものではなく、また、他の効果があってもよい。
なお、本技術は以下のような構成もとることができる。
(1)出力テンソルのフォーマットが異なる複数のDNN(Deep Neural Network)のいずれかを選択する処理部と、
前記選択されたDNNを用いて入力テンソルに対する画像認識処理を行って前記出力テンソルを生成するデジタル信号処理部と、
前記生成された出力テンソルをデコードするためのデコードパラメータと前記出力テンソルとを出力する出力インターフェースと
を具備する固体撮像素子。
(2)前記複数のDNNのそれぞれを前記デジタル信号処理部に実行させるためのパラメータをDNNパラメータとして受け取る入力インターフェースをさらに具備し、
前記デジタル信号処理部は、前記DNNパラメータに基づいて前記画像認識処理を行う
前記(1)記載の固体撮像素子。
(3)前記出力インターフェースは、前記入力テンソルをさらに出力する
前記(1)または(2)に記載の固体撮像素子。
(4)前記入力テンソルを所定の領域に記憶するメモリをさらに具備し、
前記出力インターフェースは、前記メモリから読み出された前記入力テンソルを出力し、
前記デコードパラメータは、前記画像認識処理が完了するまでに、前記領域が上書きされるべきでないか否かを示す持続性フラグを含む
前記(3)記載の固体撮像素子。
(5)前記出力インターフェースは、それぞれにヘッダが付加された前記入力テンソルおよび前記出力テンソルを出力する
前記(3)または(4)に記載の固体撮像素子。
(6)前記入力テンソルに付加された前記ヘッダは、前記入力テンソルが有効であるか否かを示す有効フラグを含み、
前記出力テンソルに付加された前記ヘッダは、前記出力テンソルが有効であるか否かを示す有効フラグを含む
前記(5)記載の固体撮像素子。
(7)前記入力テンソルに付加された前記ヘッダと、前記入力テンソルに対応する出力テンソルに付加された前記ヘッダとは、同一の値のフレームカウントを含む
前記(5)または(6)に記載の固体撮像素子。
(8)前記入力テンソルは、第1および第2の入力テンソルを含み、
前記複数のDNNは、第1および第2のDNNを含み、
前記デジタル信号処理部は、前記第1の入力テンソルに対して前記第1のDNNを使用し、前記第2の入力テンソルに対して前記第2のDNNを使用する
前記(1)から(7)のいずれかに記載の固体撮像素子。
(9)前記デジタル信号処理部は、前記入力テンソルに対する画像認識処理を行って前記出力テンソルを生成し、
前記出力インターフェースは、前記入力テンソルが生成される所定のフレーム期間の経過後に前記出力テンソルを出力する
前記(1)から(8)のいずれかに記載の固体撮像素子。
(10)前記デジタル信号処理部は、フレームをメモリに保持するキャプチャ期間の開始前に前記画像認識処理を中断し、前記キャプチャ期間の経過後に前記画像認識処理を再開する
前記(9)記載の固体撮像素子。
(11)入力テンソルに対する画像認識処理により生成された出力テンソルと、
出力テンソルをデコードするためのデコードパラメータと
を含むメタデータ。
(12)出力テンソルのフォーマットが異なる複数のDNN(Deep Neural Network)のいずれかを選択する処理部と、
前記選択されたDNNを用いて入力テンソルに対する画像認識処理を行って前記出力テンソルを生成するデジタル信号処理部と、
前記生成された出力テンソルをデコードするためのデコードパラメータと前記出力テンソルとを出力する出力インターフェースと、
前記デコードパラメータを用いて前記出力された出力テンソルをデコードするアプリケーションプロセッサと
を具備する撮像装置。
(13)出力テンソルのフォーマットが異なる複数のDNN(Deep Neural Network)のいずれかを選択する処理部と、
前記選択されたDNNを用いて入力テンソルに対する画像認識処理を行って前記出力テンソルを生成するデジタル信号処理部と、
前記生成された出力テンソルをデコードするためのデコードパラメータと前記出力テンソルとを出力する出力インターフェースと、
前記複数のDNNのそれぞれに対応する前記デコードパラメータを受け取る入力インターフェースと、
前記デコードパラメータのそれぞれを生成して前記入力インターフェースに供給するコンバータと
を具備する情報処理システム。
100 撮像装置
110 光学部
120 アプリケーションプロセッサ
121、123、251、254、256 入力インターフェース
122、124、252、253、255 出力インターフェース
130 フラッシュメモリ
200 イメージセンサ
211 画素アレイ
212 アナログデジタル変換部
213 露光制御部
214 画像信号処理部
215 SRAM
216 CPU
217 ハードウェアアクセラレータ
218 セレクタ
219 デジタル信号処理部
300 DNNコンバーター

Claims (13)

  1. 出力テンソルのフォーマットが異なる複数のDNN(Deep Neural Network)のいずれかを選択する処理部と、
    前記選択されたDNNを用いて入力テンソルに対する画像認識処理を行って前記出力テンソルを生成するデジタル信号処理部と、
    前記生成された出力テンソルをデコードするためのデコードパラメータと前記出力テンソルとを出力する出力インターフェースと
    を具備する固体撮像素子。
  2. 前記複数のDNNのそれぞれを前記デジタル信号処理部に実行させるためのパラメータをDNNパラメータとして受け取る入力インターフェースをさらに具備し、
    前記デジタル信号処理部は、前記DNNパラメータに基づいて前記画像認識処理を行う
    請求項1記載の固体撮像素子。
  3. 前記出力インターフェースは、前記入力テンソルをさらに出力する
    請求項1記載の固体撮像素子。
  4. 前記入力テンソルを所定の領域に記憶するメモリをさらに具備し、
    前記出力インターフェースは、前記メモリから読み出された前記入力テンソルを出力し、
    前記デコードパラメータは、前記画像認識処理が完了するまでに、前記領域が上書きされるべきでないか否かを示す持続性フラグを含む
    請求項3記載の固体撮像素子。
  5. 前記出力インターフェースは、それぞれにヘッダが付加された前記入力テンソルおよび前記出力テンソルを出力する
    請求項3記載の固体撮像素子。
  6. 前記入力テンソルに付加された前記ヘッダは、前記入力テンソルが有効であるか否かを示す有効フラグを含み、
    前記出力テンソルに付加された前記ヘッダは、前記出力テンソルが有効であるか否かを示す有効フラグを含む
    請求項5記載の固体撮像素子。
  7. 前記入力テンソルに付加された前記ヘッダと、前記入力テンソルに対応する出力テンソルに付加された前記ヘッダとは、同一の値のフレームカウントを含む
    請求項5記載の固体撮像素子。
  8. 前記入力テンソルは、第1および第2の入力テンソルを含み、
    前記複数のDNNは、第1および第2のDNNを含み、
    前記デジタル信号処理部は、前記第1の入力テンソルに対して前記第1のDNNを使用し、前記第2の入力テンソルに対して前記第2のDNNを使用する
    請求項1記載の固体撮像素子。
  9. 前記デジタル信号処理部は、前記入力テンソルに対する画像認識処理を行って前記出力テンソルを生成し、
    前記出力インターフェースは、前記入力テンソルが生成される所定のフレーム期間の経過後に前記出力テンソルを出力する
    請求項1記載の固体撮像素子。
  10. 前記デジタル信号処理部は、フレームをメモリに保持するキャプチャ期間の開始前に前記画像認識処理を中断し、前記キャプチャ期間の経過後に前記画像認識処理を再開する
    請求項9記載の固体撮像素子。
  11. 入力テンソルに対する画像認識処理により生成された出力テンソルと、
    出力テンソルをデコードするためのデコードパラメータと
    を含むメタデータ。
  12. 出力テンソルのフォーマットが異なる複数のDNN(Deep Neural Network)のいずれかを選択する処理部と、
    前記選択されたDNNを用いて入力テンソルに対する画像認識処理を行って前記出力テンソルを生成するデジタル信号処理部と、
    前記生成された出力テンソルをデコードするためのデコードパラメータと前記出力テンソルとを出力する出力インターフェースと、
    前記デコードパラメータを用いて前記出力された出力テンソルをデコードするアプリケーションプロセッサと
    を具備する撮像装置。
  13. 出力テンソルのフォーマットが異なる複数のDNN(Deep Neural Network)のいずれかを選択する処理部と、
    前記選択されたDNNを用いて入力テンソルに対する画像認識処理を行って前記出力テンソルを生成するデジタル信号処理部と、
    前記生成された出力テンソルをデコードするためのデコードパラメータと前記出力テンソルとを出力する出力インターフェースと、
    前記複数のDNNのそれぞれに対応する前記デコードパラメータを受け取る入力インターフェースと、
    前記デコードパラメータのそれぞれを生成して前記入力インターフェースに供給するコンバータと
    を具備する情報処理システム。
JP2020122492A 2020-07-17 2020-07-17 固体撮像素子、撮像装置、および、情報処理システム Pending JP2022018997A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020122492A JP2022018997A (ja) 2020-07-17 2020-07-17 固体撮像素子、撮像装置、および、情報処理システム
US18/004,769 US20230260244A1 (en) 2020-07-17 2021-05-18 Solid-state imaging element, imaging device, and information processing system
PCT/JP2021/018717 WO2022014141A1 (ja) 2020-07-17 2021-05-18 固体撮像素子、撮像装置、および、情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020122492A JP2022018997A (ja) 2020-07-17 2020-07-17 固体撮像素子、撮像装置、および、情報処理システム

Publications (1)

Publication Number Publication Date
JP2022018997A true JP2022018997A (ja) 2022-01-27

Family

ID=79554692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020122492A Pending JP2022018997A (ja) 2020-07-17 2020-07-17 固体撮像素子、撮像装置、および、情報処理システム

Country Status (3)

Country Link
US (1) US20230260244A1 (ja)
JP (1) JP2022018997A (ja)
WO (1) WO2022014141A1 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6356552B2 (ja) * 2014-09-16 2018-07-11 東芝メモリ株式会社 情報処理装置
US10037490B2 (en) * 2016-12-13 2018-07-31 Google Llc Performing average pooling in hardware
JP6697042B2 (ja) * 2018-08-31 2020-05-20 ソニーセミコンダクタソリューションズ株式会社 固体撮像システム、固体撮像方法及びプログラム
JP6705533B2 (ja) * 2018-10-19 2020-06-03 ソニー株式会社 センサ装置、パラメータ設定方法
BR112019008055B1 (pt) * 2018-10-24 2022-02-01 Advanced New Technologies Co., Ltd Método implementado por computador, meio não transitório, legível por computador e sistema implementado por computador
JP7099292B2 (ja) * 2018-12-11 2022-07-12 日本電信電話株式会社 画像生成装置、画像生成方法、及びプログラム

Also Published As

Publication number Publication date
WO2022014141A1 (ja) 2022-01-20
US20230260244A1 (en) 2023-08-17

Similar Documents

Publication Publication Date Title
JP4426099B2 (ja) 共有メモリを有するマルチプロセッサ装置
US10282805B2 (en) Image signal processor and devices including the same
JP2005202767A (ja) プロセッサシステム、dma制御回路、dma制御方法、dmaコントローラの制御方法、画像処理方法および画像処理回路
JP2012120159A (ja) 送信装置、送信方法、受信装置、受信方法、およびプログラム
US8581913B2 (en) Data processing apparatus and image processing apparatus
CN101753820A (zh) 信息处理装置、缓冲器控制方法和计算机程序
US11758284B2 (en) Image processors and image processing methods
US20220114120A1 (en) Image processing accelerator
JP2021061036A (ja) ベクトルプロセッサ
JP5648135B2 (ja) タイミング発生器およびタイミング信号を発生させる方法
WO2022014141A1 (ja) 固体撮像素子、撮像装置、および、情報処理システム
US8436915B2 (en) Image processing apparatus
US10448020B2 (en) Intelligent MSI-X interrupts for video analytics and encoding
JP2008172410A (ja) 撮像装置、画像処理装置、画像処理方法、画像処理方法のプログラム及び画像処理方法のプログラムを記録した記録媒体
US20100110213A1 (en) Image processing processor, image processing method, and imaging apparatus
JP5379223B2 (ja) 情報処理装置
CN112449137A (zh) 基于移动产业处理器接口的数据传输系统及数据传输方法
JP2006094400A (ja) 画像処理装置および画像処理方法
WO2021152974A1 (ja) 撮像素子、撮像装置、撮像素子の作動方法、及びプログラム
JP2019074573A (ja) 画像処理装置
WO2024000352A1 (en) Methods and apparatus to improve camera image quality
JP2009104529A (ja) 情報処理装置、音声付動画記録装置及び情報処理方法
JP5429873B2 (ja) ビデオフレームdma制御システム
CN117201891A (zh) 多媒体数据处理装置与多媒体数据处理方法
JP6205980B2 (ja) 画像転送装置及び画像転送方法