JP2021064882A - 認識装置、認識方法 - Google Patents

認識装置、認識方法 Download PDF

Info

Publication number
JP2021064882A
JP2021064882A JP2019188861A JP2019188861A JP2021064882A JP 2021064882 A JP2021064882 A JP 2021064882A JP 2019188861 A JP2019188861 A JP 2019188861A JP 2019188861 A JP2019188861 A JP 2019188861A JP 2021064882 A JP2021064882 A JP 2021064882A
Authority
JP
Japan
Prior art keywords
conversion
recognition
unit
sensor
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019188861A
Other languages
English (en)
Other versions
JP7348805B2 (ja
JP2021064882A5 (ja
Inventor
野村 修
Osamu Nomura
修 野村
加藤 政美
Masami Kato
政美 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019188861A priority Critical patent/JP7348805B2/ja
Publication of JP2021064882A publication Critical patent/JP2021064882A/ja
Publication of JP2021064882A5 publication Critical patent/JP2021064882A5/ja
Application granted granted Critical
Publication of JP7348805B2 publication Critical patent/JP7348805B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Transforming Light Signals Into Electric Signals (AREA)
  • Image Analysis (AREA)

Abstract

【課題】認識処理において行われる処理に適したデータ変換を実現可能な技術を提供する。【解決手段】認識装置は、センサ回路部10と、該センサ回路部10から出力されたデータを変換する変換回路部20と、該変換回路部20が変換したデータに基づいて認識処理を行うCNN回路部30とを備える。、該変換回路部20の変換特性は、該認識処理のパラメータの学習処理に基づいて決定される。【選択図】図1

Description

本発明は、認識技術に関するものである。
認識機能を実現する手法として、認識対象とするデータに対し、学習処理によりパラメータを決定した認識処理を実行するものが広く提案されている。ここで、「学習処理によりパラメータを決定した認識処理」としては、例えばニューラルネットワーク技術を応用したものが知られている。
ニューラルネットワーク技術を応用したものの例としては、階層型畳み込みニューラルネットワークがあり、認識対象の変動に対して頑健なパターン認識を可能にする技術として知られている。このような技術を適用した例として、特許文献1に、画像データを用いた顔認識を行う技術が提案されている。
これらの認識処理を応用した認識装置においては、一般的にイメージセンサを内蔵するカメラにより取得した画像データや、音声センサを内蔵するマイクロホンにより取得した音声データを、認識処理に対する入力として、認識処理を行う。
例えば、画像データに関しては、カメラに内蔵されたイメージセンサによって取得したセンサデータに対して所定の変換処理を適用し、変換後の画像データを認識処理に入力する。変換処理としては、カメラ内で実行されるA/D変換処理、ノイズ除去処理、および現像処理が含まれる。また音声データに関しても、音声センサからの出力データに対して、A/D変換処理を含む所定の変換処理を実行して音声データに変換した後に、認識処理に入力する。この場合、認識処理に入力される画像または音声等のデータは、一般的にはヒトの視覚機能または聴覚機能に適した変換処理が施されたデータとなる。
また一方で、センサから出力されるデータに対する変換処理を適応的に制御する技術が提案されている。例えば、特許文献2には、A/D変換特性を温度に関わらず基準変換特性に近づけるように補正するために、温度に基づいて基準電圧特性を制御する方法が開示されている。具体的には、特許文献2では、センサから出力される信号をA/D変換する際に、周囲環境の温度変化によらず常に所定のA/D変換特性を実現可能にする、基準電圧特性の制御方法を提供する。
特開平10−021406号公報 特開2011−229102号公報
以上説明したように、センサで取得した信号に対して所定の変換処理を実行したデータを入力データとし、学習処理により決定したパラメータに基づいて認識処理を実行する認識装置が提案されている。
しかしながら上記の提案の場合、認識処理に入力される画像または音声等のデータは、センサで取得した信号に対して、ヒトの視覚機能または聴覚機能に適したデータに変換する変換処理が施されたデータであり、認識処理にて行われる処理に適した変換処理が施されたものではない。また、前述したように、センサで取得した信号に対して、所定の特性を満たすようにA/D変換特性を制御する方法が提案されているものの、この提案は、該信号に対して、認識処理で実行する処理に適するようにA/D変換特性を制御するものではなかった。本発明では、認識処理において行われる処理に適したデータ変換を実現可能な技術を提供する。
本発明の一様態は、センサ部と、前記センサ部から出力されたデータを変換する変換部と、前記変換部が変換したデータに基づいて認識処理を行う認識部とを備え、前記変換部の変換特性は、前記認識処理のパラメータの学習処理に基づいて決定されることを特徴とする。
本発明の構成によれば、認識処理において行われる処理に適したデータ変換を実行することができる。
認識装置のハードウェア構成例を示すブロック図。 認識装置の動作を示すフローチャート。 変換回路部20の詳細を説明する図。 変換回路部20の詳細を説明する図。 変換回路部20の詳細を説明する図。 基準電圧波形の電圧特性の一例を示す図。 A/D変換回路21aにおける入出力特性の一例を示す図。 CNNの畳み込み演算層で実行される演算処理の一例を示す図。 バックプロパゲーション処理を説明する図。 基準電圧波形の電圧特性の一例を示す図。 基準電圧波形の電圧特性の一例を示す図。 変換回路部20の詳細を説明する図。 認識装置の構成例を示す図。 認識装置のハードウェア構成例を示すブロック図。
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
[第1の実施形態]
先ず、本実施形態に係る認識装置のハードウェア構成例について、図1のブロック図を用いて説明する。図1に示す如く、本実施形態に係る認識装置は、入力画像に対し、階層型畳み込みニューラルネットワーク演算回路を用いた2次元の畳み込み演算を行うことで、該入力画像から特定の物体を認識する認識処理を実現する。
図1に示す如く、本実施形態に係る認識装置は、センサ回路部10、変換回路部20、RAM102,CNN回路部30、ブリッジ100、DMAC(Direct Memory Access Controller)101を有する。また、本実施形態に係る認識装置は、CPU103、ROM104、RAM105を有する。
センサ回路部10、変換回路部20、CNN回路部30、RAM102、DMAC101が画像バス106を介して互いに接続されており、CPU103、ROM104、RAM105がCPUバス107を介して互いに接続されている。また、ブリッジ100を介して画像バス106とCPUバス107との間のデータ転送が可能となっている。
センサ回路部10は、光学系、CMOS(Complementary Metal Oxide Semiconductor)センサ等の光電変換デバイス、該光電変換デバイスを制御するドライバー回路、を有するセンサ部である。光学系を介して入光した光は光電変換デバイスにてアナログ画像信号(アナログ画像データ)に変換され、該アナログ画像データは変換回路部20に対して出力される。
変換回路部20は、A/D変換回路及びフレームバッファを有する変換部である。センサ回路部10から出力されたアナログ画像データはA/D変換回路にてディジタル画像データ(ディジタル画像信号)に変換され、該変換されたディジタル画像データはフレームバッファに格納される。センサ回路部10からフレーム単位でアナログ画像データが出力される場合、変換回路部20は、該フレーム単位のアナログ画像データをディジタル画像データに変換してフレームバッファに格納する。つまり、フレームバッファには、フレーム単位でディジタル画像データが格納されている。
CNN回路部30は、階層型畳み込みニューラルネットワーク(以下、CNNと称する)の演算処理を行う回路(階層型畳み込みニューラルネットワーク演算回路)である。CNN回路部30は、変換回路部20のフレームバッファに格納されているディジタル画像データをフレーム単位で読み出す。そしてCNN回路部30は、該読み出したディジタル画像データをCNNに入力して該CNNの演算処理を行うことで、該ディジタル画像データが表すフレーム画像から、認識対象となる物体を認識する。つまりCNN回路部30は認識部として機能する。RAM102は、CNN回路部30が各種の処理を行う際に用いる演算作業バッファとして使用される。DMAC101は、画像バス106上の変換回路部20、CNN回路部30、CPUバス107の間のデータ転送を司る。
CPU103は、ROM104からRAM105にロードしたコンピュータプログラムやデータを用いて認識装置全体の動作制御を行うと共に、認識装置が行うものとして後述する各処理を実行若しくは制御する。なお、CPU103は、ブリッジ100を介して画像バス106上のRAM102にアクセスすることも可能である。
ROM104には、各種のコンピュータプログラムやデータが格納されている。ROM104に格納されているコンピュータプログラムには、CPU103の動作を規定する命令を含むコンピュータプログラムが含まれている。また、ROM104に格納されているデータには、CNN回路部30の動作パラメータが含まれている。このように、ROM104には、認識装置が行うものとして後述する各処理を実現させるためのコンピュータプログラムやデータが格納されている。
RAM105は、ROM104からロードされたコンピュータプログラムやデータを格納するためのエリアや、CPU103が各種の処理を実行する際に用いるワークエリアを有する。このようにRAM105は、各種のエリアを適宜提供することができる。
次に、本実施形態に係る認識装置の動作について、図2のフローチャートに従って説明する。ステップS50では、CPU103は、物体の認識処理の開始に先立ち、各種の初期化処理を実行する。例えば、CPU103は、CNN回路部30の動作に必要なCNNの重み係数をROM104からRAM102に転送すると共に、CNN回路部30の動作、即ちCNNの構成を定義する為の各種レジスタ設定を行う。具体的には、CNN回路部30の制御部に存在する複数のレジスタに所定の値を設定する。同様に、変換回路部20等のレジスタに対しても動作に必要な値を書き込む。
ステップS51では、センサ回路部10は、光学系を介して入光した光を光電変換デバイスにてアナログ画像データに変換し、該変換したアナログ画像データを変換回路部20に対して出力する。
ステップS52では、変換回路部20は、センサ回路部10から出力されたアナログ画像データをA/D変換回路にてディジタル画像データに変換し、該ディジタル画像データをフレームバッファに格納する。変換回路部20は、1フレーム分のアナログ画像データをディジタル画像データに変換してフレームバッファに格納する処理が完了すると、完了信号を有効にする。
ステップS53およびステップS54の処理は、完了信号が有効になると実行される。ステップS53では、CNN回路部30は、フレームバッファに格納されている1フレーム分のディジタル画像データを読み出し、該読み出したディジタル画像データをCNNに入力して該CNNの各特徴面について演算処理(畳み込み演算処理)を行う。この畳み込み演算処理は、例えば図8に示す如く、特徴面34単位で行う。なお、畳み込み演算処理の内容については後述する。
ステップS54では、CNN回路部30は、CNNにおける全ての特徴面について畳み込み演算処理を行ったか否かを判断する。この判断の結果、CNNにおける全ての特徴面について畳み込み演算処理を行った場合(図3の場合、最終出力面41の算出を終了した場合)には、処理はステップS55に進む。一方、CNNにおいて未だ畳み込み演算処理を行っていない特徴面が残っている場合には、処理はステップS53に進み、CNN回路部30は、未だ畳み込み演算処理を行っていない特徴面について畳み込み演算処理を行う。
ステップS55では、CNN回路部30は、CPU103に対して割り込み信号を出力する。ステップS56では、CPU103は、認識処理を終了するための条件が満たされたか否かを判断する。例えば、認識処理を終了する旨の指示がユーザ操作によって入力された場合や、フレームバッファに認識処理を行ったフレーム画像が残っていない場合には、上記の条件が満たされたと判断する。
このような判断の結果、認識処理を終了するための条件が満たされた場合には、図2のフローチャートに従った処理は終了する。一方、認識処理を終了するための条件が満たされていない場合には、処理はステップS51に進む。
次に、変換回路部20の詳細について、図3〜5を用いて説明する。図3は、センサ回路部10が有する光電変換デバイスの一例としてのセンサ素子回路11の構成、変換回路部20に含まれるA/D変換回路21a〜21c、CNN回路部30の構成、に関し、実行する処理と機能を説明するために模式的に示したものである。
センサ素子回路11は、フォトダイオードの2次元配列(センサ素子面)である。変換回路部20は、センサ素子回路11から列単位で並列に読み出した電圧をA/D変換して出力するべく、A/D変換回路21a〜21cを有する。A/D変換回路21a〜21cはそれぞれ、CNN回路部30にて実装されているCNNの入力特徴面31a〜31cにディジタル画像データを供給するべく設けられている。A/D変換回路21a〜21cのそれぞれの詳細な構成については図4を用いて後述する。
なお、CNN回路部30は、実際には半導体基板上の電子回路として構成されるが、図3では、実際の回路構成では無く、CNNによる畳み込み演算処理の処理内容を理解し易いように、実現する機能としてのCNNの構成を示している。
<ステップS60>
ステップS60における変換回路部20の動作について説明する。先ず、露光状態にあるセンサ素子回路11(センサ素子面)におけるそれぞれのフォトダイオードには、受光した光に応じた電荷が蓄積される。変換回路部20は、センサ素子回路11に蓄積されている電荷を電圧として読み出してA/D変換回路21a〜21cのそれぞれに入力する。センサ素子回路11からの電圧の読み出しは列単位で並列に行われるものとする。
図3では、センサ素子回路11から列単位で読み出された電圧が、CNN回路部30における入力特徴面31a〜31cのそれぞれについて設けられた、A/D変換回路21a〜21cに入力される様子を模式的に示している。実際には、A/D変換回路は、フォトダイオードの2次元配列における列の数だけ設けられ、フォトダイオードの2次元配列における各列の電圧が、対応するA/D変換回路に入力される。また、CNN回路部30における入力特徴面の数もまた、フォトダイオードの2次元配列における列の数だけ設けられ、着目列に対応するA/D変換回路からの出力は、着目列に対応する入力特徴面に入力される。
A/D変換回路21a〜21cの構成例を図4に示す。図4は、変換回路部20の構成例を示すブロック図である。A/D変換回路21aはコンパレータ22a、カウンタ23a、データラッチ回路24aを有する。A/D変換回路21bはコンパレータ22b、カウンタ23b、データラッチ回路24bを有する。A/D変換回路21cはコンパレータ22c、カウンタ23c、データラッチ回路24cを有する。以下ではA/D変換回路21aの動作について説明するが、同様の説明はA/D変換回路21bおよびA/D変換回路21cにも適用可能である。
コンパレータ22aには、A/D変換回路21aに入力された電圧が入力電圧として入力される。また、コンパレータ22aには、基準電圧生成回路25が生成した基準電圧波形も入力される。
<ステップS61>
次に、ステップS61における変換回路部20の動作について説明する。コンパレータ22aは、入力電圧と、基準電圧波形と、を比較する。基準電圧波形は、例えば、図6および以降に示す式(1)のように時間的に単調増加する電圧特性を有している。
現時点で、入力電圧と基準電圧波形とで電圧値が等しくない場合はステップS62を介してステップS61に戻り、入力電圧と基準電圧波形とで電圧値が等しくなった時点でステップS62を介してステップS63に進む。コンパレータ22aは、入力電圧と基準電圧波形とで電圧値が等しくなった時点で出力パルス信号を反転させる。
<ステップS63>
カウンタ23aは、基準電圧波形の開始タイミングから、クロック信号のパルス数をカウントした値(カウント値)を出力する。データラッチ回路24aは、コンパレータ22からの出力パルス信号が反転するタイミングで、カウンタ23から出力されるカウント値を保持する。これにより、入力電圧の電圧値がディジタル画像データとして変換される。然るにデータラッチ回路24aは、この変換したディジタル画像データをフレームバッファに保持しておき、所定の行数分のディジタル画像データが保持された時点で該所定の行数分のディジタル画像データをCNN回路部30の入力特徴面31aに出力する。
なお、上記の説明における「所定の行数」は、CNN回路部30における並列処理単位によって決定されるものであり、特定の値に限らない。本実施形態では一例として、センサ素子回路11の全面分(全行数分)のディジタル画像データがフレームバッファに格納された時点で、各行のディジタル画像データがCNN回路部30におけるそれぞれの入力特徴面に入力されるものとする。
次に、A/D変換回路21aの動作についてより詳細に説明する。上記の如く、A/D変換回路21aは、基準電圧波形の波形特性に応じてアナログ画像データ(読み出された電圧)をディジタル画像データに変換する。ここで、本実施形態では、基準電圧波形は以下の式(1)(図6)で示されるものとする。
Figure 2021064882
式(1)において、tは時間(カウンタ値に相当)を示し、vは基準電圧波形の電圧値を示す。パラメータα、β、γは基準電圧波形を規定するパラメータであり、後述するように、CNNのパラメータを決定するための学習処理において算出され、図3のA/D変換回路ごとに異なる値を取り得る。なお、A/D変換回路21aにおける入出力特性は、式(1)の逆関数として、以下の式(2)(図7)で示される。
Figure 2021064882
式(2)において、vinは入力アナログ電圧値を示し、doutは出力ディジタル値を示す。続いて、基準電圧波形のパラメータα、β、γおよびCNNのパラメータを算出する学習処理に関して説明を行う。まず、CNNの畳み込み演算層で実行される演算処理を図8および式(3)に示す。
Figure 2021064882
式(3)において、xは入力データ、yは出力データ、wは畳み込みフィルタ、vは畳み込みフィルタの高さ、hは畳み込みフィルタの幅、mは前段層特徴面インデックス、nは後段層特徴面インデックス、iは演算位置y座標、jは演算位置x座標を示す。また、kは畳み込みフィルタy座標、l(t)は畳み込みフィルタx座標を示す。
CNNにおいて、図8の階層33の特徴面34を算出する場合、式(3)において入力データは図8に示した階層32の特徴面35〜37となり、フィルタ38〜40による畳み込み演算を画素単位で走査しながら繰り返す。本実施形態では説明を省略するが、一般的には畳み込み演算結果に対して非線形変換を実行する。なお、CNNの演算処理は、一般的に良く知られた手法であるため、これ以上の詳細な説明を省略する。
続いて本実施形態では、CNNのパラメータw、bおよび基準電圧波形のパラメータα、β、γを一般的な学習処理であるバックプロパゲーション処理により算出する。図9に示す如く、バックプロパゲーション処理においては、損失関数として定義される、CNNの出力と期待値との誤差を認識処理実行時とは逆方向に伝搬させることでパラメータを学習する。なお学習処理は、認識装置とは別個の装置において行われる。またその際には、認識結果に対する正解情報が付与された、学習処理に用いるための、変換回路に対する入力データ(所望の被写体を撮像したセンサ回路からのアナログ電圧値に対応するデータ)が用意されているものとする。なお、学習用のデータ生成方法としては、一般的なカメラで撮像された認識結果に対する正解情報を有する画像に対して、現像処理等の画像処理の逆変換を適用する手法が考えられる。または、カメラで撮像する際に、画像処理を適用したヒトが視認可能な画像と共に、センサ回路からの出力電圧値を外部に読み出すことで、それぞれが対応する画像セットを生成することが出来る。認識結果に対する正解情報はヒトが視認可能な画像を用いて設定することにより、認識装置で必要となる学習データを生成することが可能となる。
まずCNNのパラメータw、bは、バックプロパゲーション処理に基づいて、それぞれ以下の式(4)および(5)に基づいて更新される。なお、以降の式において、EはCNNにおける損失関数を示している。
Figure 2021064882
Figure 2021064882
損失関数としては、一般的なバックプロパゲーション手法と同様に、どのような関数を用いても良いが、本実施形態では一例として以下の式(6)に示す、交差エントロピー誤差を用いる。
Figure 2021064882
式(6)において、kは教師データのインデックス、tは教師データ、yはCNNの最終層の出力値(認識結果)を示す。また上式において、各階層から逆伝搬される誤差は、以下の式(7)に基づいて算出される。
Figure 2021064882
一方、パラメータα、β、γは、バックプロパゲーション処理に基づいて、それぞれ以下の式(8)、式(9)、式(10)に基づいて更新される。
Figure 2021064882
Figure 2021064882
Figure 2021064882
以上のバックプロパゲーション処理により、パラメータの更新を、前述した学習処理用の入力データに対して繰り返し実行することで、入力データに基づく、認識処理に適したCNNのパラメータw、b及び基準電圧波形のパラメータα、β、γが算出される。
そして、算出された基準電圧波形のパラメータα、β、γを用いて式(1)に基づき基準電圧波形を事前に決定(取得)しておき、該基準電圧波形のデータ(波形データ)をルックアップテーブルの形式でROM104に保持しておく。そして認識装置において認識処理を実行する際には基準電圧生成回路25が、ルックアップテーブル形式の波形データを元にして、時間的に変化するアナログ電圧波形を基準電圧波形(変換特性)として生成し、該生成した基準電圧波形をコンパレータに供給する。
また、基準電圧波形の生成方法としては、ROM104内にパラメータα、β、γを保持しておき、基準電圧生成回路25がこれらのパラメータα、β、γを用いて式(1)に基づいて基準電圧波形を生成しても構わない。またCNNのパラメータw、bはROM104に保持され、認識処理実行時に随時、CNN回路部30に設定されて認識処理が実行される。
以上説明したように、本実施形態では、CNNの特徴面毎に、異なる基準電圧波形に基づいてA/D変換されたディジタル画像データが入力されることになる。それぞれの基準電圧波形は、前述したように学習処理によって決定したものであり、認識処理に適した特性を有するものである。従って、本実施形態に係る認識装置は、センサ素子回路の出力に対してより認識に適した変換処理を実行することが可能となり、また、本来認識処理に対しては必須では無い現像処理等の画像処理に関わる回路を削減することが可能となる。
<変形例 … 基準電圧波形の関数(線形関数)>
第1の実施形態では、基準電圧波形の波形特性として式(1)、(2)に示したものを用いたが、これらに限定されるものではない。例えば、以下の式(11)、(12)に示される波形特性を有する基準電圧波形を用いても構わないし、その他の波形特性を有する基準電圧波形を用いても構わない(それぞれの波形を図10および図11に示す)。
Figure 2021064882
Figure 2021064882
なお、式(11)、(12)で示される波形特性を有する基準電圧波形を用いる場合、そのパラメータα、βは、第1の実施形態と同様に、CNNの一般的な学習処理であるバックプロパゲーション処理により算出する。この場合、α、βはそれぞれ以下の式に基づいて更新される。
Figure 2021064882
Figure 2021064882
このように、本変形例においても、第1の実施形態と同様の効果を奏することができる。
[第2の実施形態]
本実施形態を含む以下の各実施形態では、第1の実施形態との差分について説明し、以下で特に触れない限りは、第1の実施形態と同様であるものとする。図12は、センサ素子回路11の構成と、変換回路部20に含まれるA/D変換回路70a、70b、71a、71bと、CNN回路部30の構成と、に関し、実行する処理と機能を説明するために模式的に示したものである。
入力特徴面31aを規定行数を単位に2つのブロック(上側のブロックは入力特徴面72a、下側のブロックは入力特徴面73a)に分割した場合において、入力特徴面72aについてはA/D変換回路70aが設けられている。また、入力特徴面73aについてはA/D変換回路71aが設けられている。
同様に、入力特徴面31bを規定行数を単位に2つのブロック(上側のブロックは入力特徴面72b、下側のブロックは入力特徴面73b)に分割した場合において、入力特徴面72bについてはA/D変換回路70bが設けられている。また、入力特徴面73bについてはA/D変換回路71bが設けられている。
このように、本実施形態では第1の実施形態と同様に、CNN回路部30における入力特徴面は、フォトダイオードの2次元配列における列の数だけ設けられているが、該入力特徴面は規定行数を単位に2つのブロックに分割されている。そして変換回路部20が有するA/D変換回路は、該ブロックごとに設けられている。
よって、図12の構成の場合、A/D変換回路70a、70b、71a、71bのそれぞれで独立に、基準電圧波形の波形特性を設定することが可能である。そして、センサ素子回路11において、入力特徴面31aに対応する列の上側のブロックに対応する行の電圧はA/D変換回路70aに入力され、該列の下側のブロックに対応する行の電圧はA/D変換回路71aに入力される。そしてA/D変換回路70aからの出力は入力特徴面72aに対して出力され、A/D変換回路71aからの出力は入力特徴面73aに対して出力される。同様に、センサ素子回路11において、入力特徴面31bに対応する列の上側のブロックに対応する行の電圧はA/D変換回路70bに入力され、該列の下側のブロックに対応する行の電圧はA/D変換回路71bに入力される。そしてA/D変換回路70bからの出力は入力特徴面72bに対して出力され、A/D変換回路71bからの出力は入力特徴面73bに対して出力される。なお、ブロックごとの波形特性のパラメータのバックプロパゲーションによる学習処理については、第1の実施形態と同様である。
このように、本実施形態によれば、センサ素子回路11によって撮像される領域において、それぞれのブロックにおける撮像環境が大きく異なる場合(例えば、画面上部と下部で明るさが大きく異なる場合)であっても、入力特徴面のブロックごとにA/D変換回路の基準電圧波形の波形特性を学習するので、それぞれの撮像環境に適した波形特性を得ることが可能となる。これにより、センサ素子回路11によって撮像される領域ごとに認識に適した変換処理を実行することが可能となる。
なお、本実施形態では、1つの入力特徴面を2つのブロックに分割する例について説明した。しかし、入力特徴面の分割数は2に限らず、3以上であっても良い。また、A/D変換回路は、前述した複数行のブロックごとに独立に設けることに限らず、どのような単位で設けても構わない。例えば、センサ素子回路11の画素回路ごとにA/D変換回路を設けても良いし、所定の画素回路領域ごとにA/D変換回路を設けても良い。このように、A/D変換における基準電圧波形の波形特性を認識に関わる学習処理によって決定することができれば、A/D変換回路はどのような単位で設けても良い。
これにより、独立に設けられるA/D変換回路に対応するセンサ素子回路11上の領域がどのような単位の領域であるのかに関わらず、領域ごとに認識に適した変換処理を実行することが可能となる。
また、A/D変換回路を独立に複数設けることに限らず、同一のA/D変換回路を時分割に複数回使用することで、異なる基準電圧波形の波形特性パラメータによる変換を実行するものであっても良い。この場合は、例えば、第1の実施形態で説明したルックアップテーブルに波形データを複数用意しておき、変換処理毎に異なる波形データに対応した基準電圧波形を基準電圧生成回路25にて生成してA/D変換回路に供給する。これにより、A/D変換回路を独立に複数設ける場合と同様に、センサ素子回路11によって撮像される領域ごとに認識に適した変換処理を実行することが可能となる。
[第3の実施形態]
本実施形態に係る認識装置は、図13に模式的に示すように積層された半導体基板に構成されており、その他の構成および処理内容は第1の実施形態と同様である。本実施形態に係る認識装置は、図13に示すように3次元的に積層された半導体基板として構成されている。認識装置を構成するそれぞれの回路については、図13に示す如く、階層80にセンサ素子回路11が構成され、階層81〜83のそれぞれには、変換回路部20、CNN回路部30が構成されている。階層81〜83の各階層に構成されたCNN回路部30は、それぞれ異なる入力特徴面に相当する(例えば、図3の3種類の入力特徴面)。
センサ素子回路11から出力される電圧は、階層ごとに構成された変換回路部20のA/D変換回路に並列に入力される。各階層間の信号の伝達は、TSV(シリコン貫通電極)84(図13における点線枠内)を介して行われる。A/D変換回路ごとに、学習処理により算出した波形特性に基づく基準電圧波形を用いてA/D変換回路を実行することは上記の各実施形態で説明した内容と同一である。
このように、本実施形態によれば、認識装置を構成する変換回路部20およびCNN回路部30が積層された半導体基板に構成されるため、並列処理を実現しつつ2次元的な回路面積を削減することが可能となる。
[第4の実施形態]
本実施形態に係る認識装置は、図14に示す如く、センサ回路部10がセンサ素子回路11の代わりにMEMS触覚センサ90を有する。本実施形態では、センサ素子回路11の列ごとの電圧が、該列に対応するA/D変換回路に入力される代わりに、MEMS触覚センサ90の列ごとの電圧(アナログ信号)が、該列に対応するA/D変換回路に入力される。そして、それぞれのA/D変換回路において、列ごとに異なる基準電圧波形に基づくA/D変換が行われる。そしてCNN回路部30は、それぞれのA/D変換回路からの出力に基づいて、物体の形状を認識する。なお、上記の説明において「列ごと」の代わりに第2の実施形態のように「列を分割したブロックごと」であっても良い。
なお、列ごと若しくはブロックごとの波形特性のパラメータのバックプロパゲーションによる学習処理については、第1の実施形態と同様である。よって本実施形態では、MEMS触覚センサ90の出力に対してより認識に適した変換処理を実行することが可能となる。
なお、センサ回路部10が有するセンサは、センサ素子回路11等の光電変換デバイスやMEMS触覚センサ90に限らず、A/D変換処理を伴うセンサであれば、その他の種類のセンサであっても良い。その他の種類のセンサを使用する場合であっても、A/D変換処理における波形特性を学習処理によって決定することは、上記の実施形態にて説明したとおりである。
また、上記の各実施形態では、センサ回路部10が有するセンサ(上記のセンサ素子回路11やMEMS触覚センサ90等)における列の数とA/D変換回路の数とが同じであるものとして説明したが、同じでなくても良い。例えば、1つのA/D変換回路で複数の列の電圧を変換するようにしても良い。
なお、以上説明した各実施形態や変形例の一部若しくは全部を適宜組み合わせて使用しても構わない。また、以上説明した各実施形態や変形例の一部若しくは全部を選択的に使用しても構わない。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
10: センサ回路部 20: 変換回路部 30: CNN回路部 100: ブリッジ 101: DMAC 102: RAM 103: CPU 104: ROM 105: RAM 106: 画像バス 107: CPUバス

Claims (10)

  1. センサ部と、
    前記センサ部から出力されたデータを変換する変換部と、
    前記変換部が変換したデータに基づいて認識処理を行う認識部と
    を備え、
    前記変換部の変換特性は、前記認識処理のパラメータの学習処理に基づいて決定される
    ことを特徴とする認識装置。
  2. 前記認識部は、階層型畳み込みニューラルネットワークを用いて認識処理を行うことを特徴とする請求項1に記載の認識装置。
  3. 前記パラメータおよび前記変換部の変換特性は、前記階層型畳み込みニューラルネットワークにおける学習処理に基づいて決定されることを特徴とする請求項2に記載の認識装置。
  4. 前記変換部の変換特性は、前記センサ部から出力されたデータが表す入力電圧と比較される基準電圧波形であることを特徴とする請求項1乃至3の何れか1項に記載の認識装置。
  5. 前記センサ部は、光電変換デバイスであることを特徴とする請求項1乃至4の何れか1項に記載の認識装置。
  6. 前記センサ部は、MEMS触覚センサであることを特徴とする請求項1乃至4の何れか1項に記載の認識装置。
  7. 前記認識装置は、前記センサ部の列ごとに前記変換部を有することを特徴とする請求項1乃至6の何れか1項に記載の認識装置。
  8. 前記認識装置は、前記センサ部の列を分割したブロックごとに前記変換部を有することを特徴とする請求項1乃至6の何れか1項に記載の認識装置。
  9. 前記変換部は時分割で動作することを特徴とする請求項1乃至6の何れか1項に記載の認識装置。
  10. センサ部を有する認識装置が行う認識方法であって、
    前記認識装置の変換部が、前記センサ部から出力されたデータを変換する変換工程と、
    前記認識装置の認識部が、前記変換工程で変換したデータに基づいて認識処理を行う認識工程と
    を備え、
    前記変換部の変換特性は、前記認識処理のパラメータの学習処理に基づいて決定される
    ことを特徴とする認識方法。
JP2019188861A 2019-10-15 2019-10-15 認識装置、認識方法 Active JP7348805B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019188861A JP7348805B2 (ja) 2019-10-15 2019-10-15 認識装置、認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019188861A JP7348805B2 (ja) 2019-10-15 2019-10-15 認識装置、認識方法

Publications (3)

Publication Number Publication Date
JP2021064882A true JP2021064882A (ja) 2021-04-22
JP2021064882A5 JP2021064882A5 (ja) 2022-10-25
JP7348805B2 JP7348805B2 (ja) 2023-09-21

Family

ID=75488215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019188861A Active JP7348805B2 (ja) 2019-10-15 2019-10-15 認識装置、認識方法

Country Status (1)

Country Link
JP (1) JP7348805B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2490001B1 (en) 2009-10-14 2016-12-14 Tohoku University Touch sensor system
JP2011229102A (ja) 2010-04-23 2011-11-10 Konica Minolta Opto Inc 撮像装置および撮像装置の温度特性補正方法
JP5865272B2 (ja) 2012-03-30 2016-02-17 キヤノン株式会社 光電変換装置および撮像システム
JP2019004358A (ja) 2017-06-16 2019-01-10 株式会社半導体エネルギー研究所 撮像装置および撮像システム

Also Published As

Publication number Publication date
JP7348805B2 (ja) 2023-09-21

Similar Documents

Publication Publication Date Title
US10210419B2 (en) Convolution operation apparatus
JP5376920B2 (ja) コンボリューション演算回路、階層的コンボリューション演算回路及び物体認識装置
JP6936592B2 (ja) 演算処理装置およびその制御方法
US7693350B2 (en) Pixel interpolation device and camera adapted to perform pixel interpolation of captured image
CN113066027A (zh) 面向Raw域的屏摄图像摩尔纹去除方法
JP6136190B2 (ja) 画像処理装置、撮像装置
JP2020149560A (ja) Cnn処理装置、cnn処理方法、およびプログラム
US9247188B2 (en) Image capturing apparatus, image capturing system, and image capturing method that performs inverse transform processing on an image using an inverse transform filter
JP4677647B2 (ja) 画像処理装置、コンピュータ、及び画像形成装置
US20040175055A1 (en) Method and apparatus for re-construcing high-resolution images
WO2019188573A1 (ja) 演算装置、演算方法およびプログラム
JP2021087201A (ja) 画像処理装置、画像処理方法、学習装置、学習方法、撮像装置、及びプログラム
JP2021087201A5 (ja)
US8089534B2 (en) Multi illuminant shading correction using singular value decomposition
JP7348805B2 (ja) 認識装置、認識方法
JP5513960B2 (ja) 画像処理装置
JP7403995B2 (ja) 情報処理装置、制御方法およびプログラム
JP7398938B2 (ja) 情報処理装置およびその学習方法
JP2017038198A (ja) 情報処理装置およびデータ転送方法
CN114885144A (zh) 基于数据融合的高帧率3d视频生成方法及装置
JPWO2019077933A1 (ja) 演算回路および演算方法
CN114885112A (zh) 基于数据融合的高帧率视频生成方法及装置
JPWO2020149178A1 (ja) ニューラルネットワークの縮約装置
JP7321213B2 (ja) 情報処理装置、情報処理方法
JP2006295666A (ja) ノイズ除去装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221017

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230810

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230908

R151 Written notification of patent or utility model registration

Ref document number: 7348805

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151