WO2023218936A1

WO2023218936A1 - イメージセンサ、情報処理方法、プログラム

Info

Publication number: WO2023218936A1
Application number: PCT/JP2023/016162
Authority: WO
Inventors: 凌平川崎
Original assignee: ソニーセミコンダクタソリューションズ株式会社
Priority date: 2022-05-10
Filing date: 2023-04-24
Publication date: 2023-11-16
Also published as: TW202409978A

Abstract

本技術に係るイメージセンサは、複数の画素が二次元に配列された画素アレイ部と、前記画素アレイ部から出力される画像データを記憶するフレームメモリと、前記フレームメモリに記憶された画像データに対して画像処理を施す画像処理部と、前記画像処理部によって画像処理が施された画像データを入力テンソルとして人工知能モデルを用いた推論処理を行う推論処理部と、を備えたものである。

Description

イメージセンサ、情報処理方法、プログラム

　本技術は、人工知能モデルを用いた推論処理を行うイメージセンサ、情報処理方法及びプログラムの技術分野に関する。

　カメラ装置のイメージセンサには人工知能モデルが展開されることにより推論処理が可能とされたものがある（例えば下記特許文献１）。

国際公開第２０１８／０５１８０９号

　このようなイメージセンサにおいては、人工知能モデルに入力される入力テンソルを適切なものとするために各種のＣＶ（Computer Vision）処理、或いは、人工知能モデルから出力される出力テンソルに対して各種のＣＶ処理が必要となる場合がある。
　しかし、このようなＣＶ処理をＩＳＰ（Image Signal Processor）で行ってしまうと処理効率が最適ではないという問題がある。

　本技術はこのような問題に鑑みてなされたものであり、人工知能モデルが展開されるイメージセンサにおいて人工知能モデルの入力テンソルや出力テンソルに係る処理の効率化を図ることを目的とする。

　本技術に係るイメージセンサは、複数の画素が二次元に配列された画素アレイ部と、前記画素アレイ部から出力される画像データを記憶するフレームメモリと、前記フレームメモリに記憶された画像データに対して画像処理を施す画像処理部と、前記画像処理部によって画像処理が施された画像データを入力テンソルとして人工知能モデルを用いた推論処理を行う推論処理部と、を備えたものである。
　これにより、人工知能モデルが展開されるイメージセンサにおいて人工知能モデルの入力テンソルや出力テンソルに係る処理の効率化を図ることができる。

情報処理システムの構成例を示す図である。クラウド側情報処理装置が備えるマーケットプレイス機能を介してＡＩモデルやＡＩアプリケーションの登録やダウンロードを行う各機器について説明するための図である。マーケットプレイス機能を介してＡＩモデルやＡＩアプリケーションの登録やダウンロードを行う際に各装置が実行する処理の流れの一例を示した図である。ＡＩアプリケーションやＡＩモデルの展開を行う際に各装置が実行する処理の流れの一例を示した図である。クラウド側の情報処理装置とエッジ側の情報処理装置の接続態様について説明するための図である。クラウド側情報処理装置の機能ブロック図である。カメラの内部構成例を示したブロック図である。イメージセンサの構成例を示す図である。イメージセンサが備えるＣＰＵの機能ブロック図である。イメージセンサの各層の構成例を示すフロアマップである。イメージセンサの各層についてのその他の一つ目の構成例を示すフロアマップである。イメージセンサの各層についてのその他の二つ目の構成例を示すフロアマップである。イメージセンサの各層についてのその他の三つ目の構成例を示すフロアマップである。イメージセンサの各層についてのその他の三つ目の構成例の変形例を示すフロアマップである。イメージセンサの各層についてのその他の四つ目の構成例を示すフロアマップである。イメージセンサの各層についてのその他の五つ目の構成例を示す図である。イメージセンサの各層についてのその他の五つ目の構成例を示すフロアマップである。マスク処理前の画像の一例である。マスク処理後の画像の一例である。バウンディングボックスが重畳された画像の一例である。ＡＩ画像処理の第１例及び第２例についての処理の流れを示す図である。ＡＩ画像処理の第３例についての処理の流れを示す図である。ＡＩ画像処理の第４例についての処理の流れを示す図である。ＡＩ画像処理の第５例についての処理の流れを示す図である。各処理の実行タイミングについての一つ目の例を示す図である。各処理の実行タイミングについての二つ目の例を示す図である。各処理の実行タイミングについての三つ目の例を示す図である。イメージセンサが備えるＣＰＵの機能ブロック図の他の例である。プライバシーマスク処理を行うイメージセンサの機能構成の構成例１を示す図である。プライバシーマスク処理を行うイメージセンサの機能構成の構成例２を示す図である。プライバシーマスク処理についてイメージセンサが実行する処理を示すフローチャートである。プライバシーマスク処理を行うイメージセンサの機能構成の構成例２を示す図である。イメージセンサの構成についての変形例を示す機能ブロック図である。カメラのソフトウェア構成を示すブロック図である。コンテナ技術を用いた場合のコンテナの動作環境を示すブロック図である。情報処理装置のハードウェア構成の一例を示すブロック図である。その他の説明における処理の流れを説明する図である。マーケットプレイスにログインするためのログイン画面の一例を示す図である。マーケットプレイスを利用する各開発者に提示される開発者向け画面の一例を示す図である。マーケットプレイスを利用するアプリケーション利用ユーザに提示される利用者向け画面の一例を示す図である。

　以下、添付図面を参照し、本技術に係る情報処理装置の実施の形態を次の順序で説明する。
＜１．情報処理システムの全体構成＞
＜２．ＡＩモデル及びＡＩアプリケーションの登録＞
＜３．システムの機能概要＞
＜４．撮像装置の構成＞
＜５．イメージセンサの構成＞
＜６．イメージセンサの構成についてのその他の例＞
＜７．ＡＩ画像処理の例＞
＜７－１．第１例＞
＜７－２．第２例＞
＜７－３．第３例＞
＜７－４．第４例＞
＜７－５．第５例＞
＜８．処理の流れ＞
＜８－１．第１例及び第２例＞
＜８－２．第３例＞
＜８－３．第４例＞
＜８－４．第５例＞
＜９．タイミングチャート＞
＜１０．プライバシー保護のための構成＞
＜１０－１．イメージセンサの構成例１＞
＜１０－２．イメージセンサの構成例２＞
＜１０－３．イメージセンサの構成例３＞
＜１１．変形例＞
＜１２．ＡＩモデル及びＡＩアプリケーションの展開＞
＜１３．情報処理装置のハードウェア構成＞
＜１４．その他＞
＜１５．マーケットプレイスの画面例＞
＜１６．まとめ＞
＜１６－１．まとめ１＞
＜１６－２．まとめ２＞
＜１６－３．まとめ３＞
＜１７．本技術＞

＜１．情報処理システムの全体構成＞
　図１は、本技術に係る実施形態としての情報処理システム１００の概略構成例を示したブロック図である。
　図示のように情報処理システム１００は、クラウドサーバ１と、ユーザ端末２と、複数のカメラ３と、フォグサーバ４と、管理サーバ５とを備えている。本例では、クラウドサーバ１、ユーザ端末２、フォグサーバ４、及び管理サーバ５は、例えばインターネット等とされたネットワーク６を介した相互通信を行うことが可能に構成されている。

　クラウドサーバ１、ユーザ端末２、フォグサーバ４、及び管理サーバ５は、ＣＰＵ（Central Processing Unit）、ＲＯＭ（Read Only Memory）、及びＲＡＭ（Random Access Memory）を有するマイクロコンピュータを備えた情報処理装置として構成されている。

　ここで、ユーザ端末２は、情報処理システム１００を用いたサービスの受け手であるユーザによって使用されることが想定される情報処理装置である。また、管理サーバ５は、サービスの提供者によって使用されることが想定される情報処理装置である。

　各カメラ３は、例えばＣＣＤ（Charge Coupled Device）型イメージセンサやＣＭＯＳ（Complementary Metal Oxide Semiconductor）型イメージセンサ等のイメージセンサを備え、被写体を撮像してデジタルデータとしての画像データ（撮像画像データ）を得る。
　カメラ３が備えるセンサは、例えば、ＲＧＢ画像を撮像するＲＧＢセンサや、距離画像を出力する測距センサなどである。
　また、後述するように各カメラ３は、撮像画像についてＡＩ（Artificial Intelligence：人工知能）を用いた処理（例えば、画像認識処理や被写体検出処理など）を行う機能も有している。以降の説明においては、画像認識処理や被写体検出処理など、画像に対して行われる各種の処理を単に「画像処理」と記載する。例えば、ＡＩ（或いはＡＩモデル）を用いた画像に対する各種の処理は「ＡＩ画像処理」と記載する。
　各カメラ３は、フォグサーバ４とデータ通信可能に構成され、例えばＡＩ画像処理などの結果を示す処理結果情報等の各種データをフォグサーバ４に送信したり、フォグサーバ４から各種データを受信したりすることが可能とされる。

　ここで、図１に示す情報処理システム１００については、例えば、各カメラ３の画像処理で得られる処理結果情報に基づき、フォグサーバ４又はクラウドサーバ１が被写体の分析情報を生成し、生成した分析情報をユーザ端末２を介してユーザに閲覧させるといった用途が想定される。

　各カメラ３の用途としては、各種の監視カメラの用途が考えられる。例えば、店舗やオフィス、住宅等の屋内についての監視カメラ、駐車場や街中等の屋外を監視するための監視カメラ（交通監視カメラ等を含む）、ＦＡ（Factory Automation）やＩＡ（Industrial Automation）における製造ラインの監視カメラ、車内や車外を監視する監視カメラ等の用途を挙げることができる。

　例えば、店舗における監視カメラの用途であれば、複数のカメラ３を店舗内の所定位置にそれぞれ配置し、ユーザが来店客の客層（性別や年齢層など）や店舗内での行動（動線）等を確認できるようにすることが考えられる。その場合、上記した分析情報としては、これら来店客の客層の情報や店舗内での動線の情報及び精算レジにおける混雑状態の情報（例えば、精算レジの待ち時間）等を生成することが考えられる。
　或いは、交通監視カメラの用途であれば、各カメラ３を道路近傍の各位置に配置し、ユーザが通過車両についてのナンバー（車両番号）や車の色、車種等の情報を認識できるようにすることが考えられ、その場合、上記した分析情報としては、これらナンバーや車の色、車種等の情報を生成することが考えられる。

　また、駐車場に交通監視カメラを用いた場合は、駐車されている各車両を監視できるようにカメラを配置し、不審な行動をしている不審者が各車両の周りにいないかなどを監視し、不審者がいた場合には、不審者がいることやその不審者の属性（性別や年齢層）などを通知することが考えられる。
　更に、街中や駐車場の空きスペースを監視して、ユーザに車を駐車できるスペースの場所を通知することも考えられる。

　フォグサーバ４は、例えば上記した店舗の監視用途においては各カメラ３と共に監視対象の店舗内に配置される等、監視対象ごとに配置されることが想定される。このように店舗などの監視対象ごとにフォグサーバ４を設けることで、監視対象における複数のカメラ３からの送信データをクラウドサーバ１が直接受信する必要がなくなり、クラウドサーバ１の処理負担軽減が図られる。

　なお、フォグサーバ４は、監視対象とする店舗が複数あり、それら店舗が全て同一系列に属する店舗である場合には、店舗ごとに設けるのではなく、それら複数の店舗につき一つ設けることも考えられる。すなわち、フォグサーバ４は、監視対象ごとに一つ設けることに限定されず、複数の監視対象に対して一つのフォグサーバ４を設けることも可能なものである。
　なお、クラウドサーバ１もしくは、各カメラ３側に処理能力があるなどの理由で、フォグサーバ４の機能をクラウドサーバ１もしくは各カメラ３側に持たせることができる場合は、情報処理システム１００においてフォグサーバ４を省略し、各カメラ３を直接ネットワーク６に接続させて、複数のカメラ３からの送信データをクラウドサーバ１が直接受信するようにしてもよい。

　上記各種の装置は、以下の説明において、クラウド側情報処理装置とエッジ側情報処理装置とに大別することができる。
　クラウド側情報処理装置にはクラウドサーバ１や管理サーバ５が該当し、複数のユーザによる利用が想定されるサービスを提供する装置群である。

　また、エッジ側情報処理装置にはカメラ３とフォグサーバ４が該当し、クラウドサービスを利用するユーザによって用意される環境内に配置される装置群として捉えることが可能である。

　但し、クラウド側情報処理装置とエッジ側情報処理装置の双方が同じユーザによって用意された環境下にあってもよい。

　なお、フォグサーバ４は、オンプレミスサーバとされていてもよい。

＜２．ＡＩモデル及びＡＩアプリケーションの登録＞
　上述したように、情報処理システム１００においては、エッジ側の情報処理装置であるカメラ３においてＡＩ画像処理を行い、クラウド側の情報処理装置であるクラウドサーバ１において、エッジ側におけるＡＩ画像処理の結果情報（例えばＡＩを用いた画像認識処理の結果情報）を用いて高度なアプリケーション機能を実現するものである。

　ここで、クラウド側の情報処理装置であるクラウドサーバ１（或いはフォグサーバ４を含む）にアプリケーション機能を登録する手法は各種考えられる。
　その一例について、図２を参照して説明する。
　なお、フォグサーバ４については図２における図示を省略しているが、フォグサーバ４を備えた構成とされてもよい。その際におけるフォグサーバ４は、エッジ側の機能の一部を負担してもよい。

　上述したクラウドサーバ１と管理サーバ５は、クラウド側の環境を構成する情報処理装置である。
　また、カメラ３はエッジ側の環境を構成する情報処理装置である。

　なお、カメラ３だけでなくイメージセンサＩＳについてもエッジ側の環境を構成する情報処理装置として捉えることができる。即ち、エッジ側情報処理装置であるカメラ３の内部に別のエッジ側情報処理装置であるイメージセンサＩＳが搭載されていると捉えてもよい。

　また、クラウド側の情報処理装置が提供する各種のサービスを利用するユーザが使用するユーザ端末２としては、ＡＩ画像処理に用いられるアプリケーションを開発するユーザが使用するアプリケーション開発者端末２Ａと、アプリケーションを利用するユーザが使用するアプリケーション利用者端末２Ｂと、ＡＩ画像処理に用いられるＡＩモデルを開発するユーザが使用するＡＩモデル開発者端末２Ｃなどがある。
　なお、もちろん、アプリケーション開発者端末２ＡはＡＩ画像処理を用いないアプリケーションを開発するユーザによって使用されてもよい。

　クラウド側の情報処理装置には、ＡＩによる学習を行うための学習用データセットや開発のベースとなるＡＩモデルなどが用意されている。ＡＩモデルを開発するユーザは、ＡＩモデル開発者端末２Ｃを利用してクラウド側の情報処理装置と通信を行い、これらの学習用データセットやＡＩモデルをダウンロードする。このとき、学習用データセットが有料で提供されてもよい。例えば、ＡＩモデル開発者は、クラウド側の機能として用意されているマーケットプレイス（電子市場）に個人情報を登録することによりマーケットプレイスに登録された各種機能や素材の購入を可能にした状態で、学習用データセットの購入を行ってもよい。

　ＡＩモデル開発者は、学習用データセットを用いてＡＩモデルの開発を行った後、ＡＩモデル開発者端末２Ｃを用いて当該開発済みのＡＩモデルをマーケットプレイスに登録する。これにより、当該ＡＩモデルがダウンロードされた際にＡＩモデル開発者にインセンティブが支払われるようにしてもよい。

　また、アプリケーションを開発するユーザは、アプリケーション開発者端末２Ａを利用してマーケットプレイスからＡＩモデルをダウンロードして、当該ＡＩモデルを利用したアプリケーション（以降、「ＡＩアプリケーション」と記載）の開発を行う。このとき、前述したように、ＡＩモデル開発者にインセンティブが支払われてもよい。

　アプリケーション開発ユーザは、アプリケーション開発者端末２Ａを用いて当該開発済みのＡＩアプリケーションをマーケットプレイスに登録する。これにより、当該ＡＩアプリケーションがダウンロードされた際にＡＩアプリケーションを開発したユーザにインセンティブが支払われるようにしてもよい。

　ＡＩアプリケーションを利用するユーザは、アプリケーション利用者端末２Ｂを利用してマーケットプレイスからＡＩアプリケーション及びＡＩモデルを自身が管理するエッジ側の情報処理装置としてのカメラ３に展開（デプロイ）するための操作を行う。このとき、ＡＩモデル開発者にインセンティブが支払われるようにしてもよい。
　これにより、カメラ３においてＡＩアプリケーション及びＡＩモデルを用いたＡＩ画像処理を行うことが可能となり、画像を撮像するだけでなくＡＩ画像処理によって来店客の検出や車両の検出を行うことが可能となる。

　ここで、ＡＩアプリケーション及びＡＩモデルの展開とは、実行主体としての対象（装置）がＡＩアプリケーション及びＡＩモデルを利用することができるように、換言すれば、ＡＩアプリケーションとしての少なくとも一部のプログラムを実行できるように、ＡＩアプリケーションやＡＩモデルが実行主体としての対象にインストールされることを指す。

　また、カメラ３においては、ＡＩ画像処理によって、カメラ３で撮像された撮像画像から来店客の属性情報が抽出可能とされていてもよい。
　これらの属性情報は、カメラ３からネットワーク６を介してクラウド側の情報処理装置に送信される。

　クラウド側の情報処理装置には、クラウドアプリケーションが展開されており、各ユーザは、ネットワーク６を介してクラウドアプリケーションを利用可能とされている。そして、クラウドアプリケーションの中には、来店客の属性情報や撮像画像を用いて来店客の動線を分析するアプリケーションなどが用意されている。このようなクラウドアプリケーションは、アプリケーション開発ユーザなどによりアップロードされる。

　アプリケーション利用ユーザは、アプリケーション利用者端末２Ｂを用いて動線分析のためのクラウドアプリケーションを利用することにより、自身の店舗についての来店客の動線分析を行い、解析結果を閲覧することが可能とされている。解析結果の閲覧とは、店舗のマップ上に来店客の動線がグラフィカルに提示されることにより行われたりする。
　また、動線分析の結果をヒートマップの形で表示され、来店客の密度などが提示されることにより解析結果の閲覧が行われてもよい。
　また、それらの情報は、来店客の属性情報ごとに表示の仕分けがなされていてもよい。

　クラウド側のマーケットプレイスにおいては、ユーザごとに最適化されたＡＩモデルがそれぞれ登録されていてもよい。例えば、あるユーザが管理している店舗に配置されたカメラ３において撮像された撮像画像が適宜クラウド側の情報処理装置にアップロードされて蓄積される。

　クラウドの情報処理装置においては、アップロードされた撮像画像が一定枚数溜まるごとにＡＩモデルの再学習処理を行い、ＡＩモデルを更新してマーケットプレイスに登録しなおす処理が実行される。
　なお、ＡＩモデルの再学習処理は、例えば、マーケットプレイス上でユーザがオプションとして選べるようにしてもよい。

　例えば、店舗内に配置されたカメラ３からの暗い画像を用いて再学習されたＡＩモデルが当該カメラ３に展開されることにより、暗い場所で撮像された撮像画像についての画像処理の認識率等を向上させることができる。また、店舗外に配置されたカメラ３からの明るい画像を用いて再学習されたＡＩモデルが当該カメラ３に展開されることにより、明るい場所で撮像された画像についての画像処理の認識率等を向上させることができる。
　即ち、アプリケーション利用ユーザは、更新されたＡＩモデルを再度カメラ３に展開しなおすことにより、常に最適化された処理結果情報を得ることが可能となる。
　なお、ＡＩモデルの再学習処理については改めて後述する。

　また、クラウド側のマーケットプレイスにおいては、カメラごとに最適化されたＡＩモデルがそれぞれ登録されていてもよい。例えば、ＲＧＢ画像を取得可能なカメラ３に対して適用されるＡＩモデルや、距離画像を生成する測距センサを備えたカメラ３に対して適用されるＡＩモデルなどが考えられる。
　また、明るい時間帯にカメラ３で用いられるべきＡＩモデルとして明るい環境で車両や撮像した画像を用いて学習されたＡＩモデルと、暗い時間帯にカメラ３で用いられるべきＡＩモデルとして暗い環境で撮像した画像を用いて学習されたＡＩモデルが、それぞれマーケットプレイスにおいて登録されていてもよい。
　そしてこれらのＡＩモデルは再学習処理によって認識率が高められたＡＩモデルに適宜更新されることが望ましい。

　また、カメラ３からクラウド側の情報処理装置にアップロードされる情報（撮像画像など）に個人情報が含まれている場合には、プライバシーの保護の観点からプライバシーに関する情報を削除したデータがアップロードされるようにしてもよいし、プライバシーに関する情報が削除されたデータをＡＩモデル開発ユーザやアプリケーション開発ユーザが利用可能にしてもよい。

　上記した処理の流れをフローチャートにして図３及び図４に示す。
　なお、クラウド側情報処理装置は、図１におけるクラウドサーバ１や管理サーバ５などが該当する。

　ＡＩモデル開発者がＬＣＤ（Liquid Crystal Display）或いは有機ＥＬ（Electro Luminescence）パネルなどよりなる表示部を有するＡＩモデル開発者端末２Ｃを用いてマーケットプレイスに登録されているデータセットの一覧を閲覧し所望のデータセットを選択したことに応じて、ＡＩモデル開発者端末２ＣはステップＳ２１で、当該選択されたデータセットのダウンロード要求をクラウド側情報処理装置に送信する。

　これを受けて、クラウド側情報処理装置では、ステップＳ１において、該要求を受け付け、ステップＳ２において、要求されたデータセットをＡＩモデル開発者端末２Ｃに送信する処理を行う。

　ＡＩモデル開発者端末２Ｃでは、ステップＳ２２において、データセットを受信する処理を行う。これにより、ＡＩモデル開発者は、データセットを用いたＡＩモデルの開発が可能となる。

　ＡＩモデル開発者がＡＩモデルの開発を終えた後、ＡＩモデル開発者が開発済みのＡＩモデルをマーケットプレイスに登録するための操作を行う（例えば、ＡＩモデルの名称や、そのＡＩモデルが置かれているアドレスなどを指定する）と、ＡＩモデル開発者端末２Ｃは、ステップＳ２３において、ＡＩモデルのマーケットプレイスへの登録要求をクラウド側情報処理装置に送信する。

　これを受けて、クラウド側情報処理装置は、ステップＳ３において、該登録要求を受け付け、ステップＳ４において、ＡＩモデルの登録処理を行うことによって、例えば、マーケットプレイス上でＡＩモデルを表示させることができる。これにより、ＡＩモデル開発者以外のユーザがＡＩモデルのダウンロードをマーケットプレイスから行うことが可能となる。

　例えば、ＡＩアプリケーションの開発を行おうとするアプリケーション開発者は、アプリケーション開発者端末２Ａを用いてマーケットプレイスに登録されているＡＩモデルの一覧を閲覧する。アプリケーション開発者端末２Ａは、アプリケーション開発者の操作（例えば、マーケットプレイス上のＡＩモデルの一つを選択する操作）に応じて、ステップＳ３１において、当該選択されたＡＩモデルのダウンロード要求をクラウド側情報処理装置に送信する。

　クラウド側情報処理装置はステップＳ５において当該要求を受け付け、ステップＳ６においてＡＩモデルの送信をアプリケーション開発者端末２Ａに対して行う。

　アプリケーション開発者端末２Ａは、ステップＳ３２において、ＡＩモデルの受信を行う。これにより、アプリケーション開発者は、他者が開発したＡＩモデルを用いるＡＩアプリケーションの開発が可能となる。

　アプリケーション開発者がＡＩアプリケーションの開発を終えた後、ＡＩアプリケーションをマーケットプレイスに登録するための操作（例えば、ＡＩアプリケーションの名称やそのＡＩモデルが置かれているアドレスなどを指定する操作）を行うと、アプリケーション開発者端末２ＡはステップＳ３３において、ＡＩアプリケーションの登録要求をクラウド側情報処理装置に送信する。

　クラウド側情報処理装置は、ステップＳ７において、当該登録要求を受け付け、ステップＳ８において、ＡＩアプリケーションの登録を行うことによって、例えば、マーケットプレイス上でＡＩアプリケーションを表示させることができる。これにより、アプリケーション開発者以外のユーザがＡＩアプリケーションをマーケットプレイス上で選択してダウンロードすることが可能となる。

　アプリケーション開発者以外のユーザがＡＩアプリケーションをマーケットプレイス上で選択してダウンロードする例について図４に示す。例えば、ＡＩアプリケーションを利用しようとするユーザの操作に応じて、アプリケーション利用者端末２ＢはステップＳ４１において目的選択を行う。目的選択では、選択された目的がクラウド側情報処理装置に送信される。

　これを受けて、クラウド側情報処理装置はステップＳ９において、目的に応じたＡＩアプリケーションを選択し、ステップＳ１０において、ＡＩモデルを選択する。例えば、目的に応じたＡＩアプリケーションとＡＩモデルが対応付けられたテーブルデータがクラウド側情報処理装置に記憶されており、目的に応じたＡＩアプリケーションとＡＩモデルを選択することが可能とされている。

　クラウド側情報処理装置はステップＳ１１において、選択されたＡＩアプリケーション及びＡＩモデルを展開する処理を行う。この展開処理では、ＡＩアプリケーション及びＡＩモデルがカメラ３に送信される。

　これに応じて、カメラ３においては、ステップＳ５１によりＡＩアプリケーション及びＡＩモデルの展開処理が行われる。これにより、カメラ３において撮像された撮像画像に対してＡＩ画像処理が可能となる。

　カメラ３は、ステップＳ５２において、撮像動作を行うことにより画像の取得を行う。そして、カメラ３はステップＳ５３において、取得した画像に対するＡＩ画像処理を行い、例えば、画像認識結果を得る。

　カメラ３は、ステップＳ５４において、撮像画像やＡＩ画像処理の結果情報の送信処理が行われる。ステップＳ５４の情報送信においては、撮像画像とＡＩ画像処理の結果情報の双方を送信してもよいし、何れか一方のみを送信してもよい。

　これらの情報を受信したクラウド側情報処理装置は、ステップＳ１２において、分析処理を行う。この分析処理により、例えば来店客の動線分析や、交通監視のための車両分析処理などが行われる。

　クラウド側情報処理装置はステップＳ１３において、分析結果の提示処理を行う。この処理は、例えば、上述したクラウドアプリケーションをユーザが利用することにより実現される。

　アプリケーション利用者端末２Ｂは、分析結果の提示処理を受けて、ステップＳ４２において分析結果をモニタなどに表示させる処理を行う。

　ここまでの処理で、ＡＩアプリケーションの利用者であるユーザは、ステップＳ４１で選択した目的に応じた分析結果を得ることができる。

　なお、アプリケーション利用者が管理しているカメラ３が撮像した画像に最適化するようにＡＩモデルの更新が行われてもよい。
　例えば、カメラ３がステップＳ５２、Ｓ５３、Ｓ５４の各処理を繰り返し実行することにより、クラウド側情報処理装置には、カメラ３から受信した撮像画像やＡＩ画像処理の結果情報が蓄積されていく。

　そして、クラウド側情報処理装置は、一定量の情報が蓄積された場合に、ステップＳ１４において、ＡＩモデルの更新処理を行う。この処理は、ＡＩモデルに新たなデータを与えることによりＡＩモデルの再学習を行う処理である。

　クラウド側情報処理装置はステップＳ１５において、更新された新たなＡＩモデルを展開する処理を行う。

　この展開処理を受けて、カメラ３においてはステップＳ５５で新たなＡＩモデルを展開する処理が実行される。
　なお、ＡＩアプリケーションについても更新されている場合には、ステップＳ５５の処理において、更新されたＡＩアプリケーションを更に展開してもよい。

＜３．システムの機能概要＞
　本実施形態では、情報処理システム１００を用いたサービスとして、顧客としてのユーザが各カメラ３のＡＩ画像処理についての機能の種別を選択することのできるサービスを想定している。機能の種別の選択とは、上述した目的の設定と換言することもできる。また、例えば、画像認識機能と画像検出機能などを選択してもよいし、特定の被写体についての画像認識機能や画像検出機能を発揮するように更に細かい種別を選択してもよい。
　例えば、ビジネスモデルとして、サービス提供者は、ＡＩによる画像認識機能を有したカメラ３やフォグサーバ４をユーザに販売し、それらカメラ３やフォグサーバ４を監視対象となる場所に設置させる。そして、上述したような分析情報をユーザに提供するサービスを展開する。

　このとき、店舗監視の用途や交通監視の用途等、顧客ごとにシステムに求める用途（目的）が異なるため、顧客が求める用途に対応した分析情報が得られるように、カメラ３が有するＡＩ画像処理機能を選択的に設定することを可能とする。

　また、地震などの災害が起きた際に、カメラ３を用いて取得したい情報が変わることも考えられる。具体的には、通常時においては、店舗の監視カメラとしての機能を実現するために来店客の検出や属性を特定するためのＡＩ画像処理機能を発現させておき、災害発生時においては、商品棚に残る商品を把握するためのＡＩ画像処理機能に切り替える。この切り替えの際には、適切な認識結果を得ることができるように、ＡＩモデルを変更することが考えられる。

　本例では、このようなカメラ３のＡＩ画像処理機能を選択的に設定する機能を管理サーバ５が有する。

　なお、管理サーバ５の機能をクラウドサーバ１やフォグサーバ４が備えていてもよい。

　ここで、クラウド側の情報処理装置であるクラウドサーバ１や管理サーバ５と、エッジ側の情報処理装置であるカメラ３の接続について、図５を参照して説明する。

　クラウド側の情報処理装置には、Ｈｕｂを介して利用可能な機能である再学習機能とデバイス管理機能とマーケットプレイス機能が実装されている。

　Ｈｕｂは、エッジ側情報処理装置に対してセキュリティで保護された信頼性の高い通信を行う。これにより、エッジ側情報処理装置に対して各種の機能を提供することができる。

　再学習機能は、再学習を行い新たに最適化されたＡＩモデルの提供を行う機能であり、これにより、新たな学習素材に基づく適切なＡＩモデルの提供が行われる。

　デバイス管理機能は、エッジ側情報処理装置としてのカメラ３などを管理する機能であり、例えば、カメラ３に展開されたＡＩモデルの管理や監視、そして問題の検出やトラブルシューティングなどの機能を提供することができる。

　また、デバイス管理機能は、カメラ３やフォグサーバ４の情報を管理する機能でもある。カメラ３やフォグサーバ４の情報とは、演算処理部として使用されているチップの情報や、メモリ容量及び記憶容量、そして、ＣＰＵやメモリの使用率などの情報、更に、各装置にインストールされているＯＳ（Operating System）などのソフトウェアの情報などである。

　更に、デバイス管理機能は、認証されたユーザによるセキュアなアクセスを保護する。

　マーケットプレイス機能は、上述したＡＩモデル開発者によって開発されたＡＩモデルやアプリケーション開発者によって開発されたＡＩアプリケーションを登録する機能や、それらの開発物を許可されたエッジ側情報処理装置に展開する機能などを提供する。また、マーケットプレイス機能は、開発物の展開に応じたインセンティブの支払いに関する機能も提供される。

　エッジ側情報処理装置としてのカメラ３には、エッジランタイムやＡＩアプリケーション及びＡＩモデルやイメージセンサＩＳを備えている。

　エッジランタイムは、カメラ３に展開されたアプリケーションの管理やクラウド側情報処理装置との通信を行うための組み込みソフトウェアなどとして機能する。

　ＡＩモデルは、前述したように、クラウド側情報処理装置におけるマーケットプレイスに登録されたＡＩモデルを展開したものであり、これによってカメラ３は撮像画像を用いて目的に応じたＡＩ画像処理の結果情報を得ることができる。

　図６を参照し、クラウド側情報処理装置が有する機能の概要を説明する。なお、クラウド側情報処理装置とは、クラウドサーバ１及び管理サーバ５などの装置をまとめて呼称したものである。
　図示のようにクラウド側情報処理装置は、ライセンスオーソリ機能Ｆ１、アカウントサービス機能Ｆ２、デバイス監視機能Ｆ３、マーケットプレイス機能Ｆ４、及びカメラサービス機能Ｆ５を有する。

　ライセンスオーソリ機能Ｆ１は、各種の認証に係る処理を行う機能である。具体的に、ライセンスオーソリ機能Ｆ１では、各カメラ３のデバイス認証に係る処理や、カメラ３で使用されるＡＩモデル、ソフトウェア、ファームウェアそれぞれについての認証に係る処理が行われる。

　ここで、上記のソフトウェアは、カメラ３においてＡＩ画像処理を適切に実現させるために必要となるソフトウェアを意味する。
　撮像画像に基づくＡＩ画像処理が適切に行われ、ＡＩ画像処理の結果が適切な形式でフォグサーバ４やクラウドサーバ１に送信されるようにするためには、ＡＩモデルへの入力データを制御したり、ＡＩモデルの出力データを適切に処理したりすることが要求される。上記のソフトウェアは、ＡＩ画像処理を適切に実現させるために必要な周辺処理を含んだソフトウェアとなる。このようなソフトウェアは、ＡＩモデルを利用して所望の機能を実現するためのソフトウェアであり、上述のＡＩアプリケーションに該当する。

　なお、ＡＩアプリケーションとしては、一つのＡＩモデルのみを利用するものに限らず、２以上のＡＩモデルを利用するものも考えられる。例えば、撮像画像を入力テンソルとしてＡＩ画像処理を実行するＡＩモデルで得られた認識結果の情報（画像データなどであり、以降、「認識結果情報」と記載）としての画像データは、入力テンソルとして更に別のＡＩモデルに入力されて第二のＡＩ画像処理が実行されるという処理の流れを有するＡＩアプリケーションも存在し得る。
　或いは、第一のＡＩ画像処理の認識結果情報としての座標情報を用いて、第一のＡＩ画像処理に対する入力テンソルに対して第二のＡＩ画像処理としての所定の画像処理を施すＡＩアプリケーションであってもよい。なお、各ＡＩ画像処理に対する入力テンソルは、ＲＡＷ画像であってもよいし、ＲＡＷ画像に同時化処理を施したＲＧＢ画像などであってもよい。以降の説明においても同様である。

　ライセンスオーソリ機能Ｆ１において、カメラ３の認証については、カメラ３とネットワーク６を介して接続された場合に、カメラ３ごとにデバイスＩＤ（Identification）を発行する処理が行われる。
　また、ＡＩモデルやソフトウェアの認証については、ＡＩモデル開発者端末２Ｃやソフトウェア開発者端末７から登録申請されたＡＩモデル、ＡＩアプリケーションについて、それぞれ固有のＩＤ（ＡＩモデルＩＤ、ソフトウェアＩＤ）を発行する処理が行われる。
　また、ライセンスオーソリ機能Ｆ１では、カメラ３やＡＩモデル開発者端末２Ｃ、ソフトウェア開発者端末７とクラウドサーバ１との間でセキュアな通信が行われるようにするための各種の鍵や証明書等をカメラ３の製造業者（特に後述するイメージセンサＩＳの製造業者）やＡＩモデル開発者、ソフトウェア開発者に発行する処理が行われると共に、証明効力の更新や停止のための処理も行われる。
　さらに、ライセンスオーソリ機能Ｆ１では、以下で説明するアカウントサービス機能Ｆ２によりユーザ登録（ユーザＩＤの発行を伴うアカウント情報の登録）が行われた場合に、ユーザが購入したカメラ３（上記デバイスＩＤ）とユーザＩＤとを紐付ける処理も行われる。

　アカウントサービス機能Ｆ２は、ユーザのアカウント情報の生成や管理を行う機能である。アカウントサービス機能Ｆ２では、ユーザ情報の入力を受け付け、入力されたユーザ情報に基づいてアカウント情報を生成する（少なくともユーザＩＤとパスワード情報とを含むアカウント情報の生成を行う）。
　また、アカウントサービス機能Ｆ２では、ＡＩモデル開発者やＡＩアプリケーションの開発者（以下「ソフトウェア開発者」と略称することもある）についての登録処理（アカウント情報の登録）も行われる。

　デバイス監視機能Ｆ３は、カメラ３の使用状態を監視するための処理を行う機能である。例えば、カメラ３の使用場所や、ＡＩ画像処理の出力データの出力頻度、ＡＩ画像処理に用いられるＣＰＵやメモリの空き容量等、カメラ３の使用状態に係る各種の要素として上述したＣＰＵやメモリの使用率などの情報についての監視を行う。

　マーケットプレイス機能Ｆ４は、ＡＩモデルやＡＩアプリケーションを販売するための機能である。例えばユーザは、マーケットプレイス機能Ｆ４により提供される販売用のＷＥＢサイト（販売用サイト）を介してＡＩアプリケーション、及びＡＩアプリケーションが利用するＡＩモデルを購入することが可能とされる。また、ソフトウェア開発者は、上記の販売用サイトを介してＡＩアプリケーションの作成のためにＡＩモデルを購入することが可能とされる。

　カメラサービス機能Ｆ５は、カメラ３の利用に関するサービスをユーザに提供するための機能とされる。
　このカメラサービス機能Ｆ５の一つとしては、例えば、前述した分析情報の生成に係る機能を挙げることができる。すなわち、カメラ３における画像処理の処理結果情報に基づき被写体の分析情報を生成しユーザ端末２を介してユーザに閲覧させるための処理を行う機能である。

　また、カメラサービス機能Ｆ５には、撮像設定探索機能が含まれる。具体的に、この撮像設定探索機能は、カメラ３からＡＩ画像処理の認識結果情報を取得し、取得した認識結果情報に基づき、カメラ３の撮像設定情報をＡＩを用いて探索する機能である。ここで、撮像設定情報とは、撮像画像を得るための撮像動作に係る設定情報を広く意味するものである。具体的には、フォーカスや絞り等といった光学的な設定や、フレームレート、露光時間、ゲイン等といった撮像画像信号の読み出し動作に係る設定、さらにはガンマ補正処理、ノイズリダクション処理、超解像処理等、読み出された撮像画像信号に対する画像信号処理に係る設定等を広く含むものである。
　撮像設定探索機能が適切に機能することにより、ユーザによって設定された目的に応じてカメラ３の撮像設定が最適化され、良好な推論結果を得ることができる。

　また、カメラサービス機能Ｆ５には、ＡＩモデル探索機能も含まれる。このＡＩモデル探索機能は、カメラ３からＡＩ画像処理の認識結果情報を取得し、取得した認識結果情報に基づき、カメラ３におけるＡＩ画像処理に用いられる最適なＡＩモデルの探索をＡＩを用いて行う機能である。ここで言うＡＩモデルの探索とは、例えば、ＡＩ画像処理が畳み込み演算を含むＣＮＮ（Convolutional Neural Network）等により実現される場合において、重み係数等の各種の処理パラメータやニューラルネットワーク構造に係る設定情報（例えば、カーネルサイズの情報等を含む）等を最適化する処理を意味する。

　なお、カメラサービス機能Ｆ５は、処理分担を決定する機能を備えていてもよい。処理分担決定機能においては、ＡＩアプリケーションをエッジ側情報処理装置に展開する際に、ＳＷコンポーネント単位での展開先の装置を決定する処理を行う。なお、一部のＳＷコンポーネントは、クラウド側の装置において実行されるものとして決定してもよく、この場合には既にクラウド側の装置に展開済みであるとして展開処理が行われなくてもよい。

　上記のような撮像設定探索機能及びＡＩモデル探索機能を有することで、ＡＩ画像処理の結果を良好とする撮像設定が行われるように図られると共に、実際の使用環境に応じた適切なＡＩモデルを用いてＡＩ画像処理が行われるように図ることができる。
　そして、これに加えて処理分担決定機能を有することで、ＡＩ画像処理及びその解析処理が適切な装置において実行されるように図ることができる。

　なお、カメラサービス機能Ｆ５は、各ＳＷコンポーネントを展開するに先立って、アプリケーション設定機能を有する。アプリケーション設定機能は、ユーザの目的に応じて適切なＡＩアプリケーションを設定する機能である。

　例えば、ユーザが選択した目的に応じて、適切なＡＩアプリケーションを選択する。これにより、ＡＩアプリケーションを構成するＳＷコンポーネントについても自ずと決定される。なお、後述するが、ＡＩアプリケーションを用いてユーザの目的を実現するためのＳＷコンポーネントの組み合わせが複数種類あってもよく、この場合には、エッジ側情報処理装置の情報やユーザの要求に応じて一つの組み合わせが選択される。

　例えば、ユーザが店舗監視を目的とした場合に、ユーザの要求がプライバシー重視である場合と、速度重視である場合とで、ＳＷコンポーネントの組み合わせが異なってもよい。

　アプリケーション設定機能においては、ユーザ端末２（図２におけるアプリケーション利用者端末２Ｂに相当）においてユーザが目的（アプリケーション）を選択する操作を受け付ける処理や、選択されたアプリケーションに応じて適切なＡＩアプリケーションを選択する処理等が行われる。

　ここで、上記では、クラウドサーバ１単体でライセンスオーソリ機能Ｆ１、アカウントサービス機能Ｆ２、デバイス監視機能Ｆ３、マーケットプレイス機能Ｆ４、及びカメラサービス機能Ｆ５を実現する構成を例示したが、これらの機能を複数の情報処理装置が分担して実現する構成とすることも可能である。例えば、上記の機能をそれぞれ１台の情報処理装置が担う構成とすることが考えられる。或いは、上記した機能のうち単一の機能を複数の情報処理装置（例えば、クラウドサーバ１と管理サーバ５）が分担して行うといったことも可能である。

　図１において、ＡＩモデル開発者端末２Ｃは、ＡＩモデルの開発者が使用する情報処理装置である。
　また、ソフトウェア開発者端末７は、ＡＩアプリケーションの開発者が使用する情報処理装置である。

＜４．撮像装置の構成＞
　図７は、カメラ３の内部構成例を示したブロック図である。
　図示のようにカメラ３は、撮像光学系３１、光学系駆動部３２、イメージセンサＩＳ、制御部３３、メモリ部３４、通信部３５を備えている。イメージセンサＩＳと制御部３３とメモリ部３４と通信部３５はバス３６を介して接続され、相互にデータ通信を行うことが可能とされている。

　撮像光学系３１は、カバーレンズ、ズームレンズ、フォーカスレンズ等のレンズや絞り（アイリス）機構を備える。この撮像光学系３１により、被写体からの光（入射光）が導かれ、イメージセンサＩＳの受光面に集光される。

　光学系駆動部３２は、撮像光学系３１が有するズームレンズ、フォーカスレンズ、及び絞り機構の駆動部を包括的に示したものである。具体的に、光学系駆動部３２は、これらズームレンズ、フォーカスレンズ、絞り機構それぞれを駆動するためのアクチュエータ、及び該アクチュエータの駆動回路を有している。

　制御部３３は、例えばＣＰＵ、ＲＯＭ、及びＲＡＭを有するマイクロコンピュータを備えて構成され、ＣＰＵがＲＯＭに記憶されているプログラム、又はＲＡＭにロードされたプログラムに従って各種の処理を実行することで、カメラ３の全体制御を行う。

　また、制御部３３は、光学系駆動部３２に対してズームレンズ、フォーカスレンズ、絞り機構等の駆動指示を行う。光学系駆動部３２はこれらの駆動指示に応じてフォーカスレンズやズームレンズの移動、絞り機構の絞り羽根の開閉等を実行させることになる。

　また、制御部３３は、メモリ部３４に対する各種データの書き込みや読み出しについての制御を行う。
　メモリ部３４は、例えばＨＤＤ（Hard Disk Drive）やフラッシュメモリ装置等の不揮発性の記憶デバイスとされ、イメージセンサＩＳから出力された画像データの保存先（記録先）として用いられる。

　さらに、制御部３３は、通信部３５を介して外部装置との間で各種データ通信を行う。本例における通信部３５は、少なくとも図１に示したフォグサーバ４（若しくはクラウドサーバ１）との間でのデータ通信を行うことが可能に構成されている。

　イメージセンサＩＳは、例えばＣＣＤ型、ＣＭＯＳ型等のイメージセンサとして構成されている。

　イメージセンサＩＳは、撮像部４１、画像信号処理部４２、センサ内制御部４３、ＡＩ画像処理部４４、メモリ部４５、通信Ｉ／Ｆ４６とを備え、それぞれがバス４７を介して相互にデータ通信可能とされている。

　撮像部４１は、フォトダイオード等の光電変換素子を有する画素が二次元に配列された画素アレイ部と、画素アレイ部が備えるそれぞれの画素から光電変換によって得られた電気信号を読み出す読み出し回路とを備えており、該電気信号を撮像画像信号として出力することが可能とされている。

　読み出し回路では、光電変換により得られた電気信号について、例えばＣＤＳ（Correlated Double Sampling）処理、ＡＧＣ（Automatic Gain Control）処理などを実行し、さらにＡ／Ｄ（Analog/Digital）変換処理を行う。

　画像信号処理部４２は、Ａ／Ｄ変換処理後のデジタルデータとしての撮像画像信号に対して、前処理、同時化処理、ＹＣ生成処理、解像度変換処理、コーデック処理等を行う。
前処理では、撮像画像信号に対してＲ、Ｇ、Ｂの黒レベルを所定のレベルにクランプするクランプ処理や、Ｒ、Ｇ、Ｂの色チャンネル間の補正処理等を行う。同時化処理では、各画素についての画像データが、Ｒ、Ｇ、Ｂ全ての色成分を有するようにする色分離処理を施す。例えば、ベイヤー配列のカラーフィルタを用いた撮像素子の場合は、色分離処理としてデモザイク処理が行われる。ＹＣ生成処理では、Ｒ、Ｇ、Ｂの画像データから、輝度（Ｙ）信号及び色（Ｃ）信号を生成（分離）する。解像度変換処理では、各種の信号処理が施された画像データに対して、解像度変換処理を実行する。
　コーデック処理では、上記の各種処理が施された画像データについて、例えば記録用や通信用の符号化処理、ファイル生成を行う。コーデック処理では、動画のファイル形式として、例えばＭＰＥＧ－２（ＭＰＥＧ：Moving Picture Experts Group）やＨ．２６４などの形式によるファイル生成を行うことが可能とされる。また静止画ファイルとしてＪＰＥＧ（Joint Photographic Experts Group）、ＴＩＦＦ（Tagged Image File Format）、ＧＩＦ（Graphics Interchange Format）等の形式のファイル生成を行うことも考えられる。なお、イメージセンサＩＳが測距センサとされている場合には、画像信号処理部４２は、例えば、ｉＴｏＦ（indirect Time of Flight）としてのイメージセンサＩＳから出力される二つの信号に基づいて被写体についての距離情報を算出して距離画像を出力する。

　センサ内制御部４３は、撮像部４１に対する指示を行って撮像動作の実行制御を行う。同様に、画像信号処理部４２に対しても処理の実行制御を行う。

　ＡＩ画像処理部４４は、撮像画像についてＡＩ画像処理としての画像認識処理を行う。

　本実施の形態において、ＡＩ画像処理部４４は、ＤＳＰ（Digital Signal Processor）によって実現される。

　ＡＩ画像処理部４４で実現可能な画像認識の機能は、ＡＩ画像処理のアルゴリズムを変更することにより切り替えることが可能とされる。換言すれば、ＡＩ画像処理に用いられるＡＩモデルを切り替えることで、ＡＩ画像処理の機能種別を切り替えることができる。ＡＩ画像処理の機能種別については種々考えられるが、例えば以下に例示するような種別を挙げることができる。
　・クラス識別
　・セマンティックセグメンテーション
　・人物検出
　・車両検出
　・ターゲットのトラッキング
　・ＯＣＲ（Optical Character Recognition：光学文字認識）

　上記の機能種別のうち、クラス識別は、ターゲットのクラスを識別する機能である。ここで言う「クラス」とは、物体のカテゴリを表す情報であり、例えば「人」「自動車」「飛行機」「船」「トラック」「鳥」「猫」「犬」「鹿」「蛙」「馬」等を区別するものである。
　ターゲットのトラッキングとは、ターゲットとされた被写体の追尾を行う機能であり、該被写体の位置の履歴情報を得る機能と換言できるものである。

　ＡＩモデルの切り替えは、クラウド側情報処理装置からの指示によってなされてもよいし、カメラ３の制御部３３やセンサ内制御部４３の判定処理に基づいてなされてもよい。また、ＡＩモデルの切り替えを行う際には、メモリ部４５に記憶される複数のＡＩモデルから切り替えられてもよいし、クラウド側情報処理装置からＡＩモデルを受信して展開することにより切り替えられてもよい。切り替えのたびにクラウド側情報処理装置からＡＩモデルを受信することにより、メモリ部４５の容量を抑えることができ、小型化や省電力化及びコスト削減を図ることができる。

　メモリ部４５には、画像信号処理部４２により得られた撮像画像データ（ＲＡＷ画像データ）や同時化処理後の画像データが保存される所謂フレームメモリとして利用可能である。また、メモリ部４５は、ＡＩ画像処理部４４がＡＩ画像処理の過程で用いるデータの一時的な記憶にも用いることが可能とされる。

　また、メモリ部４５には、ＡＩ画像処理部４４で用いられるＡＩアプリケーションやＡＩモデルの情報が記憶される。
　なお、ＡＩアプリケーションやＡＩモデルの情報は、後述するコンテナ技術を用いて、コンテナなどとしてメモリ部４５に展開されてもよいし、マイクロサービス技術を用いて展開されてもよい。ＡＩ画像処理に用いられるＡＩモデルをメモリ部４５に展開することにより、ＡＩ画像処理の機能種別を変更したり、再学習によって性能の向上が図られたＡＩモデルに変更したりすることができる。
　なお、上述のように本実施の形態においては画像認識に用いられるＡＩモデルやＡＩアプリケーションについての例に基づいた説明を行っているが、これに限定されず、ＡＩ技術を用いて実行されるプログラム等が対象とされていてもよい。
　また、メモリ部４５の容量が小さい場合には、ＡＩアプリケーションやＡＩモデルの情報は、コンテナ技術を用いて、コンテナなどとしてメモリ部３４などイメージセンサＩＳ外のメモリに展開した後、ＡＩモデルだけを下記で説明する通信Ｉ／Ｆ４６を介してイメージセンサＩＳ内のメモリ部４５に格納させるようにしてもよい。

　通信Ｉ／Ｆ４６は、イメージセンサＩＳの外部にある制御部３３やメモリ部３４等との通信を行うインタフェースである。通信Ｉ／Ｆ４６は、画像信号処理部４２が実行するプログラムやＡＩ画像処理部４４が利用するＡＩアプリケーションやＡＩモデルなどを外部から取得するための通信を行い、イメージセンサＩＳが備えるメモリ部４５に記憶させる。
　これにより、ＡＩモデルがイメージセンサＩＳが備えるメモリ部４５の一部に記憶され、ＡＩ画像処理部４４による利用が可能となる。

　ＡＩ画像処理部４４は、このようにして得られたＡＩアプリケーションやＡＩモデルを用いて所定の画像認識処理を行うことにより目的に準じた被写体の認識を行う。

　ＡＩ画像処理の認識結果情報は、通信Ｉ／Ｆ４６を介してイメージセンサＩＳの外部に出力される。

　即ち、イメージセンサＩＳの通信Ｉ／Ｆ４６からは、画像信号処理部４２から出力される画像データだけでなく、ＡＩ画像処理の認識結果情報が出力される。
　なお、イメージセンサＩＳの通信Ｉ／Ｆ４６からは、画像データと認識結果情報の何れか一方だけを出力させることもできる。

　例えば、上述したＡＩモデルの再学習機能を利用する場合には、再学習機能に用いられる撮像画像データが通信Ｉ／Ｆ４６及び通信部３５を介してイメージセンサＩＳからクラウド側情報処理装置にアップロードされる。

　また、ＡＩモデルを用いた推論を行う場合には、ＡＩ画像処理の認識結果情報が通信Ｉ／Ｆ４６及び通信部３５を介してイメージセンサＩＳからカメラ３外の他の情報処理装置に出力される。

＜５．イメージセンサの構成＞
　上述したイメージセンサＩＳの構成は各種考えられる。本実施の形態においては、イメージセンサＩＳが３層に積層された構造を備えている。

　イメージセンサＩＳは、図８に示すように、半導体基板とされたダイが３層に亘って積層された１チップの半導体装置として構成されている。具体的には、イメージセンサＩＳは、半導体基板の第一層を形成するダイＤ１と、第二層を形成するダイＤ２と、第三層を形成するダイＤ３とを備えている。
　各層は、例えば、Ｃｕ－Ｃｕ接合により電気的に接続されている。

　イメージセンサＩＳは、図７に示すように機能ごとに分類された撮像部４１、画像信号処理部４２、センサ内制御部４３、ＡＩ画像処理部４４、メモリ部４５、通信Ｉ／Ｆ４６とを備えているが、各機能は一つの層に電子部品が実装されることにより１層で完結しているものもあれば複数の層に亘って電子部品が実装されているものもある。

　具体的には、撮像部４１には、ダイＤ１に設けられた画素アレイ部４１ａと、ダイＤ２に設けられたアナログ回路部４１ｂとが含まれている（図８参照）。

　アナログ回路部４１ｂは、読み出し回路としてのトランジスタや垂直駆動回路やコンパレータ、或いは、ＣＤＳ処理やＡＧＣ処理などを実行する回路やＡ／Ｄ変換部等を含むアナログ回路部４１ｂとを備えている。

　また、画像信号処理部４２には、ダイＤ２に設けられたロジック回路部４２ａと、ダイＤ３に設けられたＩＳＰ（Image Signal Processor）４２ｂとが含まれている。

　ロジック回路部４２ａは、Ａ／Ｄ変換部によって生成されたデジタルデータとしての撮像画像信号に対して欠陥画素を検出して補正する処理を行う回路などを備えている。

　ＩＳＰ４２ｂは、同時化処理やＹＣ生成処理や解像度変換処理やコーデック処理やノイズ除去処理などを行う。なお、一部の処理がセンサ内制御部４３によって実行されてもよい。

　センサ内制御部４３は、ダイＤ３に設けられるＣＰＵ４３ａなどにより構成されており、所定のプログラムを実行することにより図９に示す制御機能Ｆ１１と認証機能Ｆ１２と暗号機能Ｆ１３して機能する。各機能については後述する

　ＡＩ画像処理部４４は、ダイＤ３に設けられ推論処理部として機能する。

　なお、第三層にＡＩ画像処理部４４としてのプロセッサとは異なり且つ処理能力の高いＣＰＵ４３ａなどのプロセッサが設けられることにより、エッジ強調処理やスケーリング処理やアフィン変換処理などのＣＶ（Computer Vision）処理をＣＰＵ４３ａなどで行うことができる。これにより、ＩＳＰ４２ｂでＣＶ処理を行うよりも処理時間を短縮することができる。
　なお、これらのＣＶ処理は、例えば、ＡＩモデルへの入力画像を生成するための処理とされる。即ち、これらのＣＶ処理は、ＡＩモデルの入力テンソルとして規定されている所定サイズの画像データであって、ＡＩ画像処理に適した画像データを生成する処理とされる。
　また、ＣＶ処理は、処理単位ごとに複数のラインを用いた処理を実行するものであれば、ＡＩモデルへの入力画像を生成する処理でなくてもよい。
　例えば、ＡＩ画像処理によって人物が検出された領域に対してバウンディングボックスを（強調して）描画する処理などであってもよい。

　メモリ部４５には、ダイＤ２に設けられる第二層記憶部４５ａと、ダイＤ３に設けられる第三層記憶部４５ｂとが含まれる。

　第二層記憶部４５ａは、ＩＳＰ４２ｂによって同時化処理が行われた後の画像データやＲＡＷ画像データが記憶されるフレームメモリとして機能する。なお、フレームメモリが第２層ではなく第３層やイメージセンサＩＳ外に設けられていたとしても、上述或いは後述の効果を得ることは可能である。

　第三層記憶部４５ｂは、ＡＩ画像処理部４４によるＡＩ画像処理の過程や結果等が記憶されるワーキングメモリとして機能する。また、第三層記憶部４５ｂは、ＡＩモデルについての重み係数やパラメータ等が記憶され、ＡＩモデルの展開先の記憶部として機能する。

　第三層記憶部４５ｂとＡＩ画像処理部４４が同じ層に設けられることで、ＡＩモデルを用いた推論処理の過程で発生する各種の中間データなどの転送速度や読出速度を向上させることができ、推論処理に要する時間を短縮することができる。

　第二層に第二層記憶部４５ａが設けられることで、第三層記憶部４５ｂに記憶されるデータの一部を第二層記憶部４５ａに記憶させることができ、第三層記憶部４５ｂの容量を小さくすることができる。これにより第三層記憶部４５ｂの小型化が図られ、第三層を形成する半導体基板のチップサイズの小型化や第三層に付加機能を追加してイメージセンサＩＳの高機能化を図ることが可能となる。

　また、第二層にフレームメモリとしての第二層記憶部４５ａが設けられることで、フレーム画像に対して異なる複数の処理を行いたい場合に好適である。

　更に、第二層にフレームメモリとしての第二層記憶部４５ａが設けられることで、マスク処理やバウンディングボックスの追加などの処理について、フレームメモリに記憶されたフレーム画像の一部の画素値を書き換えることで実現できる。
　これらの処理は、ＣＰＵ４３ａやメモリコントローラ、或いはそれらの協業によって実現可能である。

　なお、第二層記憶部４５ａや第三層記憶部４５ｂは、ＲＡＭだけでなくＲＯＭを有して構成されていてもよい。

　通信Ｉ／Ｆ４６は、ダイＤ２に設けられる。

　画素アレイ部４１ａが設けられた第一層とされたダイＤ１が最外層とされることにより、画素アレイ部４１ａに光が入射されやすく、光電変換処理の変換効率が向上される。

　また、画素アレイ部４１ａが備える各画素から読み出された画素信号に対してＡ／Ｄ変換を行う変換処理部として機能するアナログ回路部４１ｂが設けられた第二層が画素アレイ部４１ａが配置された第一層と積層方向に隣接して設けられることで、光電変換処理からデジタルデータとしての撮像画像信号が生成されるまでの処理を高速化することができる。

　また、第一層と第二層の間に他の層が配置されないことで、層間の配線がしやすく配線部材を削減することができる。
　また、画素アレイ部４１ａが設けられた第一層とＡＩ画像処理を実行するＡＩ画像処理部４４が設けられた第三層とが積層方向に離れて位置されているため、ＡＩ画像処理部４４の処理実行中に発生する電磁ノイズの画素アレイ部４１ａに蓄積された電荷に対する影響を抑制することができる。

　また、高電圧で駆動するアナログ回路部４１ｂが第三層に設けられていないため、第三層を形成する半導体基板としてのダイＤ３の製造において半導体製造の先端プロセスを採用することができ、各素子の微細化を図ることができる。

　また、従来では、画素アレイ部４１ａが実装された第一層と、それ以外の各部の全てが実装された第二層から成る二層構造のイメージセンサＩＳが知られていた。しかし、イメージセンサＩＳの高機能化を図るために実装される電子部品が多くなると、第二層の面積が大きくなり、第二層の大きさに合わせて第一層が大型化してしまうという問題があった。この場合には、第一層に部品が実装されない余り領域が発生してしまい、基板の利用効率の面で適切とは言い難かった。

　しかし、図８や後述の図１０に示すように、画素アレイ部４１ａ以外の部品を二つの層に分けて実装することで、第二層と第三層のチップサイズを小型化することができる。これにより、イメージセンサＩＳの全体の大きさを画素アレイ部４１ａの大きさに合わせることができ、イメージセンサＩＳ全体の小型化を図ることができる。

　図９に示す制御機能Ｆ１１は、上述したように、撮像部４１や画像信号処理部４２に対する指示を行い、所望の撮像画像データが得られるように撮像動作を制御する。
　また、制御機能Ｆ１１は、ＡＩモデルを用いたＡＩ画像処理を実現するためにＡＩ画像処理部４４に対する指示を行う。

　認証機能Ｆ１２は、イメージセンサＩＳ内に保持された証明書を用いて当該イメージセンサＩＳが登録済みであることをクラウド側情報処理装置において認証してもらうように要求を送信し、クラウド側情報処理装置との通信を確立する。

　暗号機能Ｆ１３は、ＡＩモデルがイメージセンサＩＳ外から展開される場合において、復号鍵を用いて展開されたＡＩモデルの復号を行う。
　また、暗号機能Ｆ１３は、イメージセンサＩＳから出力される画像データを暗号化鍵を用いて暗号化する処理を行う。

　認証機能Ｆ１２が扱う証明書や暗号機能Ｆ１３が扱う復号鍵や暗号化鍵は、第二層記憶部４５ａや第三層記憶部４５ｂのＲＯＭやＲＡＭに記憶される。

　イメージセンサＩＳの各層を形成するダイＤ１、Ｄ２、Ｄ３に配置される各部の配置例を図１０に示す。

　第一層を形成するダイＤ１には、略全面に亘って画素アレイ部４１ａが形成されている。

　第二層を形成するダイＤ２には、アナログ回路部４１ｂとロジック回路部４２ａと第二層記憶部４５ａと通信Ｉ／Ｆ４６とが設けられている。

　第二層記憶部４５ａはアナログ回路部４１ｂやロジック回路部４２ａと隣接して設けられることで、各部の第二層記憶部４５ａへのアクセスを高速化することが可能となる。

　第三層を形成するダイＤ３には、ＩＳＰ４２ｂとＣＰＵ４３ａとＡＩ画像処理部４４と第三層記憶部４５ｂとが設けられている。

　第三層記憶部４５ｂはＩＳＰ４２ｂやＣＰＵ４３ａやＡＩ画像処理部４４と隣接して設けられることで、各部における処理の高速化を図ることができる。特に、ＡＩ画像処理部４４が実行するＡＩ画像処理は中間データなどを大量に扱うこともあり、第三層記憶部４５ｂが隣接して設けられることの効果が大きい。

　また、図１０に示す本例では、各層のチップサイズが同一とされている。各層のチップサイズが統一されたイメージセンサＩＳは、円盤状のシリコンウエハの状態で各層を重ね合わせた後にダイシングを行う所謂ＷｏＷ（Wafer on Wafer）方式によって製造することが可能であるため、ダイシングの工程を１度で済ませることができる。また、大きな部材であるシリコンウエハの状態で重ね合わせるため、各チップの位置決めがしやすくされる。これにより、製造工程の難度を下げることができ工程の円滑化を図ることができる。

　なお、各層がウエハの状態で積層されて一度のダイシングで切り出された場合には、各層のチップサイズが同一であると見なすことができる。

＜６．イメージセンサの構成についてのその他の例＞
　イメージセンサＩＳの構成については各種考えられる。ここでは、上述したイメージセンサＩＳの構成以外の例をその他の例として説明する。

　その他の一つ目の構成例を図１１に示す。一つ目の構成例は、第三層にセンサ内制御部４３（ＣＰＵ４３ａ）が設けられていないものである。例えば、上述のように、プライバシー保護のために画像内の人物を塗りつぶすマスク処理や、ＡＩ画像処理によって検出された被写体の種別を提示するためにバウンディングボックスを付与する処理などは、フレームメモリとしての第二層記憶部４５ａに記憶されたフレーム画像の画素値を直接操作することで実現可能であるが、当該処理はメモリコントローラなどによって実現可能であるため、ＣＰＵ４３ａを設けなくても済む。

　その他の二つ目の構成例を図１２に示す。二つ目の構成例は、第三層を構成するダイＤ３のチップサイズが第一層及び第二層を構成するダイＤ１、Ｄ２のチップサイズよりも小さくされており、具体的には、矩形状のチップ形状の短辺の長さが短くされている。

　これにより、１枚のウエハに形成されるダイＤ３の個数が多くされ、チップのコスト削減を図ることができる。また、第三層のチップは、ダイシング後に第二層を構成するダイＤ２に積層される。従って、検査によって良品とされたダイＤ３のみを積層させることができるため、イメージセンサＩＳの歩留まりを向上させることができる。

　その他の三つ目の構成例を図１３に示す。三つ目の構成例は、第三層に二つのダイＤ３ａ、Ｄ３ｂが含まれている。
　例えば、ダイＤ３ａにはＩＳＰ４２ｂとＡＩ画像処理部４４とが設けられ、ダイＤ３ｂには第三層記憶部４５ｂが設けられている。

　これにより、ダイＤ３ａとダイＤ３ｂとを異なるプロセスで製造することが可能となる。
　例えば、ダイＤ３ｂに設けられるＩＳＰ４２ｂやＡＩ画像処理部４４としてのＤＳＰを数ｎｍの先端プロセスで製造すると共に、ダイＤ３ｂに設けられる第三層記憶部４５ｂを高集積とされたＤＲＡＭ（Dynamic Random Access Memory）として異なる製造プロセスで製造することが可能となる。
　ＤＲＡＭとされた第三層記憶部４５ｂが高集積とされることにより、第三層記憶部４５ｂの記憶容量の増加或いは第三層記憶部４５ｂの小型化を図ることが可能となる。そして、第三層記憶部４５ｂを小型化した場合には、削減されたスペースに他の機能を実現するためのチップを配置することが可能となり、イメージセンサＩＳの高機能化を図ることができる。

　また、図１３に示すように、第三層に配置された二つのダイＤ３ａ、Ｄ３ｂは、積層される面の短辺が延びる方向に離隔して配置されている。
　これにより、ダイＤ３ａとダイＤ３ｂ間の配線数を多くすることができ、両チップ間のデータ転送速度を向上させることができ、処理の高速化を図ることができる。

　なお、両チップ間を転送されるデータ量が決まっている場合には、配線数が多い分所定の時間内に転送を完了させるために必要なデータ転送速度が低くされる。従って、データ転送によって生じる電磁ノイズを低減させることができる。

　一方、図１４に示すように、ダイＤ３ａとダイＤ３ｂが、積層される面の長辺が延びる方向に離隔して配置されてもよい。
　チップ間配線のデータ転送によって生じる電磁ノイズの影響は、チップの積層方向において、チップ間配線と読み出し回路が積層方向において重なる画素の画素信号ほど強くなる。
　従って、電磁ノイズの影響を受ける画素が特定しやすくされるため、ノイズリダクションの方法が複雑化せずに済む。

　なお、第二層と第三層の間に面積の広い配線（所謂「銅箔ベタ塗りの配線」）を設けることにより、磁界シールドとして利用できる。これにより、第三層において発生する電磁ノイズによる第二層や第一層に対する影響を抑制することが可能となる。

　その他の四つ目の構成例を図１５に示す。四つ目の構成例は、第三層の各部の配置を上述の例とは異ならせたものである。具体的には、積層方向から見たときのダイＤ２に設けられたアナログ回路部４１ｂとダイＤ３に設けられたＡＩ画像処理部４４とが重なる領域の面積を小さくしたものである。

　そして、アナログ回路部４１ｂの一部として設けられＡ／Ｄ変換を行う変換処理部４８は、積層方向から見たときに第三層に配置されるＡＩ画像処理部４４とは重ならない位置に配置される。
　これにより、ＡＩ画像処理部４４によるＡＩ画像処理の実行中に発生する電磁ノイズがＡ／Ｄ変換の結果に影響を及ぼす可能性を低減させることができる。従って、Ａ／Ｄ変換後のデジタルデータとしてノイズの少ない撮像画像データ（ＲＡＷ画像データ）を生成することができる。
　また、これにより、Ａ／Ｄ変換と推論処理を同時に実行させることができるため、処理時間の長い複雑なＡＩ画像処理を実行することも可能となる。

　その他の五つ目の構成例を図１６及び図１７に示す。五つ目の構成例は、画像信号処理部４２としてロジック回路部４２ａ及びＩＳＰ４２ｂに加えてＣＶＤＳＰ４２ｃを備えている。そして、ＣＶＤＳＰ４２ｃは、ＣＶ処理を行うＤＳＰによって構成され、図１６に示すように第三層を構成するダイＤ３に設けられている。

　ＩＳＰ４２ｂが画素アレイ部４１ａのラインごとに出力されるラインデータに対して画像処理を行うのに対して、ＣＶＤＳＰ４２ｃはフレームメモリとしての第二層記憶部４５ａに記憶されたフレーム画像に対して画像処理を行う。
　従って、ＣＶＤＳＰ４２ｃは、エッジ強調処理やスケーリング処理やアフィン変換処理など、画像処理の対象とされた画素と異なるラインの画素の画素データを用いた演算が必要な処理に好適である。

　即ち、ＣＶＤＳＰ４２ｃは、フレーム画像をラインデータに変換し直すことなくこれらの処理を実行することが可能とされており、処理速度の向上を図ることができる。また、ＣＶＤＳＰ４２ｃにより、例え画像の面全体のヒストグラムに基づいた画像処理など、処理単位ごとに複数ラインを用いた並列処理が必要な演算が可能となる。

　ＣＶＤＳＰ４２ｃは、図１７に示すように、第三層を構成するダイＤ３に設けられている。また、特に、ＣＶＤＳＰ４２ｃ及びＡＩ画像処理部４４は、第三層記憶部４５ｂと隣接するように配置されている。
　これにより、ＣＶＤＳＰ４２ｃやＡＩ画像処理部４４は、第三層記憶部４５ｂへアクセスしやすい構成とされており、処理の高速化を図ることができる。

＜７．ＡＩ画像処理の例＞
　ＡＩ画像処理部４４によって実行されるＡＩ画像処理の例について説明する。
　なお、ここまでの説明においてイメージセンサＩＳについての幾つかの構成例を挙げたが、以降の説明では図１６及び図１７を用いて説明したイメージセンサＩＳの五つ目の構成例においてＡＩ画像処理が実行される場合について説明する。

＜７－１．第１例＞
　ＡＩ画像処理についての第１例は、画像にマスク処理を施すものである。
　マスク処理前の画像Ｇｒ１の例を図１８に示す。

　マスク処理前の画像Ｇｒ１には、被写体としての人物Ａと箱状の物体Ｂが写っている。

　画像Ｇｒ１は入力テンソルとしてＡＩ画像処理部４４に入力される。ＡＩ画像処理部４４は、入力テンソルとしての画像Ｇｒ１において人物Ａが撮像された領域を推論するＡＩ画像処理を実行する。

　その結果、イメージセンサＩＳにおいて、撮像された人物Ａの画像領域が黒画像領域Ｃとして黒く塗りつぶされた画像Ｇｒ２（図１９参照）を得ることができる。

　なお、マスク処理後の画像Ｇｒ２の生成については幾つかの方法がある。
　一つは、ＡＩ画像処理部４４の入力テンソルはフレーム画像とされ、ＡＩ画像処理部４４の出力テンソルは図１９に示すような人物が撮像された画像領域が所定の色で塗りつぶされた画像とされたものである。即ち、ＡＩ画像処理部４４は、所定領域のマスクまでを行うものである。

　もう一つは、ＡＩ画像処理部４４の入力テンソルはフレーム画像とされ、ＡＩ画像処理部４４の出力テンソルは人物が撮像された画像領域を特定するための座標情報とされたものである。この場合には、ＣＰＵ４３ａや第二層記憶部４５ａのメモリコントローラが第二層記憶部４５ａに記憶されたフレーム画像において当該座標情報によって特定される画像領域を所定の画素値（０や２５５など）で上書きする処理を行う。

＜７－２．第２例＞
　ＡＩ画像処理についての第２例は、画像にバウンディングボックスを重畳させるものである。
　重畳前の画像Ｇｒ１は先の図１８に示すものである。画像Ｇｒ１には、人物Ａと物体Ｂが写っている。

　画像Ｇｒ１は入力テンソルとしてＡＩ画像処理部４４に入力される。ＡＩ画像処理部４４は、画像Ｇｒ１において人物Ａと物体Ｂを検出し、検出した人物Ａと物体Ｂの分類結果を示すラベルを付与する。その結果、フレーム画像にバウンディングボックスとしての枠画像Ｄが重畳された画像Ｇｒ３（図２０参照）が得られる。

　なお、画像Ｇｒ３の生成についても上述のように二通りの方法がある。即ち、一つ目の方法は、枠画像Ｄが重畳された状態の画像Ｇｒ３がＡＩ画像処理部４４の出力テンソルとして出力されるものである。
　もう一つの方法は、人物Ａと物体Ｂの座標情報とラベル情報がＡＩ画像処理部４４の出力テンソルとして出力されるものである。この場合には、ＣＰＵ４３ａや第二層記憶部４５ａのメモリコントローラが第二層記憶部４５ａに記憶されたフレーム画像において当該座標情報によって特定される画像領域を囲む矩形状に所定の画素値で上書きすることでバウンディングボックスとしての枠画像Ｄの重畳を行うものである。

　なお、バウンディングボックスとしての枠画像Ｄは各種考えられる。例えば、図２０に示すように、枠状の画像とラベル情報を表す文字情報が含まれた枠画像Ｄとされていてもよいし、枠状の画像のみの枠画像Ｄとされていてもよい。そして、枠画像Ｄが枠状の画像のみとされている場合には、該枠状の画像は被写体の分類結果に応じた色を有していてもよい。

＜７－３．第３例＞
　ＡＩ画像処理についての第３例及び後述する第４例は、ＡＩ画像処理部４４が複数のＡＩ画像処理を切り替えて実行するものである。

　第３例では、ＡＩ画像処理部４４は第一ＡＩモデルを用いた第一ＡＩ画像処理を行い、続けてＡＩモデルを第二ＡＩモデルへと切り替えた後、第二ＡＩモデルを用いた第二ＡＩ画像処理を行う。

　例えば、第一ＡＩ画像処理では、フレーム画像を入力テンソルとし、画像内に撮像された人物の年齢情報を推定し出力テンソルとして出力する。

　また、ＡＩモデルを切り替えて行われる第二ＡＩ画像処理では、フレーム画像を入力テンソルとし、画像内に撮像された人物の性別情報を推定して出力テンソルとして出力する。
　このとき、第一ＡＩ画像処理と第二ＡＩ画像処理の間にＣＶＤＳＰ４２ｃによるＣＶ処理は行われない。

＜７－４．第４例＞
　ＡＩ画像処理についての第４例は、第３例と同様に複数のＡＩ画像処理を切り替えて実行するものである。また、第３例との相違点として、両ＡＩ画像処理の間にＣＶＤＳＰ４２ｃによるＣＶ処理が行われる。

　例えば、第一ＡＩ画像処理では画像から人物の抽出を行い、ＣＶＤＳＰ４２ｃによるＣＶ処理によって画像における該当領域の切り出し処理を行い、続く第二ＡＩ画像処理ではＣＶＤＳＰ４２ｃによるＣＶ処理で切り出された画像（部分画像）を入力テンソルとして特徴量を検出する処理を行うことが考えられる。
　なお、このときＣＶＤＳＰ４２ｃの処理対象の画像は、第二層記憶部４５ａに記憶されたフレーム画像である。

　このように、ＡＩ画像処理部４４が複数のＡＩモデルを用いて複数のＡＩ画像処理を行う場合には、第一ＡＩ画像処理に特化した第一ＡＩモデルと、第二ＡＩ画像処理に特化した第二ＡＩモデルを用いることができる。従って、全体として確度の高い推論結果を得ることができる。

　なお、ＡＩモデルの切り替えは、ＡＩモデルの重み係数が切り替えられることにより行われる。これにより、簡易な処理でＡＩモデルの切り替えを行うことができる。

　また、第二ＡＩモデルに入力される入力テンソルは、ＣＶＤＳＰ４２ｃによって適切な画像処理が施されたものとされることにより、ＡＩ画像処理の認識率の向上を図ることができる。

　また、ＣＶＤＳＰ４２ｃによる画像処理は、第一ＡＩ画像処理の認識結果に応じた処理とされるが、その入力テンソルは、フレームメモリとしての第二層記憶部４５ａに記憶されたフレーム画像のデータとされている。
　即ち、イメージセンサＩＳがフレームメモリとしての第二層記憶部４５ａを備えていることによりこのような処理を実現することが可能となる。

　このように、第一ＡＩ画像処理において人物などの特定の対象物を検出する処理を行い、当該検出処理の結果に応じてＣＶＤＳＰ４２ｃが所定の画像領域を切り出す処理を行い、該切り出された部分画像を入力テンソルとして第二ＡＩ画像処理を行う例はいくつも考えられる。

　例えば、第一ＡＩ画像処理において顔検出を行い、ＣＶＤＳＰ４２ｃにおいて検出された画像領域を切り出す処理を行い、第二ＡＩ画像処理において顔の特徴量を検出する処理を行う。これにより、監視カメラの画像から特定の人物を探し出すような機能を実現することができる。

　また、第一ＡＩ画像処理において人物の体検出を行い、ＣＶＤＳＰ４２ｃにおいて検出された画像領域を切り出す処理を行い、第二ＡＩ画像処理において骨格推定や姿勢推定を行う。これにより、例えば、監視カメラの画像で捉えた人物の行動を推定する機能などを実現することができる。

　また、第一ＡＩ画像処理において車両のナンバープレートの検出を行い、ＣＶＤＳＰ４２ｃにおいて検出された画像領域を切り出す処理を行い、第二ＡＩ画像処理においてナンバープレートに記載された文字を推定する処理を行う。これにより、交通監視カメラにおいてカメラの前を通過した車両を特定する機能を実現することができる。

　このように、ＣＶＤＳＰ４２ｃによって画像における所定領域が切り出されることで、人物についての属性情報や、人物の姿勢情報や骨格情報や、ナンバープレートについての文字列を推定する処理などを第二ＡＩ画像処理で好適に行うことができる。

＜７－５．第５例＞
　ＡＩ画像処理についての第５例は、ＡＩ画像処理部４４が複数のＡＩ画像処理を切り替えて実行するものである。また、第４例との相違点は、ＣＶＤＳＰ４２ｃのＣＶ処理の処理対象の画像がフレームメモリとしての第二層記憶部４５ａに記憶されたフレーム画像ではなく、第一ＡＩ画像処理から出力された出力テンソルとしての画像とされた点である。

　即ち、ＣＶＤＳＰ４２ｃは、第一ＡＩ画像処理によって変更された画像に対して更なる変更を行うものである。

　具体的に、ＡＩ画像処理部４４は第一ＡＩモデルを用いた第一ＡＩ画像処理において、フレーム画像からノイズを除去するデノイズ処理を行う。
　ＣＶＤＳＰ４２ｃは、第一ＡＩモデルの出力テンソルとされたノイズ除去後の画像に対して、ＣＶ処理としてのエッジ強調処理を行う。

　ＡＩ画像処理部４４は、第二ＡＩモデルに対する入力テンソルとしてエッジ強調後の画像を入力し、人物検出などの検出処理を第二ＡＩ画像処理として行う。

　ＣＶＤＳＰ４２ｃは、ＡＩ画像処理部４４による第一ＡＩ画像処理の出力テンソルに対してＣＶ処理を行うことにより、第二ＡＩ画像処理に入力する入力テンソルとしての画像をより適切なものとすることができる。従って、第二ＡＩ画像処理によって被写体をより正確に推論することが可能となる。

　なお、第一ＡＩ画像処理としては、画像の劣化を補正する各種の劣化補正処理を適用することが可能である。また、ＣＶＤＳＰ４２ｃによるＣＶ処理としては、画像を鮮明化する各種の鮮明化処理を適用することができる。

　例えば、劣化補正処理としては、デノイズ処理の他にダイナミックレンジ補正処理などを挙げることができる。
　また、鮮明化処理としては、エッジ強調処理の他に彩度補正処理やコントラスト補正処理を挙げることができる。

　このように、第一ＡＩ画像処理として劣化補正処理を行い、更にＣＶＤＳＰ４２ｃによって鮮明化処理を施したことにより得られた画像を入力テンソルとして第二ＡＩ画像処理が行われることにより、第二ＡＩ画像処理において高精度の推論処理を行うことが可能となる。
　もちろん、上述の逆として、第一ＡＩ画像処理において鮮明化後の画像を推論する処理を行い、ＣＶＤＳＰ４２ｃにおいて劣化補正処理としてのＣＶ処理を実行してもよい。

＜８．処理の流れ＞
　上述したＡＩ画像処理の第１例から第５例の各例について、各部が実行する処理の流れを説明する。

＜８－１．第１例及び第２例＞
　ＡＩ画像処理の第１例は、画像の一部領域にマスク処理を施すものである（図１８及び図１９参照）。また、ＡＩ画像処理の第２例は、画像の一部領域にバウンディングボックスを重畳させるものである（図１８及び図２０参照）。ＡＩ画像処理の第１例及び第２例において各部が実行する処理の流れについて図２１に示す。

　先ず、ＩＳＰ４２ｂは、ステップＳ１０１において、画素アレイ部４１ａから出力された画素信号に対してアナログ回路部４１ｂ及びロジック回路部４２ａの処理を施すことにより得られたフレーム画像に基づいて入力テンソルを生成する。この処理は、例えば、フレーム画像をそのまま入力テンソルとしてもよいし、後段のＡＩモデルの入力テンソルのフォーマットに合わせるようにフレーム画像を変換する処理を行ってもよい。

　生成された入力テンソルは、ステップＳ２０１において第二層記憶部４５ａに記憶される。

　ＡＩ画像処理部４４はステップＳ２０２において第二層記憶部４５ａから入力テンソルを取得する。当該入力テンソルはステップＳ３０１において第一ＡＩ画像処理としての推論処理を行うために第一ＡＩモデルに供される。

　ＡＩ画像処理部４４はステップＳ３０２において第一ＡＩモデルの出力テンソルとして座標情報をＣＰＵ４３ａに出力する。なお、当該座標情報は一度メモリ部４５に記憶されることによりメモリ部４５を介してＣＰＵ４３ａに出力されてもよい。

　ＣＰＵ４３ａはステップＳ４０１において、座標情報に応じた上書き処理を行う。この上書き処理によって、第二層記憶部４５ａにおいてはステップＳ２０３としての画素値の上書きが行われる。これにより、例えば人物が撮像された画像領域が黒画像に置き換えられる処理やバウンディングボックスを重畳させる処理が実現される。

＜８－２．第３例＞
　ＡＩ画像処理の第３例は、複数のＡＩ画像処理を切り替えて実行するものである。ＡＩ画像処理の第３例において各部が実行する処理の流れについて図２２に示す。

　ＡＩ画像処理部４４はステップＳ２０２において第二層記憶部４５ａから入力テンソルを取得する。当該入力テンソルはステップＳ３０３において第一ＡＩ画像処理としての推論処理を行うために第一ＡＩモデルに供される。第一ＡＩ画像処理は、例えば、被写体としての人物の年齢を推論する処理とされる。

　ＡＩ画像処理部４４はステップＳ３０４において第一ＡＩモデルの第一出力テンソルとしての推論結果（例えば推定年齢情報）がイメージセンサＩＳ外に出力される。また、このとき、ＣＰＵ４３ａに対して推論処理の完了通知が送信される。

　完了通知を受信したＣＰＵ４３ａは、ステップＳ４０２において、ＡＩモデルの切り替え指示を送信する。

　この指示に応じて、ＡＩ画像処理部４４では、ステップＳ３０５のＡＩモデル切り替えが行われる。これにより、第一ＡＩモデルから第二ＡＩモデルへと切り替えられる。

　ＡＩ画像処理部４４は、ステップＳ２０４において再度第二層記憶部４５ａから入力テンソルを取得する。この入力テンソルは、第一ＡＩモデルに入力された入力テンソルと同じものであってもよい。

　ＡＩ画像処理部４４はステップＳ３０６において、第二ＡＩモデルを用いた第二ＡＩ画像処理を実行する。第二ＡＩ画像処理は、例えば、被写体としての人物の性別を推論する処理とされる。

　続けて、ＡＩ画像処理部４４はステップＳ３０７において、第二ＡＩモデルの第二出力テンソルとしての推論結果（例えば推定性別情報）がイメージセンサＩＳ外に出力される。このとき、ＣＰＵ４３ａに完了通知が送信されてもよい。

＜８－３．第４例＞
　ＡＩ画像処理の第４例は、複数のＡＩ画像処理を切り替えて実行するものである。また、両ＡＩ画像処理の間にＣＶＤＳＰ４２ｃによるＣＶ処理が行われる。ＡＩ画像処理の第４例において各部が実行する処理の流れについて図２３に示す。

　ＡＩ画像処理部４４はステップＳ２０２において第二層記憶部４５ａから入力テンソルを取得する。当該入力テンソルはステップＳ３０８において第一ＡＩ画像処理としての推論処理を行うために第一ＡＩモデルに供される。第一ＡＩ画像処理は、例えば、被写体としての人物の顔が写る画像領域を特定する処理とされる。

　ＡＩ画像処理部４４はステップＳ３０９において第一ＡＩモデルの第一出力テンソルとしての座標情報がＣＰＵ４３ａに出力される。

　座標情報を受信したＣＰＵ４３ａは、ステップＳ４０３において、ＣＶＤＳＰ４２ｃに対する切り出し指示を行う。このとき、ＣＰＵ４３ａはＣＶＤＳＰ４２ｃに対して受信した座標情報を送信する。

　座標情報を受信したＣＶＤＳＰ４２ｃは、ステップＳ２０５において第二層記憶部４５ａからフレーム画像を取得する。

　ＣＶＤＳＰ４２ｃは、ステップＳ５０１において、取得したフレーム画像から座標情報に基づいて特定された画像領域を切り出す処理を行う。これによりＣＶＤＳＰ４２ｃは人物の顔が含まれた部分画像を得る。

　ＣＶＤＳＰ４２ｃはステップＳ５０２において、当該部分画像をＡＩ画像処理部４４に出力する。

　一方、ＣＰＵ４３ａは、切り出し指示をした後、或いは切り出し指示を行うと略同時に、ＡＩ画像処理部４４に対してステップＳ４０２でＡＩモデルの切り替え指示を行う。

　この指示に応じて、ＡＩ画像処理部４４では、ステップＳ３０５のＡＩモデル切り替えが行われる。

　ＡＩ画像処理部４４は、ＡＩモデルの切り替え処理の後、ステップＳ５０２でＣＶＤＳＰ４２ｃから受信した部分画像を入力テンソルとしてステップＳ３１０で第二ＡＩ画像処理を行う。この処理は、部分画像に含まれる人物の顔についての特徴量を検出する処理である。

　ＡＩ画像処理部４４はステップＳ３１１において、検出した特徴量を第二出力テンソルとしてイメージセンサＩＳ外に出力する。

＜８－４．第５例＞
　ＡＩ画像処理の第５例は、ＡＩ画像処理部４４が複数のＡＩ画像処理を切り替えて実行するものである。また、ＣＶＤＳＰ４２ｃのＣＶ処理の処理対象の画像がフレームメモリとしての第二層記憶部４５ａに記憶されたフレーム画像ではなく、第一ＡＩ画像処理から出力された出力テンソルとしての画像とされている。ＡＩ画像処理の第５例において各部が実行する処理の流れについて図２４に示す。

　ＡＩ画像処理部４４はステップＳ２０２において第二層記憶部４５ａから入力テンソルを取得する。当該入力テンソルはステップＳ３１２において第一ＡＩ画像処理としての推論処理を行うために第一ＡＩモデルに供される。第一ＡＩ画像処理は、例えば、画像からノイズを除去するデノイズ処理とされる。

　ＡＩ画像処理部４４はステップＳ３１３において第一ＡＩモデルの第一出力テンソルとしてのノイズ除去後の画像データを第三層記憶部４５ｂに出力する。これにより第三層記憶部４５ｂはステップＳ６０１においてノイズ除去後の画像データが記憶される。

　また、第一出力テンソルの出力時にＡＩ画像処理部４４はＣＰＵ４３ａに対してデノイズ処理の完了通知が送信される。

　完了通知を受信したＣＰＵ４３ａは、ステップＳ４０４において、ＣＶＤＳＰ４２ｃに対して画像を鮮明化する処理の一例であるエッジ強調を実行させるための指示を行う。これに応じてＣＰＵ４３ａはＣＶＤＳＰ４２ｃに対して指示情報を送信する。

　エッジ強調についての指示情報を受信したＣＶＤＳＰ４２ｃは、ステップＳ６０２において第三層記憶部４５ｂからノイズ除去後の画像データを取得する。

　ＣＶＤＳＰ４２ｃは、ステップＳ５０３において、取得したノイズ除去後の画像データに対してエッジを強調するための画像処理を施す。これによりＣＶＤＳＰ４２ｃはエッジ強調後の画像データを得る。

　ＣＶＤＳＰ４２ｃはステップＳ５０４において、エッジ強調後の画像データをＡＩ画像処理部４４に送信する。なお、ＣＶＤＳＰ４２ｃからＡＩ画像処理部４４に対してエッジ強調後の画像データを送信する際には、一時的に第三層記憶部４５ｂに当該画像データを記憶してもよい。

　一方、ＣＰＵ４３ａは、エッジ強調指示をした後、或いはエッジ強調指示をすると略同時に、ＡＩ画像処理部４４に対してステップＳ４０２でＡＩモデルの切り替え指示を行う。

　ＣＰＵ４３ａは、ＡＩモデルの切り替え処理の後、ステップＳ５０４でＣＶＤＳＰ４２ｃから受信したエッジ強調後の画像データを入力テンソルとしてステップＳ３１４で第二ＡＩ画像処理を行う。この処理は、画像に含まれる人物を検出する処理である。

　ＡＩ画像処理部４４はステップＳ３１５において、検出した人物についての情報を第二出力テンソルとしてイメージセンサＩＳ外に出力する。

＜９．タイミングチャート＞
　上述した各例を実現するにあたって各部における各処理の実行タイミングを説明する。
　一つ目の実行タイミングの例について図２５に示す。

　一つ目の実行タイミングの例は、ＡＩ画像処理部４４によるＡＩ画像処理がアナログ回路部４１ｂによるＡ／Ｄ変換処理と実行期間が被らないようにされたものである。即ち、一つのフレーム画像が生成されるフレーム期間Ｔｆの間にＡ／Ｄ変換処理とＡＩ画像処理とが時分割で実行されることにより完了する。

　具体的には、Ａ／Ｄ変換と略同時にＩＳＰ４２ｂによる現像などの処理が行われる。これにより、ＡＩモデルへの入力テンソルが生成される。

　現像処理が完了した後、ＡＩ画像処理部４４によるＡＩ画像処理が実行され、ＡＩ画像処理の完了後にＡＩモデルからの出力テンソルとしての推論結果が出力される。現像処理の完了はＡ／Ｄ変換処理の完了後であるため、必然的にＡ／Ｄ変換処理の完了後にＡＩ画像処理が実行されることになる。

　上述したＡＩ画像処理の第１例及び第２例は、一つのＡＩモデルを用いて一つのＡＩ画像処理を行うものであるため、Ａ／Ｄ変換処理の合間にＡＩ画像処理を行うことが比較的容易である。

　Ａ／Ｄ変換処理とＡＩモデルによる推論処理は実行時間が重ならないようにされることにより、ＡＩ画像処理部４４による推論処理の実行中に発生する電磁ノイズがＡ／Ｄ変換の結果に影響を及ぼす可能性を排除することができる。

　次に二つ目の実行タイミングの例について図２６に示す。アナログ回路部４１ｂによるＡ／Ｄ変換処理とＩＳＰ４２ｂによる現像処理のタイミングは一つ目の実行タイミングの例と同様である。但し、ＡＩ画像処理部４４による処理タイミングが一つ目の実行タイミングの例と異なる。

　具体的には、アナログ回路部４１ｂによるＡ／Ｄ変換処理とＡＩ画像処理部４４によるＡＩ画像処理は、合計の実行期間がフレーム期間Ｔｆを超える長さとされる。即ち、ＡＩ画像処理部４４によるＡＩ画像処理は、Ａ／Ｄ変換処理と実行期間が一部被るようにされる。

　　例えば、ＡＩ画像処理の第３例と第４例と第５例は複数のＡＩ画像処理が実行されるため、ＡＩ画像処理に係る処理時間が長くなりがちである。従って、演算量が多い場合にはＡ／Ｄ変換処理とＡＩ画像処理の実行期間が一部重ならざるを得ない場合がある。

　なお、Ａ／Ｄ変換処理はＡＩ画像処理の実行中に並行して行われるため、ＡＩ画像処理部４４による推論処理の実行中に発生する電磁ノイズがＡ／Ｄ変換処理の処理結果に影響を及ぼすことが考えられる。

　従って、ＡＩ画像処理部４４のＡＩ画像処理が実行中に行われたＡ／Ｄ変換処理の実行後のデジタルデータに対して、ＩＳＰ４２ｂやＣＶＤＳＰ４２ｃなどの処理部によるノイズリダクション機能を実行させることにより電磁ノイズによる画質劣化を抑制してもよい。

　最後に三つ目の実行タイミングの例について図２７に示す。一つ目の実行タイミングの例と同様に、アナログ回路部４１ｂによるＡ／Ｄ変換処理とＡＩ画像処理部４４によるＡＩ画像処理の実行期間は被らないようにされる。また、ＡＩ画像処理後に行われるＣＰＵ４３ａによるメモリの上書き処理と通信Ｉ／Ｆ４６による画像出力処理についてもＡ／Ｄ変換処理と実行期間が被らないようにされる。

　これにより、Ａ／Ｄ変換処理と並行して行われる処理が少なくなるため、Ａ／Ｄ変換の処理結果に電磁ノイズの影響が生じてしまうことを防止することができる。

＜１０．プライバシー保護のための構成＞
　上述した例では、プライバシーを保護するために人物が撮像された画像領域に対するマスク処理（以降、「プライバシーマスク処理」と記載）を行う例について説明した。
　ここでは、イメージセンサＩＳ外にプライバシーの保護が確保されていない画像を出力しないようにイメージセンサＩＳが備える構成の例について説明する。

　イメージセンサＩＳにおける第三層を形成するダイＤ３に設けられたセンサ内制御部４３としてのＣＰＵ４３ａは、図２８に示すように、制御機能Ｆ１１、認証機能Ｆ１２及び暗号機能Ｆ１３に加えて通信制御機能Ｆ１４を有している。

　制御機能Ｆ１１と認証機能Ｆ１２と暗号機能Ｆ１３については上述したため、説明を省略する。
　通信制御機能Ｆ１４は、例えばイメージセンサＩＳの外部に設けられたアンテナの制御を行うことにより、カメラ３から撮像画像データや推論結果としてのメタデータなどが他の機器に送信される際の通信制御を行う。

　通信制御機能Ｆ１４によって実現される他の機器との通信は、例えば、ＳＩＧＦＯＸやＬＴＥ－Ｍ（Long Term Evolution Machine）などのＬＰＷＡ（Low Power Wide Area）である。

　イメージセンサＩＳから送信される画像データの一部がプライバシーマスク処理によってマスクされることにより、例えば、プライバシーに配慮した画像データのみを出力することが可能となる。具体的には、画像における人物が写った画像領域を対象としたプライバシーマスク処理が行われることにより、個人情報の流出を回避することができる。

　なお、イメージセンサＩＳが推論結果として得られた出力テンソルとしての画像データだけでなく、ＡＩモデルに入力される入力テンソルとしての画像データをイメージセンサＩＳの外部やカメラ３の外部に送信する場合がある。これは、イメージセンサＩＳの動作確認等を目的として行われるものである。即ち、イメージセンサＩＳは各種の画像データを外部に送信することが考えられるが、イメージセンサＩＳ内にプライバシーマスク処理を施すためのＡＩ画像処理部４４が設けられることでプライバシーの保護を強力に図ることが可能となる。

　また、カメラ３外にデータを送信するための送信制御を行う通信制御部がイメージセンサＩＳ内に設けられることで送信プログラムを改竄から保護し不正プログラムによるデータ送信を防止することができる。従って、セキュリティの向上を図ることができる。

＜１０－１．イメージセンサの構成例１＞
　イメージセンサＩＳの構成例１を図２９に示す。なお、図２９はイメージセンサＩＳが備える各部のうちプライバシーマスク処理に関連する部分のみを抜粋して示したものである。

　イメージセンサＩＳは、プライバシーマスク処理に関する部分として、画素アレイ部４１ａと回路部４９とＩＳＰ４２ｂとＡＩ画像処理部４４とメモリ部４５と通信Ｉ／Ｆ４６とを備えている。

　画素アレイ部４１ａについては上述した各例と同様の構成であるため説明を省略する。

　回路部４９は、上述したアナログ回路部４１ｂやロジック回路部４２ａを備えて構成されている。但し、回路部４９がアナログ回路部４１ｂのみを備える構成とされていてもよいし、アナログ回路部４１ｂとロジック回路部４２ａの双方を備える構成とされていてもよい。

　ＩＳＰ４２ｂは、ＡＩ画像処理部４４において構築されるＡＩモデルに対する入力テンソルとしての画像データを生成する処理を行う。

　ＡＩ画像処理部４４は、第一ＡＩモデルＭ１による第一ＡＩ画像処理と第二ＡＩモデルＭ２による第二ＡＩ画像処理とを実行可能にされている。

　第一ＡＩ画像処理と第二ＡＩ画像処理は同時に実行可能とされていてもよいし、ＡＩモデルを切り替えることにより時分割で実行可能とされていてもよい。

　本例では、ＡＩ画像処理部４４は、第一ＡＩモデルＭ１を用いて推論処理としての第一ＡＩ画像処理と、第二ＡＩモデルＭ２を用いてプライバシーマスク処理としての第二ＡＩ画像処理とを実行可能とされている。なお、第一ＡＩ画像処理は、人物を検出する処理であってもよいし、それ以外の被写体を検出する処理であってもよいし、特定の被写体の特徴量を検出する処理であってもよいし、文字認識を行う処理であってもよいし、画像の劣化補正処理や鮮明化処理であってもよい。

　第一ＡＩモデルＭ１の出力テンソルの出力先は、第三ＡＩモデルＭ３や上述したＣＶＤＳＰ４２ｃなど各種考えられるため、図示は省略している。

　プライバシーマスク処理を実現する第二ＡＩモデルＭ２への入力テンソルは、第一ＡＩモデルＭ１の入力テンソルとされている。また、第二ＡＩモデルＭ２からの出力テンソルは、プライバシーマスク処理が施された画像データである。
　即ち、第二ＡＩモデルＭ２においては、プライバシーマスク処理として、画像おける人物が写った画像領域を特定する処理と、当該特定された領域をマスクする処理の双方が行われる。

　メモリ部４５は、ＲＯＭやＲＡＭを備えて構成されているが、本例では、メモリ部４５のＲＯＭを抜粋して記載している。メモリ部４５としてのＲＯＭには、第二ＡＩモデルＭ２として機能するための重み係数やパラメータ等が記憶されている。即ち、メモリ部４５に記憶された第二ＡＩモデルＭ２を機能させるための各種の数値は書き換え不可とされている。

　従って、プログラムの改竄等により通常とは異なる不適切なプライバシーマスク処理を行わせることやプライバシーマスク処理の実行自体を回避させてしまうような不正行為を難しくすることができる。

　なお、メモリ部４５のうち、第二ＡＩモデルＭ２についての各種パラメータが記憶されるＲＯＭは、第二ＡＩモデルＭ２として機能するＡＩ画像処理部４４が設けられる第三層としてのダイＤ３に設けられることが望ましい。
　これにより、第二ＡＩモデルＭ２を用いた第二ＡＩ画像処理への切り替えを迅速に行うことができる。

　通信Ｉ／Ｆ４６は、第二ＡＩモデルＭ２によるプライバシーマスク処理が施された出力テンソルが入力されることによりイメージセンサＩＳ外にプライバシーが保護された画像データのみを出力することが可能とされている。

　プライバシーマスク処理を実現するために第二ＡＩモデルＭ２を用いたＡＩ画像処理部４４が行う処理の流れは上述したため、説明を省略する。

　なお、図２９から理解されるように、イメージセンサＩＳは、第一ＡＩモデルＭ１に対する入力テンソルとしての画像を通信Ｉ／Ｆ４６から出力するための構成を備えている。
　このような構成は、イメージセンサＩＳにおいて第一ＡＩモデルＭ１の評価や動作確認のためのものとされ、ユーザは、第一ＡＩモデルＭ１についての入力テンソルと出力テンソルの双方を確認することにより、推論処理が正常に機能しているか否か等を判断することができる。

　そして、このような構成において、当該入力テンソルをイメージセンサＩＳ外に出力する前に第二ＡＩモデルＭ２を用いたプライバシーマスク処理を施すことにより、プライバシーが保護されていない画像データが外部に送信されてしまうことを防止するものである。即ち、図２９に示すイメージセンサＩＳの構成は、ＡＩモデルについてのデバッグを行うための構成として好適と言える。

　更に、第一ＡＩモデルＭ１に対する入力テンソルはプライバシーマスク処理が施されていない画像データとされることにより、推論処理等を適切に行うことが可能とされる。

＜１０－２．イメージセンサの構成例２＞
　イメージセンサＩＳの構成例２を図３０に示す。なお、図３０はイメージセンサＩＳが備える各部のうちプライバシーマスク処理に関連する部分のみを抜粋して示したものである。

　イメージセンサＩＳは、プライバシーマスク処理に関する部分として、画素アレイ部４１ａと回路部４９とＩＳＰ４２ｂとＡＩ画像処理部４４とプライバシーマスク処理部ＰＭとメモリ部４５と通信Ｉ／Ｆ４６とを備えている。

　画素アレイ部４１ａ及び回路部４９については構成例１と同様であるため説明を省く。

　ＩＳＰ４２ｂは、ＡＩ画像処理部４４において構築される第一ＡＩモデルＭ１に対する入力テンソルとしての画像データを生成する処理を行う。また、当該入力テンソルとしての画像データは、プライバシーマスク処理部ＰＭにも入力される。

　ＡＩ画像処理部４４は、第一ＡＩモデルＭ１を用いて人物検出などの推論処理を行い、当該推論結果を出力テンソルとしてプライバシーマスク処理部ＰＭに出力する。

　プライバシーマスク処理部ＰＭは、ＩＳＰ４２ｂから第一ＡＩモデルＭ１への入力テンソルとしての画像データと、第一ＡＩモデルＭ１からの出力テンソルとしての検出結果を受け取り、検出された人物が写った画像領域をマスクするプライバシーマスク処理を行う。

　本例におけるプライバシーマスク処理部ＰＭは、ＡＩモデルを用いたＡＩ画像処理ではなく、例えば、ＣＰＵ４３ａやメモリコントローラによる処理によってプライバシーマスク処理を行う。即ち、例えば、プライバシーマスク処理部ＰＭは、第二層記憶部４５ａに記憶された入力テンソルにおける所定の画像領域の画素値を所定の値で上書きする処理を行う。

　図３０に示すメモリ部４５は、上述したように、ＲＡＭやＲＯＭのうちＲＯＭを抜粋して記載している。当該ＲＯＭには、プライバシーマスク処理部ＰＭが実行するプログラムが記憶されている。これにより、所定のプライバシーマスク処理を確実に実行することができる。

　本例のプライバシーマスク処理部ＰＭが実行する処理の流れの一例について図３１に示す。

　プライバシーマスク処理部ＰＭはステップＳ７０１で第一ＡＩモデルＭ１についての入力テンソルと出力テンソルを取得する。

　次に、プライバシーマスク処理部ＰＭはステップＳ７０２において、推論結果の上位に人物クラスが含まれているか否かを判定する。そして、人物クラスが含まれていると判定した場合、プライバシーマスク処理部ＰＭはステップＳ７０３で人物クラスが付与された被写体が検出された画像領域を対象としてプライバシーマスク処理を行う。

　例えば、推論結果の最上位に人物クラスが含まれている場合にプライバシーマスク処理を行うとした場合には、人物である可能性が非常に高い被写体のみがプライバシーマスク処理の対象とされる。
　また、推論結果の上位５位に人物クラスが含まれている場合にプライバシーマスク処理を行うとした場合には、人物である可能性が低い被写体についてもプライバシーマスク処理の対象とされる。この場合にはプライバシーの保護が強固に図られる。

　プライバシーマスク処理を施した後、プライバシーマスク処理部ＰＭはステップＳ７０４において、マスク処理後の入力テンソルを通信Ｉ／Ｆ４６に出力する。

　一方、ステップＳ７０２において、推論結果の上位に人物クラスが含まれていないと判定した場合、プライバシーマスク処理部ＰＭはステップＳ７０５において、取得した入力テンソルとしての画像データをそのまま通信Ｉ／Ｆ４６に出力する。

＜１０－３．イメージセンサの構成例３＞
　イメージセンサＩＳの構成例３を図３２に示す。なお、図３２はイメージセンサＩＳが備える各部のうちプライバシーマスク処理に関連する部分のみを抜粋して示したものである。

　画素アレイ部４１ａ及び回路部４９については構成例１と同様の構成であるため説明を省略する。

　ＩＳＰ４２ｂは、入力テンソル用の現像処理やＣＶ処理などを行う入力テンソル用処理部４１ｂ１と、通常画像（例えば高解像度の画像）用のＣＶ処理などを行う通常画像用処理部４１ｂ２とを備えている。通常画像とは、カメラ３の表示部に表示させるスルー画としての画像や観賞用としてメモリ部４５に記録される画像などである。

　入力テンソル用処理部４１ｂ１は、ＡＩ画像処理部４４において構築されるＡＩモデルに対する入力テンソルとしての画像データを生成する処理を行う。

　通常画像用処理部４１ｂ２は、上述した同時化処理やＹＣ生成処理や解像度変換処理やコーデック処理やノイズ除去処理などを行うことにより、記録用の画像データを生成する処理を行う。

　ＡＩ画像処理部４４は、第一ＡＩモデルＭ１による第一ＡＩ画像処理（推論処理）と第二ＡＩモデルＭ２による第二ＡＩ画像処理（プライバシーマスク処理）とを実行可能にされている。

　第一ＡＩモデルＭ１には入力テンソル用処理部４１ｂ１によって生成された入力テンソルが入力される。第一ＡＩモデルＭ１からの出力テンソルは各部に出力され得るため図示を省略している。

　第二ＡＩモデルＭ２には、第一ＡＩモデルＭ１の入力テンソルや通常画像用処理部４１ｂ２によって生成された画像データが入力テンソルとして入力され得る。第二ＡＩモデルＭ２は、それぞれの入力テンソルに対して人物が写った画像領域を特定してマスクするプライバシーマスク処理を行う。第二ＡＩモデルＭ２からの出力テンソルはプライバシーが保護された画像データとして通信Ｉ／Ｆ４６へ供給されてイメージセンサＩＳの外部に出力される。

　図３２に示すメモリ部４５は、上述したように、ＲＡＭやＲＯＭのうちＲＯＭを抜粋して記載している。当該ＲＯＭには、ＡＩ画像処理部４４が第二ＡＩモデルＭ２として機能するための重み係数などの各種パラメータが記憶されている。

　プライバシーマスク処理を実現するために第二ＡＩモデルＭ２を用いたＡＩ画像処理部４４が行う処理の流れは図３１を参照して説明済みであるため、重複説明を避ける。

＜１１．変形例＞
　図７に示したイメージセンサＩＳの構成の変形例について図３３に示す。
　イメージセンサＩＳは、画素アレイ部４１ａとアナログ回路部４１ｂとロジック回路部４２ａとフレームメモリとしての第二層記憶部４５ａとＩＳＰ４２ｂとＡＩ画像処理部４４とＣＰＵ４３ａとワーキングメモリとしての第三層記憶部４５ｂとＭＩＰＩ用の通信Ｉ／Ｆ４６ａ（図中の「ＭＩＰＩ」）とＰＣＩｅ（Peripheral Component Interconnect Express）用の通信Ｉ／Ｆ４６ｂ（図中の「ＰＣＩｅ」）とを備えている。

　図９に示す例では、ＣＰＵ４３ａの機能として認証機能Ｆ１２や暗号機能Ｆ１３が設けられている例を示したが、本変形例においては、ＣＰＵ４３ａとは別に認証機能Ｆ１２や暗号機能Ｆ１３が設けられている。そして認証機能Ｆ１２や暗号機能Ｆ１３はＣＰＵ４３ａの指示に応じて適宜上述した認証処理や暗号化処理及び復号処理を実行する。
　なお、認証処理に用いる証明書や暗号化処理に用いる暗号化鍵や復号処理に用いる復号鍵は、第三層記憶部４５ｂに記憶されていてもよいが、認証機能Ｆ１２や暗号機能Ｆ１３がアクセス可能な専用の記憶部に記憶されていてもよい。

　本変形例では、図７に示す例とは異なり複数のバス４７を備えている。具体的に、一つ目は、ＩＳＰ４２ｂとＡＩ画像処理部４４とＣＰＵ４３ａと第三層記憶部４５ｂとＭＩＰＩ用の通信Ｉ／Ｆ４６ａとが接続されるメモリバス４７ａである。メモリバス４７ａは、ＩＳＰ４２ｂやＡＩ画像処理部４４やＣＰＵ４３ａがワーキングメモリとしての第三層記憶部４５ｂにアクセスするために主に利用される。
　また、ＭＩＰＩ規格の画像データをイメージセンサＩＳの外部に出力するためにメモリバス４７ａは利用される。

　二つ目はＩＳＰ４２ｂとＡＩ画像処理部４４とＣＰＵ４３ａが接続される低速バスとしてのＡＰＢ（Advanced Peripheral Bus）４７ｂである。ＡＰＢ４７ｂは、ＣＰＵ４３ａからＩＳＰ４２ｂやＡＩ画像処理部４４へ命令を伝達するために主に用いられる。

　三つ目はＰＣＩｅ用の通信Ｉ／Ｆ４６ｂとＣＰＵ４３ａとが接続される高速のＡＨＢ（Advanced High-Performance Bus）４７ｃである。ＡＨＢ４７ｃは、認識結果としてのラベル情報を出力する際に利用される。

　ＭＩＰＩ用の通信Ｉ／Ｆ４６ａは、主に画像データを送信するために用いられるＩ／Ｆであり、具体的にはフレームメモリとしての第二層記憶部４５ａに記憶されたフレーム画像や、ＩＳＰ４２ｂやＡＩ画像処理部４４によって各種の処理が施された画像を出力するためのＩ／Ｆとされる。

　ＰＣＩｅ用の通信Ｉ／Ｆ４６ｂは、主に画像データ以外の情報を送受信するために用いられるＩ／Ｆであり、具体的には、推論処理の認識結果としてのラベル情報などを出力する際に利用される。

　なお、通信Ｉ／Ｆ４６ｂは、テスト画像を入力テンソルとして利用する際に該テスト画像が入力されるＩ／Ｆとして利用することも可能である。これにより、画素アレイ部４１ａの受光動作に応じて得られた画像だけでなく、テスト用画像としてイメージセンサＩＳ外から入力される画像を用いてＡＩ画像処理を行うことができる。従って、ＡＩモデルの検証等を行うことが可能とされている。
　また、ＭＩＰＩ用の通信Ｉ／Ｆ４６ａの代わりにＰＣＩｅ用の通信Ｉ／Ｆ４６ｂを用いることにより、消費電力を抑えることが可能となる。

　ＰＣＩｅ用の通信Ｉ／Ｆ４６ｂは、イメージセンサＩＳ内にＡＩモデル（重み係数や各種パラメータ）を展開する際に用いることが可能である。また、その際には、ＡＩモデルへの入力テンソルを適切なものとするためにＩＳＰ４２ｂの設定情報をＡＩモデルと共にイメージセンサＩＳに展開させてもよい。

　なお、図３３に示す各部に加えてイメージセンサＩＳがＣＶＤＳＰ４２ｃを備えていてもよい。また、ＣＶＤＳＰ４２ｃが設けられている場合には、ＡＩモデルの展開に合わせてＣＶＤＳＰ４２ｃの設定情報をイメージセンサＩＳに展開させてもよい。

　ＡＩモデルに合わせてＩＳＰ４２ｂやＣＶＤＳＰ４２ｃの設定情報をイメージセンサＩＳに展開させることにより、画像のサイズの変更やカラーコーディングの変更、或いは、ＡＩモデルの学習傾向に合わせて画像の輝度値に関する処理を最適化することなどが可能となる。

　上述した各例においては、イメージセンサＩＳが三層構造を有している例について説明したが、四層以上の構造を有していてもよい。例えば、第二層と第三層の間に電磁ノイズをカットするための層を設けてもよい。

　なお、上述した例（特に図２３及び図２４に示す例）では、ＡＩ画像処理の後にＣＶ処理を行い、更にその後にＡＩ画像処理を行う例について説明した。これ以外にも、イメージセンサＩＳにおいては、ＡＩ画像処理の後にＣＶ処理を実行してもよいし、ＣＶ処理を行った後にＡＩ画像処理を実行してもよい。

　上述したイメージセンサＩＳの構成によれば、一つ目のＡＩ画像処理を行い、その結果に対してＣＶ処理を行い、更にＣＶ処理の結果を入力テンソルとして二つ目のＡＩ画像処理を行うなど、ＣＶ処理を必要とする複数のＡＩ画像処理を実行することが可能となる。

　図２１から図２４の各図を参照して説明した処理の流れにおいては、ＩＳＰ４２ｂにおいてＡＩモデルに入力するための画像処理（入力テンソルの生成処理）を行う例を挙げたが、ＲＡＷデータをそのままＡＩモデルに入力することによりＡＩ画像処理（推論処理）が実行されてもよい。

＜１２．ＡＩモデル及びＡＩアプリケーションの展開＞
　カメラ３にＡＩモデルやＡＩアプリケーション等を展開する方法は各種考えられる。一例としてコンテナ技術を用いた例を説明する。

　カメラ３においては、図７に示す制御部３３としてのＣＰＵやＧＰＵ（Graphics Processing Unit）やＲＯＭやＲＡＭ等の各種のハードウェア５０の上にオペレーションシステム５１がインストールされている（図３４参照）。

　オペレーションシステム５１は、カメラ３における各種の機能を実現するためにカメラ３の全体制御を行う基本ソフトウェアである。

　オペレーションシステム５１上には、汎用ミドルウェア５２がインストールされている。

　汎用ミドルウェア５２は、例えば、ハードウェア５０としての通信部３５を用いた通信機能や、ハードウェア５０としての表示部（モニタ等）を用いた表示機能などの基本的動作を実現するためのソフトウェアである。

　オペレーションシステム５１上には、汎用ミドルウェア５２だけでなくオーケストレーションツール５３及びコンテナエンジン５４がインストールされている。

　オーケストレーションツール５３及びコンテナエンジン５４は、コンテナ５５の動作環境としてのクラスタ５６を構築することにより、コンテナ５５の展開や実行を行う。
　なお、図５に示すエッジランタイムは図３４に示すオーケストレーションツール５３及びコンテナエンジン５４に相当する。

　オーケストレーションツール５３は、コンテナエンジン５４に対して上述したハードウェア５０及びオペレーションシステム５１のリソースの割り当てを適切に行わせるための機能を有する。オーケストレーションツール５３によって各コンテナ５５が所定の単位（後述するポッド）にまとめられ、各ポッドが論理的に異なるエリアとされたワーカノード（後述）に展開される。

　コンテナエンジン５４は、オペレーションシステム５１にインストールされるミドルウェアの一つであり、コンテナ５５を動作させるエンジンである。具体的には、コンテナエンジン５４は、コンテナ５５内のミドルウェアが備える設定ファイルなどに基づいてハードウェア５０及びオペレーションシステム５１のリソース（メモリや演算能力など）をコンテナ５５に割り当てる機能を持つ。

　また、本実施の形態において割り当てられるリソースは、カメラ３が備える制御部３３等のリソースだけでなく、イメージセンサＩＳが備えるセンサ内制御部４３やメモリ部４５や通信Ｉ／Ｆ４６などのリソースも含まれる。

　コンテナ５５は、所定の機能を実現するためのアプリケーションとライブラリなどのミドルウェアを含んで構成される。
　コンテナ５５は、コンテナエンジン５４によって割り当てられたハードウェア５０及びオペレーションシステム５１のリソースを用いて所定の機能を実現するために動作する。

　本実施の形態においては、図５に示すＡＩアプリケーション及びＡＩモデルはコンテナ５５のうちの一つに相当する。即ち、カメラ３に展開された各種のコンテナ５５のうちの一つは、ＡＩアプリケーション及びＡＩモデルを用いた所定のＡＩ画像処理機能を実現する。

　コンテナエンジン５４及びオーケストレーションツール５３によって構築されるクラスタ５６の具体的な構成例について図３５を参照して説明する。なおクラスタ５６は、一つのカメラ３が備えるハードウェア５０だけでなく他の装置が備える他のハードウェアのリソースを利用して機能が実現するように複数の機器にまたがって構築されてもよい。

　オーケストレーションツール５３は、コンテナ５５の実行環境の管理をワーカノード５７単位で行う。また、オーケストレーションツール５３は、ワーカノード５７の全体を管理するマスタノード５８を構築する。

　ワーカノード５７においては、複数のポッド５９が展開される。ポッド５９は、１または複数のコンテナ５５を含んで構成され、所定の機能を実現する。ポッド５９は、オーケストレーションツール５３によってコンテナ５５を管理するための管理単位とされる。

　ワーカノード５７におけるポッド５９の動作は、ポッド管理ライブラリ６０によって制御される。

　ポッド管理ライブラリ６０は、論理的に割り当てられたハードウェア５０のリソースをポッド５９に利用させるためのコンテナランタイムやマスタノード５８から制御を受け付けるエージェントやポッド５９間の通信やマスタノード５８との通信を行うネットワークプロキシなどを有して構成されている。
　即ち、各ポッド５９は、ポッド管理ライブラリ６０によって各リソースを用いた所定の機能を実現可能とされる。

　マスタノード５８は、ポッド５９の展開を行うアプリサーバ６１と、アプリサーバ６１によるコンテナ５５の展開状況を管理するマネージャ６２と、コンテナ５５を配置するワーカノード５７を決定するスケジューラ６３と、データ共有を行うデータ共有部６４を含んで構成されている。

　図３４及び図３５に示す構成を利用することにより、コンテナ技術を用いて前述したＡＩアプリケーション及びＡＩモデルをカメラ３のイメージセンサＩＳに展開することが可能となる。
　なお、前述したとおり、ＡＩモデルについて、図７の通信Ｉ／Ｆ４６を介してイメージセンサＩＳ内のメモリ部４５に格納させ、イメージセンサＩＳ内でＡＩ画像処理を実行させるようにしてもよいし、図３４及び図３５に示す構成をイメージセンサＩＳ内のメモリ部４５及びセンサ内制御部４３に展開し、イメージセンサＩＳ内でコンテナ技術を用いて前述したＡＩアプリケーション及びＡＩモデルを実行させてもよい。
　また、後述するように、ＡＩアプリケーション及び／またはＡＩモデルをフォグサーバ４やクラウド側情報処理装置に展開する場合でもコンテナ技術を用いることができる。
　その際は、ＡＩアプリケーションやＡＩモデルの情報は、コンテナなどとして、後述する図３６の不揮発性メモリ部７４、記憶部７９またはＲＡＭ７３などのメモリに展開されて実行される。

＜１３．情報処理装置のハードウェア構成＞
　情報処理システム１００が備えるクラウドサーバ１、ユーザ端末２、フォグサーバ４、管理サーバ５などの情報処理装置のハードウェア構成について図３６を参照して説明する。

　情報処理装置はＣＰＵ７１を備えている。ＣＰＵ７１は、上述した各種の処理を行う演算処理部として機能し、ＲＯＭ７２や例えばＥＥＰ－ＲＯＭ（Electrically Erasable Programmable Read-Only Memory）などの不揮発性メモリ部７４に記憶されているプログラム、または記憶部７９からＲＡＭ７３にロードされたプログラムに従って各種の処理を実行する。ＲＡＭ７３にはまた、ＣＰＵ７１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　なお、クラウドサーバ１としての情報処理装置が備えるＣＰＵ７１は、上述した各機能を実現するためにライセンスオーソリ部、アカウントサービス提供部、デバイス監視部、マーケットプレイス機能提供部、カメラサービス提供部として機能する。

　ＣＰＵ７１、ＲＯＭ７２、ＲＡＭ７３、不揮発性メモリ部７４は、バス８３を介して相互に接続されている。このバス８３にはまた、入出力インタフェース（Ｉ／Ｆ）７５も接続されている。

　入出力インタフェース７５には、操作子や操作デバイスよりなる入力部７６が接続される。
　例えば入力部７６としては、キーボード、マウス、キー、ダイヤル、タッチパネル、タッチパッド、リモートコントローラ等の各種の操作子や操作デバイスが想定される。
　入力部７６によりユーザの操作が検知され、入力された操作に応じた信号はＣＰＵ７１によって解釈される。

　また入出力インタフェース７５には、ＬＣＤ或いは有機ＥＬパネルなどよりなる表示部７７や、スピーカなどよりなる音声出力部７８が一体又は別体として接続される。
　表示部７７は各種表示を行う表示部であり、例えばコンピュータ装置の筐体に設けられるディスプレイデバイスや、コンピュータ装置に接続される別体のディスプレイデバイス等により構成される。

　表示部７７は、ＣＰＵ７１の指示に基づいて表示画面上に各種の画像処理のための画像や処理対象の動画等の表示を実行する。また表示部７７はＣＰＵ７１の指示に基づいて、各種操作メニュー、アイコン、メッセージ等、即ちＧＵＩ（Graphical User Interface）としての表示を行う。

　入出力インタフェース７５には、ハードディスクや固体メモリなどより構成される記憶部７９や、モデムなどより構成される通信部８０が接続される場合もある。

　通信部８０は、インターネット等の伝送路を介しての通信処理や、各種機器との有線／無線通信、バス通信などによる通信を行う。

　入出力インタフェース７５にはまた、必要に応じてドライブ８１が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記憶媒体８２が適宜装着される。

　ドライブ８１により、リムーバブル記憶媒体８２から各処理に用いられるプログラム等のデータファイルなどを読み出すことができる。読み出されたデータファイルは記憶部７９に記憶されたり、データファイルに含まれる画像や音声が表示部７７や音声出力部７８で出力されたりする。またリムーバブル記憶媒体８２から読み出されたコンピュータプログラム等は必要に応じて記憶部７９にインストールされる。

　このコンピュータ装置では、例えば本実施の形態の処理のためのソフトウェアを、通信部８０によるネットワーク通信やリムーバブル記憶媒体８２を介してインストールすることができる。或いは当該ソフトウェアは予めＲＯＭ７２や記憶部７９等に記憶されていてもよい。
　また、カメラ３において撮像された撮像画像やＡＩ画像処理による処理結果を受け取り、記憶部７９やドライブ８１を介してリムーバブル記憶媒体８２に記憶させてもよい。

　ＣＰＵ７１が各種のプログラムに基づいて処理動作を行うことで、上述した演算処理部を備えた情報処理装置であるクラウドサーバ１やユーザ端末２やフォグサーバ４や管理サーバ５としての必要な情報処理や通信処理が実行される。
　なお、クラウドサーバ１、ユーザ端末２、フォグサーバ４、管理サーバ５は、それぞれが図３６のようなコンピュータ装置が単一で構成されることに限らず、複数のコンピュータ装置がシステム化されて構成されてもよい。複数のコンピュータ装置は、ＬＡＮ（Local Area Network）等によりシステム化されていてもよいし、インターネット等を利用したＶＰＮ（Virtual Private Network）等により遠隔地に配置されたものでもよい。複数のコンピュータ装置には、クラウドコンピューティングサービスによって利用可能なサーバ群（クラウド）としてのコンピュータ装置が含まれてもよい。

＜１４．その他＞
　上述のように、ＡＩアプリケーションのＳＷコンポーネント及びＡＩモデルが展開された後、サービスの提供者や利用者（ユーザ）の操作をトリガとしてＡＩモデルの再学習と各カメラ３などに展開されたＡＩモデル（以降「エッジ側ＡＩモデル」と記載）やＡＩアプリケーションの更新を行うときの処理の流れについて、具体的に、図２４を参照して説明する。なお、図３７は複数のカメラ３の中の１台のカメラ３に着目して記載したものである。また、以下の説明において更新対象とされたエッジ側ＡＩモデルは、一例として、カメラ３が備えるイメージセンサＩＳに展開されているものであるが、もちろん、エッジ側ＡＩモデルはカメラ３におけるイメージセンサＩＳ外に展開されているものでもよい。

　先ず、処理ステップＰＳ１において、サービスの提供者や利用者によるＡＩモデルの再学習指示が行われる。この指示は、クラウド側情報処理装置が備えるＡＰＩ（Application Programming Interface）モジュールが備えるＡＰＩ機能を利用して行われる。また、当該指示においては、学習に用いる画像量（例えば枚数）が指定される。以降、学習に用いる画像量を「所定枚数」とも記載する。

　ＡＰＩモジュールは、当該指示を受け、処理ステップＰＳ２でＨｕｂ（図５に示したものと同様のもの）に対して再学習のリクエストと画像量の情報を送信する。

　Ｈｕｂは、処理ステップＰＳ３において、エッジ側情報処理装置としてのカメラ３に対してアップデート通知と画像量の情報を送信する。

　カメラ３は、撮影を行うことにより得られた撮像画像データを処理ステップＰＳ４においてストレージ群の画像ＤＢ（Database）に送信する。この撮影処理と送信処理は、再学習に必要な所定枚数に達成するまで行われる。

　なお、カメラ３は、撮像画像データに対する推論処理を行うことにより推論結果を得た場合には、処理ステップＰＳ４において撮像画像データのメタデータとして推論結果を画像ＤＢに記憶してもよい。

　カメラ３における推論結果がメタデータがとして画像ＤＢに記憶されることにより、クラウド側で実行されるＡＩモデルの再学習に必要なデータを厳選することができる。具体的には、カメラ３における推論結果とクラウド側情報処理装置において潤沢なコンピュータ資源を用いて実行される推論の結果が相違している画像データのみを用いて再学習を行うことができる。従って、再学習に要する時間を短縮することが可能となる。

　所定枚数の撮影と送信を終えた後、カメラ３は処理ステップＰＳ５において、所定枚数の撮像画像データの送信が完了したことをＨｕｂに通知する。

　Ｈｕｂは、該通知を受けて、処理ステップＰＳ６において、再学習用のデータの準備が完了したことをオーケストレーションツールに通知する。

　オーケストレーションツールは、処理ステップＰＳ７において、ラベリング処理の実行指示をラベリングモジュールに対して送信する。

　ラベリングモジュールは、ラベリング処理の対象とされた画像データを画像ＤＢから取得し（処理ステップＰＳ８）、ラベリング処理を行う。

　ここで言うラベリング処理とは、上述したクラス識別を行う処理であってもよいし、画像の被写体についての性別や年齢を推定してラベルを付与する処理であってもよいし、被写体についてのポーズを推定してラベルを付与する処理であってもよいし、被写体の行動を推定してラベルを付与する処理であってもよい。

　ラベリング処理は、人手で行われてもよいし、自動で行われてもよい。また、ラベリング処理はクラウド側の情報処理装置で完結してもよいし、他のサーバ装置が提供するサービスを利用することにより実現されてもよい。

　ラベリング処理を終えたラベリングモジュールは、処理ステップＰＳ９において、ラベル付けの結果情報をデータセットＤＢに記憶する。ここでデータセットＤＢに記憶される情報は、ラベル情報と画像データの組とされてもよいし、画像データそのものの代わりに画像データを特定するための画像ＩＤ（Identification）情報とされてもよい。

　ラベル付けの結果情報が記憶されたことを検出したストレージ管理部は、処理ステップＰＳ１０でオーケストレーションツールに対する通知を行う。

　該通知を受信したオーケストレーションツールは、所定枚数の画像データに対するラベリング処理が終了したことを確認し、処理ステップＰＳ１１において、再学習モジュールに対する再学習指示を送信する。

　再学習指示を受信した再学習モジュールは、処理ステップＰＳ１２でデータセットＤＢから学習に用いるデータセットを取得すると共に、処理ステップＰＳ１３で学習済ＡＩモデルＤＢからアップデート対象のＡＩモデルを取得する。

　再学習モジュールは、取得したデータセットとＡＩモデルを用いてＡＩモデルの再学習を行う。このようにして得られたアップデート済みのＡＩモデルは、処理ステップＰＳ１４において再度学習済ＡＩモデルＤＢに記憶される。

　アップデート済みのＡＩモデルが記憶されたことを検出したストレージ管理部は、処理ステップＰＳ１５でオーケストレーションツールに対する通知を行う。

　該通知を受信したオーケストレーションツールは、処理ステップＰＳ１６において、ＡＩモデルの変換指示を変換モジュールに対して送信する。

　変換指示を受信した変換モジュールは、処理ステップＰＳ１７において学習済みＡＩモデルＤＢからアップデート済みのＡＩモデルを取得し、ＡＩモデルの変換処理を行う。
　該変換処理では、展開先の機器であるカメラ３のスペック情報等に合わせて変換する処理を行う。この処理では、ＡＩモデルの性能をできるだけ落とさないようにダウンサイジングを行うと共に、カメラ３上で動作可能なようにファイル形式の変換などが行われる。

　変換モジュールによって変換済みのＡＩモデルは上述したエッジ側ＡＩモデルとされる。この変換済みのＡＩモデルは、処理ステップＰＳ１８において変換済ＡＩモデルＤＢに記憶される。

　変換済みのＡＩモデルが記憶されたことを検出したストレージ管理部は、処理ステップＰＳ１９でオーケストレーションツールに対する通知を行う。

　該通知を受信したオーケストレーションツールは、処理ステップＰＳ２０において、ＡＩモデルのアップデートを実行させるための通知をＨｕｂに対して送信する。この通知には、アップデートに用いるＡＩモデルが記憶されている場所を特定するための情報を含んでいる。

　該通知を受信したＨｕｂは、カメラ３に対してＡＩモデルのアップデート指示を送信する。アップデート指示についても、ＡＩモデルが記憶されている場所を特定するための情報が含まれている。

　カメラ３は、処理ステップＰＳ２２において、変換済ＡＩモデルＤＢから対象の変換済みＡＩモデルを取得して展開する処理を行う。これにより、カメラ３のイメージセンサＩＳで利用されるＡＩモデルの更新が行われる。

　ＡＩモデルを展開することによりＡＩモデルの更新を終えたカメラ３は、処理ステップＰＳ２３でＨｕｂに対して更新完了通知を送信する。
　該通知を受信したＨｕｂは、処理ステップＰＳ２４でオーケストレーションツールに対してカメラ３のＡＩモデル更新処理が完了したことを通知する。

　なお、ここではカメラ３のイメージセンサＩＳ内（例えば、図７に示すメモリ部４５）にＡＩモデルが展開されて利用される例について説明したが、カメラ３におけるイメージセンサ外（例えば、図７のメモリ部３４）やフォグサーバ４内の記憶部にＡＩモデルが展開されて利用された場合であっても、同様にＡＩモデルの更新を行うことができる。
　その場合には、ＡＩモデルが展開された際に当該ＡＩモデルが展開された装置（場所）をクラウド側のストレージ管理部などに記憶しておき、Ｈｕｂは、ストレージ管理部からＡＩモデルが展開された装置（場所）を読み出し、ＡＩモデルが展開された装置に対してＡＩモデルのアップデート指示を送信する。
　アップデート指示を受けた装置は、処理ステップＰＳ２２において、変換済ＡＩモデルＤＢから対象の変換済みＡＩモデルを取得して展開する処理を行う。これにより、アップデート指示を受けた装置のＡＩモデルの更新が行われる。

　なお、ＡＩモデルの更新のみを行う場合は、ここまでの処理で完結する。
　ＡＩモデルに加えてＡＩモデルを利用するＡＩアプリケーションの更新を行う場合には、後述する処理が更に実行される。

　具体的に、オーケストレーションツールは処理ステップＰＳ２５において、展開制御モジュールに対してアップデートされたファームウェアなどのＡＩアプリケーションのダウンロード指示を送信する。

　展開制御モジュールは、処理ステップＰＳ２６において、Ｈｕｂに対してＡＩアプリケーションの展開指示を送信する。この指示には、アップデートされたＡＩアプリケーションが記憶されている場所を特定するための情報が含まれている。

　Ｈｕｂは、処理ステップＰＳ２７において、当該展開指示をカメラ３に対して送信する。

　カメラ３は、処理ステップＰＳ２８において、展開制御モジュールのコンテナＤＢからアップデートされたＡＩアプリケーションをダウンロードして展開する。

　なお、上記の説明においては、カメラ３のイメージセンサＩＳ上で動作するＡＩモデルの更新とカメラ３におけるイメージセンサＩＳ外で動作するＡＩアプリケーションの更新をシーケンシャルで行う例を説明した。
　また、ここでは説明の簡単のため、ＡＩアプリケーションとして説明したが、前述の通り、ＡＩアプリケーションはＳＷコンポーネントＢ１、Ｂ２、Ｂ３、・・・Ｂｎなど複数のＳＷコンポーネントで定義されており、ＡＩアプリケーションが展開された際に、各ＳＷコンポーネントがどこに展開されたかをクラウド側のストレージ管理部などに記憶しておき、Ｈｕｂは、処理ステップＰＳ２７を処理する際に、ストレージ管理部から各ＳＷコンポーネントの展開された装置（場所）を読み出し、その展開された装置に対して、展開指示を送信するようにされている。展開指示を受けた装置は、処理ステップＰＳ２８において、展開制御モジュールのコンテナＤＢからアップデートされたＳＷコンポーネントをダウンロードして展開する。
　なお、ここで言及するＡＩアプリケーションとは、ＡＩモデル以外のＳＷコンポーネントである。

　また、ＡＩモデルとＡＩアプリケーションの双方が一つの装置で動作するとなっていた場合には、ＡＩモデルとＡＩアプリケーションの双方を一つのコンテナとしてまとめて更新してもよい。その場合には、ＡＩモデルの更新とＡＩアプリケーションの更新がシーケンシャルではなく同時に行われてもよい。そして、処理ステップＰＳ２５、ＰＳ２６、ＰＳ２７、ＰＳ２８の各処理を実行することにより、実現可能である。

　例えば、カメラ３のイメージセンサＩＳにＡＩモデルとＡＩアプリケーションの双方のコンテナを展開することが可能な場合、上述のように処理ステップＰＳ２５、ＰＳ２６、ＰＳ２７、ＰＳ２８の各処理を実行することにより、ＡＩモデルやＡＩアプリケーションの更新を行うことができる。

　上述した処理を行うことにより、ユーザの使用環境において撮像された撮像画像データを用いてＡＩモデルの再学習が行われる。従って、ユーザの使用環境において高精度の認識結果を出力できるエッジ側ＡＩモデルを生成することができる。

　また、車載カメラとしての３を搭載した車両がそれまでと異なる地域を走行している場合や、天候や時刻の変化により撮像装置に入射される入射光の光量が変化した場合など、カメラ３の撮像環境が変化したとしても、その都度適切にＡＩモデルの再学習を行うことができるため、ＡＩモデルによる認識精度を低下させずに維持することが可能となる。
　なお、上述した各処理は、ＡＩモデルの再学習時だけでなく、ユーザの使用環境下においてシステムを初めて稼働させる際に実行してもよい。

＜１５．マーケットプレイスの画面例＞
　マーケットプレイスに関してユーザに提示される画面の一例について、各図を参照して説明する。

　図３８は、ログイン画面Ｇ１の一例を示したものである。
　ログイン画面Ｇ１には、ユーザＩＤを入力するためのＩＤ入力欄９１と、パスワードを入力するためのパスワード入力欄９２が設けられている。

　パスワード入力欄９２の下方には、ログインを行うためのログインボタン９３と、ログインを取りやめるためのキャンセルボタン９４が配置されている。

　また、更にその下方には、パスワードを忘れたユーザ向けのページへ遷移するための操作子や、新規にユーザ登録を行うためのページに遷移するための操作子等が適宜配置されている。

　適切なユーザＩＤとパスワードを入力した後にログインボタン９３を押下すると、ユーザ固有のページに遷移する処理がクラウドサーバ１及びユーザ端末２のそれぞれにおいて実行される。

　図３９は、例えば、アプリケーション開発者端末２Ａを利用するＡＩアプリケーション開発者や、ＡＩモデル開発者端末２Ｃを利用するＡＩモデル開発者に提示される画面の一例である。

　各開発者は、開発のために学習用データセットやＡＩモデルやＡＩアプリケーションをマーケットプレイスを通じて購入することが可能とされている。また、自身で開発したＡＩアプリケーションやＡＩモデルをマーケットプレイスに登録することが可能とされている。

　図３９に示す開発者向け画面Ｇ２には、購入可能な学習用データセットやＡＩモデルやＡＩアプリケーションなど（以降、まとめて「データ」と記載）が左側に表示されている。
　なお、図示していないが、学習用データセットの購入の際に、学習用データセットの画像をディスプレイ上に表示させ、マウス等の入力装置を用いて画像の所望の部分のみを枠で囲み、名前を入力するだけで、学習の準備をすることができる。
　例えば、猫の画像でＡＩ学習を行いたい場合、画像上の猫の部分だけを枠で囲むと共に、テキスト入力として「猫」と入力することによって、猫のアノテーションが付加された画像をＡＩ学習用に準備することができる。
　また、所望のデータを見つけやすいように、「交通監視」、「動線分析」、「来店客カウント」のような目的を選択可能とされていてもよい。即ち、選択された目的に適合するデータのみが表示されるような表示処理がクラウドサーバ１及びユーザ端末２のそれぞれにおいて実行される。

　なお、開発者向け画面Ｇ２においては、各データの購入価格が表示されていてもよい。

　また、開発者向け画面Ｇ２の右側には、開発者が収集または作成した学習用データセットや、開発者が開発したＡＩモデルやＡＩアプリケーションを登録するための入力欄９５が設けられている。

　各データごとに、名称やデータの保存場所を入力するための入力欄９５が設けられている。また、ＡＩモデルについては、リトレーニングの要／不要を設定するためのチェックボックス９６が設けられている。

　なお、登録対象のデータを購入する際に必要な価格を設定可能な価格設定欄（図中では入力欄９５として記載）などが設けられていてもよい。

　また、開発者向け画面Ｇ２の上部には、ユーザ情報の一部としてユーザ名や最終ログイン日などが表示されている。なお、これ以外にも、ユーザがデータ購入の際に使用可能な通貨量やポイント数などが表示されていてもよい。

　図４０は、例えば、自身が管理するエッジ側の情報処理装置としてのカメラ３にＡＩアプリケーションやＡＩモデルを展開することにより、各種の分析等を行うユーザ（上述したアプリケーション利用ユーザ）に提示される利用者向け画面Ｇ３の一例である。

　ユーザは、マーケットプレイスを介して監視対象の空間に配置するカメラ３を購入可能とされている。従って、利用者向け画面Ｇ３の左側には、カメラ３に搭載されるイメージセンサＩＳの種類や性能、そしてカメラ３の性能等を選択可能なラジオボタン９７が配置されている。

　また、ユーザは、マーケットプレイスを介してフォグサーバ４としての情報処理装置を購入可能とされている。従って、利用者向け画面Ｇ３の左側には、フォグサーバ４の各性能を選択するためのラジオボタン９７が配置されている。
　また、既にフォグサーバ４を有しているユーザはフォグサーバ４の性能情報をここに入力することによって、フォグサーバ４の性能を登録することができる。

　ユーザは、自身が経営する店舗などの任意の場所に購入したカメラ３（或いは、マーケットプレイスを介さずに購入したカメラ３でもよい）を設置することにより所望の機能を実現するが、マーケットプレイスでは、各カメラ３の機能を最大限に発揮させるために、カメラ３の設置場所についての情報を登録することが可能とされている。

　利用者向け画面Ｇ３の右側には、カメラ３が設置される環境についての環境情報を選択可能なラジオボタン９８が配置されている。ユーザは、カメラ３が設置される環境についての環境情報を適切に選択することにより、上述した最適な撮像設定を対象のカメラ３に設定される。

　なお、カメラ３を購入すると共に該購入予定のカメラ３の設置場所が決まっている場合には、利用者向け画面Ｇ３の左側の各項目と右側の各項目を選択することにより、設置予定場所に応じて最適な撮像設定が予め設定されたカメラ３を購入することができる。

　利用者向け画面Ｇ３には実行ボタン９９が設けられている。実行ボタン９９を押下することにより、購入についての確認を行う確認画面や、環境情報の設定を確認するための確認画面へと遷移する。これにより、ユーザは、所望のカメラ３やフォグサーバ４を購入することや、カメラ３についての環境情報の設定を行うことが可能とされる。

　マーケットプレイスにおいては、カメラ３の設置場所を変更したときのために、各カメラ３の環境情報を変更することが可能とされている。図示しない変更画面においてカメラ３の設置場所についての環境情報を入力し直すことにより、カメラ３に最適な撮像設定を設定し直すことが可能となる。

＜１６．まとめ＞
＜１６－１．まとめ１＞
　上述した各例において説明したように、イメージセンサＩＳは、複数の画素が二次元に配列された画素アレイ部４１ａが設けられた第一層（ダイＤ１）と、画素アレイ部４１ａから出力される画素信号に基づくアナログ信号をデジタル信号に変換するＡ／Ｄ変換を行う変換処理部（アナログ回路部４１ｂ）とデジタル信号に基づくデジタルデータである画像データがフレームごとに記憶される第二層記憶部４５ａとが設けられた第二層（ダイＤ２）と、画像データを入力テンソルとした推論処理を行う推論処理部（ＡＩ画像処理部４４）が設けられた第三層（ダイＤ３）と、を含む積層構造を有する。
　これにより、第二層と第三層に設けられる各部を一つの層にまとめた場合と比較して第二層及び第三層を小さくすることができる。
　従って、各層の大きさを画素アレイ部４１ａの大きさと略同じとすることができ、第一層に部品が搭載されていない余り領域を生じさせずに済み、イメージセンサＩＳの小型化を図ることができる。
　また、第二層にフレームメモリとしての第二層記憶部４５ａが設けられることで、フレーム画像を用いた推論処理とフレーム画像を用いた別の処理（例えばフレーム画像データの出力処理など）を行う場合に効率よく処理を行うことが可能となる。
　また、第三層に第三層記憶部４５ｂを設ける場合に、第三層記憶部４５ｂの記憶容量を小さくすることができ、第三層記憶部４５ｂの小型化延いてはイメージセンサＩＳの小型化を行うことが可能となる。

　図８等を参照して説明したように、イメージセンサＩＳにおける第二層（ダイＤ２）は第一層（ダイＤ１）と第三層（ダイＤ３）の間に設けられてもよい。
　これにより、第一層に設けられた画素アレイ部４１ａに光が入射されやすくなる。また、画素アレイ部４１ａが備える画素から読み出された画素信号に対してＡ／Ｄ変換を行う変換処理部（アナログ回路部４１ｂ）が第一層と隣接する第二層に設けられることで、Ａ／Ｄ変換までの処理を円滑に行うことが可能となる。
　更に、第一層と第二層の間に他の層が配置されないことで、層間の配線がしやすくされ、配線部材の削減を図ることができる。
　また、第一層に設けられた画素アレイ部４１ａは第三層に設けられた推論処理部（ＡＩ画像処理部４４）に対して積層方向に離れて位置されているため、画素に蓄積された電荷に対する電磁ノイズの影響が小さくされており、ノイズ低減を図ることができる。

　図８及び図１０等を参照して説明したように、イメージセンサＩＳにおける第三層（ダイＤ３）には、推論処理のワーキングメモリとされた第三層記憶部４５ｂが設けられてもよい。
　これにより、推論処理は同じ層に設けられた第三層記憶部４５ｂに記憶された人工知能モデル（ＡＩモデル）を用いて推論処理を行うことができるため、推論処理に要する時間を短縮することができる。

　図１５等を参照して説明したように、イメージセンサＩＳにおける変換処理部（アナログ回路部４１ｂ）と推論処理部（ＡＩ画像処理部４４）は各層の積層方向において重ならない位置に配置されてもよい。
　推論処理部による推論処理の実行中に発生する電磁ノイズがＡ／Ｄ変換の結果に影響を及ぼす可能性を低減させることができる。従って、Ａ／Ｄ変換後のデジタルデータとしてノイズの少ない画像データ（ＲＡＷ画像データ）を生成することができる。
　また、これにより、Ａ／Ｄ変換と推論処理を同時に実行させることができるため、処理時間が大きくなる複雑な推論処理を実行することも可能となる。

　図８等を参照して説明したように、イメージセンサＩＳにおける第三層（ダイＤ３）に推論処理部（ＡＩ画像処理部４４）として機能するプロセッサ（例えばＤＳＰ）とは異なるプロセッサ（例えばＣＰＵ）が設けられてもよい。
　例えば、処理能力の高いＣＰＵ４３ａを用いてエッジ強調処理やスケーリング処理やアフィン変換処理などのＣＶ処理を行うことができる。これにより、ＩＳＰ４２ｂでＣＶ処理を行うよりも処理時間を短縮することができる。

　図９等を参照して説明したように、イメージセンサＩＳにおける第三層（ダイＤ３）に推論処理に用いる人工知能モデルの展開可否についての認証処理を行う認証処理部（認証機能Ｆ１２）が設けられていてもよい。
　認証処理部は、例えば、人工知能モデルの展開が許可されたイメージセンサＩＳであることをサーバ装置（クラウド側情報処理装置）に認証してもらうための処理を行う。そのために、認証処理部は証明書等の必要なデータを管理する。また、認証が許可された場合にはイメージセンサＩＳは暗号化された人工知能モデルを受信することが考えられるが、認証処理部は、当該暗号化された人工知能モデルを復号するための鍵を管理する。更に、認証処理部は、外部に出力するデータを暗号化するための鍵を管理してもよい。
　認証処理部が管理する各種データは第二層（ダイＤ２）や第三層に設けられたＲＯＭやＲＡＭなどの記憶部（メモリ部４５、第二層記憶部４５ａ、第三層記憶部４５ｂ）に記憶される。
　これにより、正規のサーバ装置から受信した人工知能モデルのみを展開することができセキュリティの向上を図ることができる。また、出力データについてもセキュリティの向上が図られる。

　図２８等を参照して説明したように、イメージセンサＩＳにおける第三層（ダイＤ３）に推論処理の結果を外部に出力するための通信制御を行う通信制御部（通信制御機能Ｆ１４）が設けられていてもよい。
　例えば、イメージセンサＩＳ外に設けられたアンテナを制御する通信制御部が設けられることにより、ＳＩＧＦＯＸやＬＴＥ－ＭなどのＬＰＷＡによる各種の通信を行うことが可能となる。
　セキュアなデータをイメージセンサＩＳから送信することを考えると、イメージセンサＩＳ外の処理部がプログラムを実行することによってデータを送信する場合と比較してイメージセンサＩＳ内の処理部（通信制御部）がプログラムを実行することによってデータを送信する方がセキュリティの向上を図ることが可能となる。

　図１０等を参照して説明したように、イメージセンサＩＳにおける第一層（ダイＤ１）と第二層（ダイＤ２）と第三層（ダイＤ３）のチップサイズが同一とされてもよい。
　各層のチップサイズが統一されたイメージセンサＩＳは、ダイシングする前のシリコンウエハの状態で各層を重ね合わせた後にダイシングを行うことにより、ダイシングの工程を１度で済ませることができ、更に、各チップの位置決めがしやすくされる。これにより、製造工程の簡易化を図ることができる。
　なお、ここでいう「同一」とは、各層がウエハの状態で積層されて一度のダイシングで切り出された場合には、同一と見なすことができる。

　図１２等を参照して説明したように、イメージセンサＩＳにおける第三層（ダイＤ３）のチップサイズは第一層（ダイＤ１）及び第二層（ダイＤ２）のチップサイズよりも小さくされていてもよい。
　これにより、第三層のチップのコストを削減することができる。また、第三層のチップはダイシングした後に第二層の一方の面に張り合わされるため、ダイシングの後の検査で良品とされたもののみを採用することができる。従って、イメージセンサＩＳの歩留まりの向上を図ることができる。

　図１３等を参照して説明したように、イメージセンサＩＳにおける第三層（ダイＤ３）に複数のチップが設けられていてもよい。
　例えば、第三層に設けられるメモリ（第三層記憶部４５ｂ）を高集積とされたＤＲＡＭチップとし、ＤＳＰやＩＳＰとして機能するチップを１０ｎｍやそれ以下の最先端プロセスで製造されるチップとすることができる。即ち、異なる半導体製造プロセスで作成されるチップを同じ第三層に混在させることができる。従って、これらの複数のチップを異なる層に設けるよりも小型化することができる。
　また、第三層に設けられるメモリを高集積なチップとすることでメモリチップの小型化を図ることができ、当該小型化によって空いたスペースに通信機能を有するチップを設けることにより多機能化することが可能となる。

　図１３等を参照して説明したように、イメージセンサＩＳにおける複数のチップのそれぞれは、平面視において長辺と短辺を有する長方形とされ、複数のチップは、長辺同士が対向して設けられていてもよい。
　例えば、ＤＲＡＭチップとＤＳＰが搭載されたチップとが長辺同士が隣接することで、プロセッサとメモリ間の配線の数を増やすことができ、処理の高速化を図ることができる。

　図２５や図２７等を参照して説明したように、イメージセンサＩＳにおける第二層（ダイＤ２）におけるＡ／Ｄ変換と第三層（ダイＤ３）における推論処理は実行時間が重ならないようにされてもよい。
　これにより、推論処理部（ＡＩ画像処理部４４）による推論処理の実行中に発生する電磁ノイズがＡ／Ｄ変換の結果に影響を及ぼす可能性を排除することができる。

＜１６－２．まとめ２＞
　上述した各例において説明したように、イメージセンサＩＳは、複数の画素が二次元に配列された画素アレイ部４１ａと、画素アレイ部４１ａから出力される画像データに基づいて第１人工知能モデル（第一ＡＩモデルＭ１）を用いた第１推論処理を実行し、第１推論処理の結果に基づいて第２人工知能モデル（第二ＡＩモデルＭ２）を用いた第２推論処理を実行する推論処理部（ＡＩ画像処理部４４）が設けられている。
　例えば、第１推論処理では顔検出を行い、第２推論処理では特徴量検出を行う。或いは、第１推論処理ではノイズ除去を行い、第２推論処理では特徴量検出を行う。
　従って、第１推論処理と第２推論処理を統合した一つの人工知能モデルを用いて推論を行う場合と比較して、複数の人工知能モデルを用いて複数の推論処理を行うことで、それぞれの人工知能モデルを特定の推論処理により特化したものを用いることができ、全体として確度の高い推論結果を得ることができる。
　また、複数の人工知能モデルを用いて複数の推論処理を行うことで、イメージセンサＩＳの高機能化を図ることができる。

　上述したように、イメージセンサＩＳにおける推論処理部（ＡＩ画像処理部４４）においては、人工知能モデルについての重み係数の設定が切り替えられることにより第１人工知能モデル（第一ＡＩモデルＭ１）と第２人工知能モデル（第二ＡＩモデルＭ２）の切り替えが行われてもよい。
　これにより、簡易な処理で人工知能モデルの切り替えを行うことができる。

　上述したように、イメージセンサＩＳは、第１推論処理の結果に基づいて画像処理を行う画像処理部（ＣＶＤＳＰ４２ｃ）を備え、推論処理部（ＡＩ画像処理部４４）は、画像処理部による画像処理を施した画像を入力テンソルとして第２推論処理を行ってもよい。
　第２推論処理の推論結果の精度が向上するような画像処理を画像処理部が行うことにより、第２推論処理を適切に行うことができる。

　上述したように、イメージセンサＩＳは、画像データを記憶するフレームメモリ（第二層記憶部４５ａ）を備え、画像処理部（ＣＶＤＳＰ４２ｃ）は、フレームメモリに記憶された画像データに対して第１推論処理（第一ＡＩ画像処理）の推論結果に応じた画像処理を行ってもよい。
　例えば、第１推論処理において画像データから所定の被写体を検出する処理を行う。また、画像処理部は、検出された被写体についての座標情報に基づいてフレームメモリに記憶された画像データ（フレーム画像）から所定の被写体が撮像された領域を切り出して部分画像を生成する処理を行う。そして、第２推論処理（第二ＡＩ画像処理）では、人工知能モデルの切り替えを行い、当該切り出された部分画像から所定の被写体についての特徴点を抽出する処理を行う。
　イメージセンサＩＳがフレームメモリを備えることにより、第１推論処理が施される前の画像データ、即ち第１推論処理における入力テンソルとされた画像データを用いた画像処理を行うことができる。

　上述したように、イメージセンサＩＳにおいて、第１推論処理（第一ＡＩ画像処理）は特定の対象物を検出する処理とされ、第２推論処理（第二ＡＩ画像処理）は検出された対象物の特徴量を検出する処理とされ、画像処理部（ＣＶＤＳＰ４２ｃ）は、画像処理として、フレームメモリ（第二層記憶部４５ａ）に記憶された画像データから第１推論処理によって検出された対象物についての画像領域を切り出す処理を行ってもよい。
　検出対象物とは、人物の顔や人物の体、或いは、車両のナンバープレートなどである。特徴量を検出する処理とは、例えば、検出対象物としての人物の顔についての特徴量や、検出対象物としての人物の体についての骨格や姿勢を検出するための特徴量や、検出対象物としてのナンバープレートについての数字の特徴量などを検出する処理である。
　これにより、人物についての属性情報や、人物の姿勢情報や骨格情報や、ナンバープレートについての文字列をＯＣＲで検出する処理などを第２推論処理で好適に行うことができる。

　上述したように、イメージセンサＩＳにおける推論処理部（ＡＩ画像処理部４４）は、第１推論処理（第一ＡＩ画像処理）の結果として画像データを出力し、画像処理部（ＣＶＤＳＰ４２ｃ）は、第１推論処理から出力された画像データに対して画像処理を行ってもよい。
　例えば、第１推論処理においてフレーム画像としての画像データからノイズを除去した画像データが推論結果として得られる。画像処理部は、ノイズ除去後の画像データに対してエッジ強調処理などの画像処理を行う。そして、第２推論処理（第二ＡＩ画像処理）では、ノイズが除去されエッジが強調された画像データを入力テンソルとして被写体の認識処理が行われる。これにより、被写体をより正確に推論することが可能となる。

　上述したように、イメージセンサＩＳにおいて、第１推論処理（第一ＡＩ画像処理）は、入力テンソルとしての画像データの劣化を補正する処理とされ、画像処理部（ＣＶＤＳＰ４２ｃ）は、画像処理として、補正後の画像データを鮮明化する処理を行ってもよい。
　これにより、第２人工知能モデルにおいて特徴量が抽出しやすい好適な画像データを入力テンソルとして入力することができる。

　図２８等を参照して説明したように、イメージセンサＩＳにおいては、画像データにおける所定の領域をマスクするマスク処理（プライバシーマスク処理）を行うマスク処理部（ＡＩ画像処理部４４或いはプライバシーマスク処理部ＰＭ）と、マスク処理が施された画像データを他の機器に対して送信する送信制御を行う通信制御部（通信制御機能Ｆ１４）と、を備えていてもよい。
　イメージセンサＩＳから送信される画像データの一部がマスク処理によってマスクされることにより、例えば、プライバシーに配慮した画像データのみを出力することなどが可能となる。また、カメラ外にデータを送信するための送信制御を行う通信制御部がイメージセンサＩＳ内に設けられることで不正プログラムによるデータの送信が行われ難く、セキュリティの向上を図ることができる。

　図１８、図１９及び図２８等を参照して説明したように、イメージセンサＩＳにおいて、所定の領域は人物が撮像された領域とされてもよい。
　これにより、人物がマスクされた画像がイメージセンサＩＳから出力されるため、被写体についてのプライバシーの保護を図ることができる。

　図２９等を参照して説明したように、イメージセンサＩＳにおいては、第１人工知能モデル（第一ＡＩモデルＭ１）または第２人工知能モデル（第二ＡＩモデルＭ２）に入力される画像データに対する画像処理を行う画像処理部（ＣＶＤＳＰ４２ｃ）を備え、マスク処理部（ＡＩ画像処理部４４またはプライバシーマスク処理部ＰＭ）は、画像処理後の画像データに対してマスク処理を行い、第１人工知能モデルまたは第２人工知能モデルに入力される画像データは、マスク処理が施されていない画像データとされてもよい。
　これにより、人工知能モデルに対して入力される画像データを検査等の用途で外部の機器で確認したい場合に、マスク処理によってプライバシーの保護が図られた入力テンソルとしての画像データを出力することができる。

　上述したように、イメージセンサＩＳにおいては、画像データを記憶するフレームメモリ（第二層記憶部４５ａ）を備え、マスク処理部（プライバシーマスク処理部ＰＭ）は、フレームメモリに記憶された画像データにおける所定の領域の画素値を所定の値に変更することでマスク処理を行ってもよい。
　これにより、フレームメモリに記憶されたデータの一部を変更するという処理負担の少ない処理によってマスク処理を実現することができる。

　図２９等を参照して説明したように、イメージセンサＩＳにおけるマスク処理部（プライバシーマスク処理部ＰＭ）は、人工知能モデルを用いてマスク処理（プライバシーマスク処理）を行ってもよい。
　例えば、マスク処理部は、画像データに含まれる人物を検出すると共に当該画像領域をマスクする処理を施す人工知能モデルを用いてもよい。

　図３０及び図３１等を参照して説明したように、イメージセンサＩＳにおけるマスク処理部（プライバシーマスク処理部ＰＭ）は、第１推論処理の推論結果または第２推論処理の推論結果を用いてマスク処理を行ってもよい。
　例えば、人物を検出する人工知能モデルによる第１推論処理がイメージセンサＩＳにおいて実行される場合に、マスク処理部は、当該推論処理の結果を用いて一部の画像領域をマスクする処理を実行してもよい。
　これにより、推論結果を用いて効率的なマスク処理を行うことができる。
　なお、第１推論処理の入力画像データに対してマスク処理を行う場合には、第１推論処理とマスク処理の双方を行う一つの人工知能モデルを用いてもよい。

　図２９、図３０及び図３２等を参照して説明したように、イメージセンサＩＳにおいては、マスク処理部（プライバシーマスク処理部ＰＭ）が実行するプログラムが記憶されたＲＯＭ（メモリ部４５）を備えていてもよい。
　これにより、不正なマスク処理やプライバシーを保護するためのマスク処理を回避するような不正な処理を実行することを難しくすることができる。即ち、適切なマスク処理が確実に実行される可能性を高めることができる。

　本技術における情報処理方法は、複数の画素が二次元に配列された画素アレイ部４１ａから出力される画像データに基づいて第１人工知能モデルを用いた第１推論処理と、第１推論処理の結果に基づいて第２人工知能モデルを用いた第２推論処理と、をイメージセンサＩＳとしてのコンピュータ装置が実行するものである。

　また、本技術におけるプログラムは、コンピュータ装置が読み取り可能なプログラムであって、図２２、図２３及び図２４に示す各処理をイメージセンサＩＳの演算処理部に実行させるものである。

　このようなプログラムは、コンピュータ装置等の機器に内蔵されている記録媒体としてのＨＤＤ（Hard Disk Drive）や、ＣＰＵを有するマイクロコンピュータ内のＲＯＭ等に予め記録しておくことができる。あるいはまたプログラムは、フレキシブルディスク、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory）、ＭＯ(Magneto Optical)ディスク、ＤＶＤ(Digital Versatile Disc)、ブルーレイディスク（Blu-ray Disc（登録商標））、磁気ディスク、半導体メモリ、メモリカードなどのリムーバブル記録媒体に、一時的あるいは永続的に格納（記録）しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウェアとして提供することができる。
　また、このようなプログラムは、リムーバブル記録媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、ＬＡＮ(Local Area Network)、インターネットなどのネットワークを介してダウンロードすることもできる。

＜１６－３．まとめ３＞
　上述した各例において説明したように、イメージセンサＩＳにおいては、複数の画素が二次元に配列された画素アレイ部４１ａと、画素アレイ部４１ａから出力される画像データを記憶するフレームメモリ（第二層記憶部４５ａ）と、フレームメモリに記憶された画像データに対して画像処理を施す画像処理部（ＣＶＤＳＰ４２ｃ）と、画像処理部によって画像処理が施された画像データを入力テンソルとして人工知能モデルを用いた推論処理を行う推論処理部（ＡＩ画像処理部４４）と、を備えている。
　即ち、ラインごとの入力データを対象として画像処理を行うのでは無く、少なくとも複数行の画素データを含む画像データとされた入力データを対象として画像処理を行う。従って、画像処理部は入力画像全体を対象とした処理が実行可能とされる。
　ラインごとのデータ処理が行われるＩＳＰを用いて同様の処理を行う場合と比較して、フレームメモリに記憶された画像データとしての入力画像全体を対象とした処理を行う場合にはラインデータに加工する必要が無いことから、処理の高速化及び処理負担の軽減を図ることができる。

　図１６及び図１７等を参照して説明したように、イメージセンサＩＳにおける画像処理部（ＣＶＤＳＰ４２ｃ）と推論処理部（ＡＩ画像処理部４４）は異なるプロセッサとして設けられてもよい。
　これにより、画像処理部と推論処理部それぞれの処理内容に合わせて適切なプロセッサを適用することができる。

　図１６及び図１７等を参照して説明したように、イメージセンサＩＳにおける画像処理部（ＣＶＤＳＰ４２ｃ）は、ＣＶ処理を行ってもよい。
　また、イメージセンサＩＳにおいて、ＣＶ処理は、エッジ強調処理とスケーリング処理とアフィン変換処理の少なくとも一部を含んでいてもよい。
　フレーム画像に対してこのようなＣＶ処理を画像処理部（ＣＶＤＳＰ４２ｃ）が施すことで、効率的な処理を行うことができる。具体的には、ＩＳＰを用いてＣＶ処理を行う場合には、ＩＳＰがラインデータごとの処理を行うものであるために、画像データをラインデータに変換してＣＶ処理を行う必要がある。一方、画像処理部をＤＳＰなどで構成することにより、フレーム画像をラインデータに変換することなくＣＶ処理を行うことができるため、処理効率の向上を図ることができる。

　ＡＩ画像処理の第４例などにおいて説明したように、イメージセンサＩＳにおける画像処理部（ＣＶＤＳＰ４２ｃ）は、人工知能モデルの入力テンソルを生成してもよい。
　これにより、画像処理部によって好適に補正された画像データなどが入力テンソルとして人工知能モデルに入力される。従って、高精度の推論処理を行うことができる。

　本技術における情報処理方法は、複数の画素が二次元に配列された画素アレイ部４１ａから出力される画像データを記憶する処理と、記憶された画像データに対する画像処理と、画像処理が施された画像データを入力テンソルとして人工知能モデルを用いた推論処理と、をコンピュータ装置が実行するものである。

　本技術におけるプログラムは、コンピュータ装置が読み取り可能なプログラムであって、図２２、図２３及び図２４に示す各処理をイメージセンサＩＳの演算処理部に実行させるものである。

　なお、本明細書に記載された効果はあくまでも例示であって限定されるものではなく、また他の効果があってもよい。

　また、上述した各例はいかように組み合わせてもよく、各種の組み合わせを用いた場合であっても上述した種々の作用効果を得ることが可能である。

＜１７．本技術＞
　本技術は以下のような構成を採ることもできる。
（１）
　複数の画素が二次元に配列された画素アレイ部と、
　前記画素アレイ部から出力される画像データを記憶するフレームメモリと、
　前記フレームメモリに記憶された画像データに対して画像処理を施す画像処理部と、
　前記画像処理部によって画像処理が施された画像データを入力テンソルとして人工知能モデルを用いた推論処理を行う推論処理部と、を備えた
　イメージセンサ。
（２）
　前記画像処理部と前記推論処理部は異なるプロセッサとして設けられた
　上記（１）に記載のイメージセンサ。
（３）
　前記画像処理部は、ＣＶ処理を行う
　上記（２）に記載のイメージセンサ。
（４）
　前記ＣＶ処理は、エッジ強調処理とスケーリング処理とアフィン変換処理の少なくとも一部を含む
　上記（３）に記載のイメージセンサ。
（５）
　前記画像処理部は、前記人工知能モデルの入力テンソルを生成する
　上記（２）から上記（４）の何れかに記載のイメージセンサ。
（６）
　複数の画素が二次元に配列された画素アレイ部から出力される画像データを記憶する処理と、
　前記記憶された画像データに対する画像処理と、
　前記画像処理が施された画像データを入力テンソルとして人工知能モデルを用いた推論処理と、をコンピュータ装置が実行する
　情報処理方法。
（７）
　コンピュータ装置が読み取り可能なプログラムであって、
　複数の画素が二次元に配列された画素アレイ部から出力される画像データを記憶させる機能と、
　前記記憶された画像データに対する画像処理を実行させる機能と、
　前記画像処理が施された画像データを入力テンソルとして人工知能モデルを用いた推論処理を実行させる機能と、をコンピュータ装置に実現させる
　プログラム。
（８）
　複数の画素が二次元に配列された画素アレイ部と、
　第一の画像データに対して画像処理を施すことにより得られた第二の画像データを出力する画像処理部と、
　前記第二の画像データに対して人工知能モデルを用いた推論処理を行い、推論結果を出力する推論処理部と、を備え、
　前記画像処理は、処理単位ごとに前記第一の画像データにおける複数ラインを用いる
　イメージセンサ。
（９）
　複数の画素が二次元に配列され第一の画像データを生成し出力する画素アレイ部と、
　前記第一の画像データに基づくデータに対して人工知能モデルを用いた推論処理を行い、推論結果を出力する推論処理部と、
　前記推論結果に基づき前記第一の画像データに対して画像処理を施すことにより得られた第二の画像データを出力する画像処理部と、を備え、
　前記画像処理は、処理単位ごとに前記第一の画像データにおける複数ラインを用いる
　イメージセンサ。

４１ａ　画素アレイ部
４２ｃ　ＣＶＤＳＰ（画像処理部）
４４　ＡＩ画像処理部（推論処理部）
４５ａ　第二層記憶部（フレームメモリ）
ＩＳ　イメージセンサ

Claims

　複数の画素が二次元に配列された画素アレイ部と、
　前記画素アレイ部から出力される画像データを記憶するフレームメモリと、
　前記フレームメモリに記憶された画像データに対して画像処理を施す画像処理部と、
　前記画像処理部によって画像処理が施された画像データを入力テンソルとして人工知能モデルを用いた推論処理を行う推論処理部と、を備えた
　イメージセンサ。
　前記画像処理部と前記推論処理部は異なるプロセッサとして設けられた
　請求項１に記載のイメージセンサ。
　前記画像処理部は、ＣＶ処理を行う
　請求項２に記載のイメージセンサ。
　前記ＣＶ処理は、エッジ強調処理とスケーリング処理とアフィン変換処理の少なくとも一部を含む
　請求項３に記載のイメージセンサ。
　前記画像処理部は、前記人工知能モデルの入力テンソルを生成する
　請求項２に記載のイメージセンサ。
　複数の画素が二次元に配列された画素アレイ部から出力される画像データを記憶する処理と、
　前記記憶された画像データに対する画像処理と、
　前記画像処理が施された画像データを入力テンソルとして人工知能モデルを用いた推論処理と、をコンピュータ装置が実行する
　情報処理方法。
　コンピュータ装置が読み取り可能なプログラムであって、
　複数の画素が二次元に配列された画素アレイ部から出力される画像データを記憶させる機能と、
　前記記憶された画像データに対する画像処理を実行させる機能と、
　前記画像処理が施された画像データを入力テンソルとして人工知能モデルを用いた推論処理を実行させる機能と、をコンピュータ装置に実現させる
　プログラム。
　複数の画素が二次元に配列された画素アレイ部と、
　第一の画像データに対して画像処理を施すことにより得られた第二の画像データを出力する画像処理部と、
　前記第二の画像データに対して人工知能モデルを用いた推論処理を行い、推論結果を出力する推論処理部と、を備え、
　前記画像処理は、処理単位ごとに前記第一の画像データにおける複数ラインを用いる
　イメージセンサ。
　複数の画素が二次元に配列され第一の画像データを生成し出力する画素アレイ部と、
　前記第一の画像データに基づくデータに対して人工知能モデルを用いた推論処理を行い、推論結果を出力する推論処理部と、
　前記推論結果に基づき前記第一の画像データに対して画像処理を施すことにより得られた第二の画像データを出力する画像処理部と、を備え、
　前記画像処理は、処理単位ごとに前記第一の画像データにおける複数ラインを用いる
　イメージセンサ。