JP7353847B2 - 情報処理装置、撮像装置、制御方法およびプログラム - Google Patents

情報処理装置、撮像装置、制御方法およびプログラム Download PDF

Info

Publication number
JP7353847B2
JP7353847B2 JP2019138934A JP2019138934A JP7353847B2 JP 7353847 B2 JP7353847 B2 JP 7353847B2 JP 2019138934 A JP2019138934 A JP 2019138934A JP 2019138934 A JP2019138934 A JP 2019138934A JP 7353847 B2 JP7353847 B2 JP 7353847B2
Authority
JP
Japan
Prior art keywords
processing
inference
image
inference parameter
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019138934A
Other languages
English (en)
Other versions
JP2021022862A (ja
Inventor
章弘 田邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019138934A priority Critical patent/JP7353847B2/ja
Priority to GB2011198.5A priority patent/GB2590095B/en
Priority to US16/934,130 priority patent/US11496682B2/en
Priority to DE102020119696.2A priority patent/DE102020119696A1/de
Priority to CN202010738818.9A priority patent/CN112312007A/zh
Publication of JP2021022862A publication Critical patent/JP2021022862A/ja
Priority to US17/848,656 priority patent/US11659275B2/en
Application granted granted Critical
Publication of JP7353847B2 publication Critical patent/JP7353847B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/667Camera operation mode switching, e.g. between still and video, sport and normal or high- and low-resolution modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B3/00Focusing arrangements of general interest for cameras, projectors or printers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • H04N23/632Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters for displaying or modifying preview images prior to image capturing, e.g. variety of image resolutions or capturing parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/634Warning indications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Neurology (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報処理装置、撮像装置、制御方法およびプログラムに関する。
デジタルカメラ等の撮像装置は、撮影した画像の識別等の処理を行う。ここで、撮像装置が、ニューラルネットワークを用いて、撮影した画像の識別等の処理を行うことが考えられる。関連する技術として、特許文献1の内視鏡システムが提案されている。この特許文献1の内視鏡システムは、動的辞書更新に関するコマンドデータがカプセル型内視鏡に送信され、カプセル型内視鏡は、RAMに記憶された動的辞書をコマンドデータに基づいて更新する。
特開2009-78069号公報
一般に、ニューラルネットワークの処理は、非常に多くの積和演算を実行するため、積和演算回路を搭載した専用回路が使用される。ここで、撮像された画像に対して複数のニューラルネットワークの処理が行われる場合、ニューラルネットワークの処理を行う専用回路を効率的に使用することが求められている。特許文献1の内視鏡システムは、動的辞書をコマンドデータに基づいて更新しているが、ニューラルネットワークの処理を行う専用回路を効率的に使用するものではない。
本発明は、画像に対して適用するニューラルネットワークを効率的に切り替えることを目的とする。
上記目的を達成するために、本発明の情報処理装置は、ニューラルネットワークの演算処理を行う処理部と、画像を撮影するための撮影制御のための処理に適用される第1の推論パラメータと前記画像の加工制御のための処理に適用される第2の推論パラメータとを前記処理部に設定することが可能な制御手段と、を備え、前記制御手段は、前記画像の撮影準備指示を受け付けたことに応じて、またはフォーカスの対象が確定したことに応じて、前記処理部に設定されている前記第1の推論パラメータを前記第2の推論パラメータに切り替えることを特徴とする。
本発明によれば、画像に対して適用するニューラルネットワークを効率的に切り替えることができる。
撮像装置を示すブロック図である。 第1実施形態のニューラルネットワーク処理部の構成を示した図である。 全体的な処理の流れを示すフローチャートである。 静止画撮影処理の流れを示すフローチャートである。 連続撮影処理の流れを示すフローチャートである。 動画撮影処理の流れを示すフローチャートである。 優先モードを選択する画面例を示す図である。 第2実施形態のニューラルネットワーク処理部の構成を示した図である。 第2実施形態の静止画撮影処理の流れを示すフローチャートである。 第2実施形態の連続撮影処理の流れを示すフローチャートである。 第2実施形態の動画撮影処理の流れを示すフローチャートである。
以下、本発明の各実施の形態について図面を参照しながら詳細に説明する。しかしながら、以下の各実施の形態に記載されている構成はあくまで例示に過ぎず、本発明の範囲は各実施の形態に記載されている構成によって限定されることはない。
<第1実施形態>
図1は、撮像装置100を示すブロック図である。撮像装置100は、CPU101とメモリ102と不揮発性メモリ103と操作部104とニューラルネットワーク処理部105とを有する。また、撮像装置100は、撮影レンズ111と撮像部112と画像処理部113と符号化処理部114と表示制御部115と表示部116とを有する。さらに、撮像装置100は、通信制御部117と通信部118と記録媒体制御部119と内部バス130とを有する。撮像装置100は、撮影レンズ111を用いて、被写体の光学像を撮像部112の画素アレイに結像する。撮影レンズ111は、撮像装置100のボディ(筐体または本体)から着脱可能であってもよいし、着脱不能であってもよい。また、撮像装置100は、記録媒体制御部119を介して画像データの書き込みおよび読み出しを記録媒体120に対して行う。記録媒体120も、撮像装置100に着脱可能であってもよいし、着脱不能であってもよい。
CPU101(第1のCPU)は、不揮発性メモリ103に記憶されているコンピュータプログラムを実行することにより、内部バス130を介して撮像装置100の各部の動作を制御する。CPU101は、制御手段に対応する。メモリ102は、書き換え可能な揮発性メモリである。メモリ102は、撮像装置100の各部の動作を制御するためのコンピュータプログラムや撮像装置100の各部の動作に関するパラメータ等の情報や通信制御部117が受信する情報等を一時的に記憶する。また、メモリ102は、撮像部112が取得した画像(画像データ)、或いは画像処理部113や符号化処理部114等が処理を施した画像および情報を一時的に記憶する。メモリ102は、各種の情報を記憶するための記憶容量を有している。また、メモリ102には、ニューラルネットワーク処理部105が使用する情報が記憶される。ニューラルネットワーク処理部105が使用する情報としては、ニューラルネットワークの処理内容を記述したコンピュータプログラム、および学習済み係数パラメータ(重み係数やバイアス値等)がある。重み係数は、ニューラルネットワークにおいてノード間の接続の強さを示す値である。バイアスは、重み係数と入力データとの積算値に対してオフセットを与える値である。学習済み係数パラメータの値は、ニューラルネットワークに対する機械学習により調整されている。
不揮発性メモリ103は、電気的な消去および記憶が可能なメモリである。例えば、不揮発性メモリ103には、EEPROMやハードディスク等が用いられる。不揮発性メモリ103は、CPU101が実行するコンピュータプログラムや撮像装置100の各部の動作に関するパラメータ等の情報を記憶する。CPU101がコンピュータプログラムを実行することにより、撮像装置100が行う各種動作が実現される。上述したニューラルネットワークが使用する情報は、不揮発性メモリ103に記憶されてもよい。
操作部104は、撮像装置100をユーザが操作するために設けられている。操作部104は、電源ボタンやメニューボタン、撮影用のレリーズボタン、動画録画ボタン、キャンセルボタン等の各種ボタンを含む。各種ボタンは、スイッチやタッチパネル等により構成され得る。CPU101は、操作部104を介して入力されたユーザからの指示に従って撮像装置100を制御する。CPU101は、例えば、リモートコントローラや携帯端末等から通信部118を介して入力される要求に基づいて、撮像装置100を制御してもよい。ニューラルネットワーク処理部105については後述する。
撮影レンズ111は、レンズユニットであり、レンズ群やレンズ制御手段、絞り等を含んで構成される。レンズ群は、ズームレンズやフォーカスレンズ等を含む。撮影レンズ111は、画角を変更するズーム手段として機能することができる。レンズ制御手段は、CPU101が送信した制御信号に従って、焦点の調整および絞り値(F値)の制御を行う。撮像部112は、動画像を構成する複数の画像を順次取得する。撮像部112には、例えば、CCD(電荷結合素子)やCMOS(相補型金属酸化膜半導体)素子等のエリアイメージセンサが適用される。撮像部112は、被写体の光学像を電気信号に変換する不図示の光電変換部が行列状、すなわち、2次元的に配列された画素アレイを有している。該画素アレイには、被写体の光学像が撮影レンズ111から結像される。撮像部112は、撮像した画像を画像処理部113またはメモリ102に出力する。撮像部112は、静止画として画像を取得することもできる。
画像処理部113は、撮像部112が出力した画像データ、またはメモリ102から読み出された画像データに対して、所定の画像処理を施す。該画像処理としては、ダイナミックレンジ変換処理や補間処理、縮小処理(リサイズ処理)、色変換処理等を適用することができる。また、画像処理部113は、撮像部112が取得した画像を用いて、露光制御や測距制御等を行うための所定の演算処理を行う。画像処理部113が演算処理した結果に基づいて、CPU101は、露光制御や測距制御等を行う。例えば、CPU101は、AE(自動露出)処理やAWB(オートホワイトバランス)処理、AF(オートフォーカス)処理等を行う。
符号化処理部114は、画像データに対してフレーム内予測符号化(画面内予測符号化)やフレーム間予測符号化(画面間予測符号化)等を行う。これにより、画像データのサイズが圧縮される。符号化処理部114は、例えば、半導体素子等により構成された符号化装置であってもよい。また、符号化処理部114は、撮像装置100の外部に設けられた符号化装置であってもよく、撮像装置100が、符号化された画像データを外部の符号化装置から取得してもよい。
表示制御部115は、表示部116を制御する。表示制御部115は、例えば、GPUにより実現される。表示制御部115は、表示部116の表示画面に表示可能な画像を生成し、生成された画像を画像信号として表示部116に出力する。また、表示制御部115は、表示部116に画像データを出力するだけでなく、通信制御部117を介して外部機器217に画像データを出力することも可能である。表示部116は、表示制御部115から送られてくる画像信号に基づいて、表示画面に画像を表示する。表示部116は、表示画面にメニュー等の設定画面を表示する機能であるOSD(On Screen Display)機能を有する。表示制御部115は、画像信号にOSD画像を重畳して表示部116に画像信号を出力することができる。表示部116は、液晶ディスプレイや有機ELディスプレイ等により構成されており、表示制御部115から送られてきた画像信号を表示する。表示部116は、例えばタッチパネルディスプレイであってもよい。表示部116がタッチパネルディスプレイである場合、表示部116は、操作部104の機能を兼ね備える。
通信制御部117は、CPU101により制御される。通信制御部117は、通信部118を制御する。通信制御部117は、HDMI(登録商標)(High Definition Multimedia Interface)やSDI(Serial Digital Interface)等の通信規格に準拠した映像信号を送信する。また、通信部118は、映像信号以外の制御信号を送受信することも可能である。通信部118は、映像信号と制御信号とを物理的な電気信号に変換して、外部機器217と送受信を行う。通信制御部117は、所定の無線通信規格に適合する変調信号を生成して、該変調信号を通信部118から送信させてもよい。また、通信制御部117は、通信部118が受信した外部機器217からの変調信号を取得してもよい。
記録媒体制御部119は、記録媒体120を制御する。記録媒体制御部119は、CPU101からの要求に基づいて、記録媒体120を制御するための制御信号を記録媒体120に出力する。記録媒体120としては、例えば、不揮発性メモリや磁気ディスク、半導体メモリ等が適用される。記録媒体120は、符号化された画像データ等を記憶する。記録媒体120には、該記録媒体120のファイルシステムに適合した形式で画像データ等がファイルとして保存される。CPU101やニューラルネットワーク処理部105等の各部は、内部バス130を介して相互にアクセス可能となっている。
図2は、ニューラルネットワーク処理部105の構成を示した図である。ニューラルネットワーク処理部105は、処理部としてのニューラルコア140により構築される。ニューラルコア140は、予め学習済みの係数パラメータを用いて演算処理を行うことで、推論処理を行う。各実施形態のニューラルネットワークは、CNN(Convolutional Neural Network)であるものとして説明する。ただし、CNN以外のニューラルネットワークが適用されてもよい。CNNとしては、例えば、畳み込み層とプーリング層とが交互に積層され、出力側に全結合層が接続されている層構造を採用することができる。上述した学習済み係数パラメータは、全結合層における各層のノード間を結合する各エッジのそれぞれが有する重みやバイアスに相当する。また、学習済み係数パラメータは、全結合層の前段の各層では、カーネル(フィルタ)の重みやバイアスに相当する。
ニューラルコア140は、例えば、ニューラルネットワークの処理を行うための専用回路である。ニューラルコア140は、CPU141、積和演算回路142、DMA143および内部メモリ144を有する。CPU141(第2のCPU)は、図1のCPU101とは異なるCPUである。CPU141は、ニューラルネットワークの処理内容が記述されたコンピュータプログラムを実行する。該コンピュータプログラムは、CPU141が、内部バス130を介してメモリ102または不揮発性メモリ103から読み出してもよいし、内部メモリ144から読み出してもよい。また、CPU141は積和演算回路142およびDMA143の制御も行う。
積和演算回路142は、ニューラルネットワークの処理における積和演算を行う回路である。積和演算回路142は、複数の積和演算回路により構成されており、各積和演算回路は、並列に演算処理を実行することが可能である。DMA143は、CPU141を介さないデータ転送を行う回路である。DMA143は、内部バス130を介してメモリ102または不揮発性メモリ103と内部メモリ144との間のデータ転送制御を行う。また、DMA143は、積和演算回路142と内部メモリ144との間のデータ転送制御も行う。DMA143が転送するデータとしては、ニューラルネットワークの処理内容を記述したコンピュータプログラムや学習済み係数パラメータ、積和演算回路142が算出した中間データ等がある。
内部メモリ144は、ニューラルネットワークの処理内容を記述したコンピュータプログラムや学習済み係数パラメータ、積和演算回路142が算出した中間データ等を記憶する。また、内部メモリ144は複数のバンクを有してもよい。この場合、各バンクは動的に切り替え可能である。
次に、本実施形態の撮像装置100が行う通常の動作について説明する。例えば、ユーザが操作部104の電源ボタンを操作すると、操作部104は、該操作に基づいて、CPU101に起動の指示を出力する。CPU101は、該指示を受けて、電源供給部を制御して、撮像装置100の各ブロックに電源を供給する。各ブロックに電源が供給されると、CPU101は、例えば、操作部104のモード切り換えスイッチを確認する。本実施形態のモードは、静止画撮影モードと連続撮影モードと動画撮影モードと再生モードとを含む。モード切り換えスイッチは、何れかのモードに設定するためのスイッチである。ユーザは、モード切り換えスイッチを切り替えることで、上記の4つのモードの何れかのモードに切り替えることができる。切り替え可能なモードは、上述した4つのモードには限定されない。CPU101は、操作部104からの指示信号に基づいて、モード切り換えスイッチにより設定されているモードを確認する。
通常の静止画撮影モードについて説明する。ユーザが、撮影待機状態で操作部104のレリーズボタンを半押しすると、撮像装置100は、フォーカスを合わせる。そして、ユーザが、操作部104のレリーズボタンを全押しすることで、撮像装置100は、撮影した静止画の記録処理を行う。記録処理では、画像処理部113が、撮像部112が撮影した静止画の画像データに対して画像処理を施す。そして、符号化処理部114が、画像処理が施された画像データに対して符号化処理を施し、記録媒体制御部119が符号化された画像データを画像ファイルとして記録媒体120に記録する。
本実施形態では、撮像装置100は、静止画を連続撮影する機能を有している。ユーザが操作部104を用いて連続撮影を行う撮影モードに設定することで、連続撮影機能が有効になる。連続撮影機能が有効であるか無効であるかを示す情報は、メモリ102に記憶される。撮像装置100は、連続撮影機能が有効な状態において、レリーズボタンが全押しされている間、連続して静止画を撮影する。連続撮影機能を有効にしたモードが、連続撮影モードである。
動画撮影モードにおいて、ユーザが、操作部104の動画撮影ボタンを押下すると、撮像装置100は、動画の撮影を行う。動画撮影モードでは、撮像部112が撮影した連続した動画像データに対して画像処理部113が画像処理を施し、画像処理が施された動画像データに対して符号化処理部114が動画として符号化処理を施す。そして、記録媒体制御部119は、符号化された動画像データをファイルとして記録媒体120に記録する。
撮影待機状態では、撮像部112が所定のフレームレートで画像を撮影し、画像処理部113が画像に対して表示用の画像処理を施す。そして、表示制御部115は、表示用の画像処理が施された画像データを表示部116に表示させる。これにより、ライブビュー画像が表示される。再生モードでは、記録媒体制御部119が記録媒体120に記憶されている画像ファイルを読み出し、符号化処理部114が読み出した画像ファイルの画像データを復号する。そして、画像処理部113が表示用の処理を画像データに対して施し、表示制御部115が表示部116に画像データを表示させる。
次に、ニューラルネットワーク処理部105が行う全体的な処理について説明する。図3は、ニューラルネットワーク処理部105が行う全体的な処理の流れを示すフローチャートである。ユーザが、撮像装置100の電源をオンにする操作を撮像装置100に対して行うと、撮像装置100の電源が投入される。そして、不揮発性メモリ103に記憶されているコンピュータプログラムがメモリ102に展開され、メモリ102に展開されたコンピュータプログラムをCPU101が読み出して実行する。CPU101は撮像112に所定のフレームレートで画像を撮影させ、表示部116にライブビュー画像の表示を開始させる。
CPU101は、操作部104のモード切り換えスイッチが動画撮影モードに設定されているかを判定する(S301)。S301でNoと判定された場合、CPU101は、連続撮影モードに設定されているかを判定する(S302)。CPU101は、メモリ102に記憶されている連続撮影機能が有効であるか無効であるかの情報に基づいて、S302の判定を行う。S302でNoと判定された場合、CPU101は、静止画撮影処理を実行するように制御する(S303)。S302でYesと判定された場合、CPU101は、連続撮影処理(連写撮影処理)を実行するように制御する(S304)。S301でYesと判定された場合、動画撮影を実行するように制御する(S305)。静止画撮影処理、連続撮影処理および動画撮影処理の詳細については後述する。
次に、S303の静止画撮影処理について説明する。図4は、静止画撮影処理の流れを示すフローチャートである。CPU101は、メモリ102から読み出した第1の推論パラメータを、CPU141に通知する。通知を受けたCPU141は、DMA143を制御して、第1の推論パラメータを読み出す(S401)。読み出された第1の推論パラメータは、内部メモリ144に記憶される。これにより、ニューラルコア140に第1の推論パラメータが設定される。第1の推論パラメータは、撮影制御のためにニューラルネットワークを適用する場合に使用される学習済み係数パラメータである。
CPU101は、CPU141に対して、第1の推論パラメータを用いたニューラルネットワークの処理を実行させる旨の通知を行う。CPU141は、ライブビュー画像を入力として、積和演算回路142に積和演算処理を実行させて、第1の推論パラメータを適用したニューラルネットワークの処理を行う。これにより、撮影制御のための処理として、第1の推論パラメータを用いた画像の解析処理が行われる(S402)。第1の推論パラメータを用いた解析処理は、撮影モードの判定や被写体(人体や物体)の検出を含む。第1の推論パラメータを用いた撮影制御のための処理は、撮影パラメータを設定するための他の処理であってもよい。S402が行われることで、例えば、ポートレートモードや風景モードなどの静止画の撮影モードが判定され、被写体が検出される。S402の処理結果は、表示部116に表示される。
次に、CPU101は、操作部104のレリーズボタンが半押しされ、フォーカスの対象が確定しているかを判定する(S403)。S403でYesと判定された場合、撮像装置100は、撮影準備指示を受け付けている。この場合、フローは、後述するS405に移行する。S403でNoと判定された場合、CPU101は、レリーズボタンが半押しされていなくとも、フォーカスの対象が確定しているかを判定する(S404)。例えば、表示部116がタッチパネルディスプレイである場合には、ユーザが表示部116をタッチすることで、フォーカスの対象を確定させることができる。あるいは、第1の推論パラメータを用いた解析処理によって、自動的にフォーカスの対象を確定させるようにしてもよい。S404でNoと判定された場合、フローは、S402に戻る。
S403でYesと判定された場合、またはS404でYesと判定された場合、CPU101は、メモリ102から読み出した第2の推論パラメータを、CPU141に通知する。通知を受けたCPU141は、DMA143を制御して、第2の推論パラメータを読み込む(S405)。読み込まれた第2の推論パラメータは、内部メモリ144に記憶される。これにより、ニューラルコア140に設定されている推論パラメータは、第1の推論パラメータから第2の推論パラメータに切り替えられる。第2の推論パラメータは、画像の加工制御ためにニューラルネットワークを適用する場合に使用する学習済み係数パラメータである。
CPU101は、操作部104のレリーズボタンが全押しされたかを判定する(S406)。S406でNoと判定された場合、レリーズボタンが離されているか(半押しが解除されているか)、あるいは、フォーカスの対象の確定が解除されているかを判定する(S407)。なお、レリーズボタンが離された場合、またはフォーカスの対象の確定が解除された場合は、フローは、S401に戻る。この場合、ニューラルコア140に設定されている推論パラメータは、S401において、第2の推論パラメータから第1の推論パラメータに切り替えられる。どちらでもない場合は、S406に戻り、操作部104のレリーズボタンの全押しされ、撮影が実行されるまで待機する。
S406でYesと判定された場合、CPU101は静止画の撮影を行う(S408)。さらに、CPU101は、メモリ102から読み出した第2の推論パラメータを、CPU141に通知する。CPU141は、S408で撮影した画像を入力として、積和演算回路142に積和演算処理を実行させて、第2の推論パラメータを適用したニューラルネットワークの処理を行う。これにより、画像の加工制御のための処理として、第2の推論パラメータを用いたニューラルネットワーク処理が行われる(S409)。第2の推論パラメータを用いたニューラルネットワーク処理は、画像のフィルタ処理や画像回復処理、超解像処理、現像処理、および、符号化処理部114の一部の処理等を含む。S407が行われることで、例えば、画像の画像回復処理が行われる。第2の推論パラメータを用いたニューラルネットワーク処理の処理結果は、記録媒体制御部119に出力され得る。これにより、記録媒体120に、現像処理が行われた画像が記録される。
このように、フォーカス対象が確定する前には、ニューラルコア140に第1の推論パラメータが設定されている。そして、ニューラルコア140は、第1の推論パラメータを用いたニューラルネットワーク処理を行う。そして、フォーカスの対象が確定したことに応じて、ニューラルコア140に設定されている推論パラメータは、第1の推論パラメータから第2の推論パラメータに切り替えられる。これにより、ニューラルコア140は、第2の推論パラメータを用いたニューラルネットワーク処理を行うことができる。ここで、操作部140のレリーズボタンが全押しされてから、ニューラルコア140に設定されている推論パラメータを、第1の推論パラメータから第2の推論パラメータに切り替えようとする。この場合、この切り替えのための処理に時間を要してしまい、第2の推論パラメータを用いたニューラルネットワーク処理の開始が遅れてしまう。一般的に、静止画撮影のためのフォーカスの対象が確定した後に、撮影モードやフォーカス対象とすべき被写体が変わる可能性は低い。よって、フォーカスの対象が確定したことに応じて、ニューラルコア140に設定されている推論パラメータを第2の推論パラメータに切り替えたとしても、撮影制御に対する影響は小さい。こうすることで、静止画の撮影後すぐに第2の推論パラメータを用いたニューラルネットワーク処理を開始することができる。以上により、静止画撮影のためのフローチャートに応じて、画像に対して適用するニューラルネットワークを効率的に切り替えることができる。
次に、図3のS304の連続撮影処理について説明する。図5は、連続撮影処理の流れを示すフローチャートである。連続撮影処理は、連続撮影モードに設定されている場合に実行される。まず、CPU101からの通知により、ニューラルコア140は、第1の推論パラメータを読み込む(S501)。S501の処理はS401の処理と同様である。また、ニューラルコア140は、撮影制御のための処理として、第1の推論パラメータを用いたニューラルネットワーク処理を行う(S502)。S502の処理はS402の処理と同様である。連続撮影処理では、操作部104のレリーズボタンが半押しされた場合であっても、第1の推論パラメータを用いたニューラルネットワーク処理を継続する。
CPU101は、操作部104のレリーズボタンが全押しされたかを判定する(S503)。全押しされていない場合(S503でNoと判定された場合)は、S502に戻る。
S503でYesと判定された場合、CPU101は静止画の撮影を行う(S504)。なお、連続撮影モードでは、撮像装置100が撮影した画像は、全て、メモリ102または記録媒体120に一時的に記憶されていくものとする。
さらに、CPU101は、連続撮影が完了したか否かを判定する(S505)。CPU101は、操作部104のレリーズボタンの全押しが解除されていれば、ユーザが連続撮影の完了を指示したと判定し、解除されていなければ、連続撮影が継続されると判定する。
S505でNoと判定された場合、第1の推論パラメータを用いたニューラルネットワーク処理を行ってから(S506)、次の静止画撮影を行う(S504)。
S505でYesと判定された場合、CPU101は、ニューラルコア140に、第2の推論パラメータの通知を行う。そして、ニューラルコア140は、第2の推論パラメータを読み込む(S507)。S507の処理は、S405と同様である。これにより、ニューラルコア140に設定されている推論パラメータは、第1の推論パラメータから第2の推論パラメータに切り替えられる。そして、ニューラルコア140は、画像の加工制御のための処理として、第2の推論パラメータを用いてニューラルネットワーク処理を行う(S508)。S508の処理は、S409の処理と同様である。なお、連続撮影処理では、CPU101は、S508の処理を行った静止画を、メモリ102または記録媒体120から消去する。CPU101は、メモリ102または記録媒体120に一時的に記憶された静止画の全てに対して、S508の処理を実行すると、処理は終了する。
連続撮影モードに設定されている場合、連続撮影が終了するまで、ニューラルコア140は、撮影制御のための処理として、連続撮影される複数の静止画に対して、第1の推論パラメータを用いたニューラルネットワーク処理を行う。そして、連続撮影が終了したことに応じて、ニューラルコア140に設定されている第1の推論パラメータが、第2の推論パラメータに切り替えられる。ニューラルコア140は、複数の静止画に対して、第2の推論パラメータを用いてニューラルネットワーク処理を行う。被写体が動体の場合、撮像装置100が被写体の位置を見失わないように、連続撮影した静止画、あるいは、静止画の間のライブビュー画像を用いて、被写体の検出を行うことが望ましい。ゆえに、連続撮影モードでは、第2の推論パラメータを用いたニューラルネットワーク処理の開始が多少遅れることになるとしても、連続撮影が終了までは、ニューラルコア140に第1の推論パラメータを設定する。
次に、図3のS305の動画撮影処理について説明する。図6は、動画撮影処理の流れを示すフローチャートである。CPU101は、撮影制御のための処理と画像の加工制御のための処理との何れの処理をニューラルコア140で実行するのかを判定する(S601)。S601の判定は、ユーザによる選択に応じて行われてもよい。S601の判定の詳細については、後述するが、AI優先モードとして、ユーザによって撮影優先が選択されれば、撮影制御のための処理が選択されたと判定し、記録優先が選択されれば、画像の加工制御のための処理が選択されたと判定する。S601で「撮影制御のための処理」が選択されたと判定された場合、CPU101は、ニューラルコア140に第1の推論パラメータを通知する。そして、ニューラルコア140は、第1の推論パラメータを読み込む(S602)。ニューラルコア140は、撮影制御のための処理として、第1の推論パラメータを用いたニューラルネットワーク処理を行う(S603)。S603の処理はS402と同様である。CPU101は動画撮影が開始されたか判定する(S604)。
S604でNoと判定された場合、フローはS603に戻る。S604でYesと判定された場合、ニューラルコア140は、動画撮影中における撮影制御のための処理として、第1の推論パラメータを用いたニューラルネットワーク処理を行う(S605)。
CPU101は、動画撮影が終了したかを判定する(S606)。撮影が終了したかは、操作部104の動画撮影ボタンによる撮影が継続されているかに基づいて判定できる。S606でNoと判定された場合、フローは、S605に戻る。S606でYesと判定された場合、処理は終了する。
S601で「画像の加工制御のための処理」が選択されたと判定された場合、CPU101は、ニューラルコア140に第2の推論パラメータを通知する。そして、ニューラルコア140は、第2の推論パラメータを読み込む(S607)。CPU101は動画撮影が開始されたか判定する(S608)。
フローは、S608でNoであればYesになるまで待機し、YesであればS609に進む。ニューラルコア140は、動画撮影中における画像の加工制御のための処理として、第2の推論パラメータを用いたニューラルネットワーク処理を行う(S609)。S609の処理はS409と同様である。
CPU101は、動画撮影が終了したかを判定する(S610)。S610の判定は、S606の判定と同様である。S610でNoと判定された場合、フローは、S609に戻る。S610でYesと判定された場合、処理は終了する。
上述したように、動画撮影処理では、第1の推論パラメータを用いたニューラルネットワークの処理と第2の推論パラメータを用いたニューラルネットワークの処理とのうち何れか一方が行われる。ニューラルネットワークの処理における積和演算の演算量は多いことから、1枚の画像に対するニューラルネットワークの処理には、ある程度の時間を要する。一方、動画撮影は、フレームレートに応じて画像が順次取得されていく。従って、1つのニューラルコア140が、高速に取得される各画像に対して、第1の推論パラメータを用いたニューラルネットワークの処理と第2の推論パラメータを用いたニューラルネットワークの処理との両者を適用することは難しい。そこで、動画撮影モードに設定されている場合、露光前処理にニューラルネットワーク処理を適用するか、または露光後処理にニューラルネットワーク処理を適用するかが、ユーザ等により選択される。
図7は、優先モードを選択する画面例を示す図である。図7(A)は、メニュー画面であり、表示部116に表示される画面である。メニュー画面は、複数の項目を有する。ユーザは、操作部104を操作して、カーソル201を移動させることで、設定を変更する項目を選択することができる。表示部116がタッチパネルディスプレイである場合、ユーザは、表示部116に対して、選択操作を行ってもよい。図7(A)のメニュー画面で、「AI優先モード選択(動画)」を選択する操作が行われたとする。該操作に応じて、表示制御部115は、図7(B)の選択画面を表示部116に表示させる。
図7(B)の選択画面は、「撮影優先」と「記録優先」とのうち何れかを選択するための画面である。ユーザは、操作部104または表示部116に対してカーソル202の操作を行うことで、「撮影優先」と「記録優先」とのうち何れかを選択できる。「撮影優先」は、撮影制御のためにニューラルネットワーク処理を適用する場合に選択する項目である。「記録優先」は、画像の加工制御のためにニューラルネットワーク処理を適用する場合に選択する項目である。何れかの項目が選択された状態で、セットボタン203が押下されると、CPU101は、ニューラルネットワーク処理を撮影制御のための処理と画像の加工制御のための処理とのうち何れに適用するかを認識する。これにより、CPU101は、S601の判定を行うことができる。S601の判定は、図7の画面例を用いた選択以外の手法により行われてもよい。例えば、ユーザからの指示がない場合、CPU101は、初期値として、ニューラルネットワーク処理を撮影制御のための処理に適用すると判定してもよい。また、CPU101は、撮影制御のための処理と画像の加工制御のための処理とのうち、最後にユーザから指示があった方の処理にニューラルネットワーク処理を適用すると判定してもよい。
また、動画撮影時に適用される第1の推論パラメータを用いたニューラルネットワーク処理の演算量は、静止画撮影時に適用される第1の推論パラメータを用いたニューラルネットワーク処理の演算量より少なくてもよい。この場合、メモリ102または記録媒体120には、動画撮影に用いられる第1の推論パラメータと静止画撮影に用いられる第1の推論パラメータとが記憶される。上述したように、動画撮影では、所定のフレームレートで画像が取得されていく。このため、動画撮影の場合、取得される画像に対して、高速にニューラルネットワーク処理を行う必要がある。ここで、動画撮影時の第1の推論パラメータの演算量が少なければ、高いフレームレートによる動画撮影で取得される画像に対して、第1の推論パラメータを用いたニューラルネットワーク処理を行うことが可能になる。第2の推論パラメータも、第1の推論パラメータと同様である。つまり、動画撮影時に適用される第2の推論パラメータの演算量は、静止画撮影時に適用される第2の推論パラメータの演算量より少なくてもよい。
また、CPU101は、第1の推論パラメータを用いたニューラルネットワークの処理の処理結果に応じて、複数の第2の推論パラメータから1つの第2の推論パラメータを選択してもよい。このとき、CPU101は、第1の推論パラメータを用いたニューラルネットワークの処理の処理結果に応じて、複数の第2の推論パラメータから最も適切な第2の推論パラメータを選択してもよい。
例えば、第1の推論パラメータを用いたニューラルネットワーク処理により、被写体として人体が検出され、且つ撮影モードとしてポートレートモードであると判定されたとする。この場合、CPU101は、第2の推論パラメータとして、被写体がソフト且つ明るくなるフィルタ処理または画像回復処理のための推論パラメータを選択する。ニューラルコア140は、選択された推論パラメータを用いてニューラルネットワーク処理を行う。一方、第1の推論パラメータを用いたニューラルネットワーク処理により、人体も特定の物体も検出されず、且つ風景モードであると判定されたとする。この場合、CPU101は、第2の推論パラメータとして、被写体のコントラストと彩度とを強調するフィルタ処理または画像回復処理のための推論パラメータを選択する。
さらに、メモリ102または記録媒体120には、複数種類の第1の推論パラメータ、および、第2の推論パラメータに加えて、第3の推論パラメータが記憶されていてもよい。第3の推論パラメータは、静止画や動画を再生するためにニューラルネットワークを適用する場合に使用される学習済み係数パラメータである。CPU101は、第1の推論パラメータを用いたニューラルネットワーク処理の処理結果に応じて、複数種類の第3の推論パラメータから1つの第3の推論パラメータを選択してもよい。再生処理としては、例えば、再生画像のフィルタ処理や再生画像から特定の被写体(物体や人物等)を検出する処理等がある。また、撮影が完了した後に自動的にプレビュー画像を表示する際に、第3の推論パラメータを用いるようにしてもよい。
以上説明したように、本実施形態によれば、それぞれの撮影モードに適したタイミングで、ニューラルコア140に設定される推論パラメータが、動的に切り替われる。これにより、ニューラルコア140に設定するニューラルネットワークを、状況に応じて、効率的に切り替えることができる。
<第2実施形態>
次に、第2実施形態について説明する。撮像装置100の構成は第1実施形態と同様であるため、説明を省略する。図8は、第2実施形態のニューラルネットワーク処理部105の構成を示す図である。ニューラルネットワーク処理部105は、ニューラルコア140およびニューラルコア150を有する。ニューラルコア140は、CPU141、積和演算回路142、DM143および内部メモリ144を有する。ニューラルコア150は、CPU151、積和演算回路152、DM153および内部メモリ154を有する。
ニューラルネットワーク処理部105は、3つ以上のニューラルコア140を有していてもよい。また、図8の例では、各ニューラルコアはそれぞれ内部メモリを有しているが、ニューラルネットワーク処理部105は、各ニューラルコアが共通で使用する内部メモリを有していてもよい。さらに、第2実施形態では、CPU101または表示制御部115の何れかを用いてニューラルネットワークの処理を実施してもよい。第2実施形態では、各推論パラメータは、複数の処理単位に分割されているものとする。各処理単位は、それぞれ処理内容が異なる。
例えば、撮影制御のための第1の推論パラメータが、被写体検出と撮影モードの判定とのニューラルネットワークの処理に適用される推論パラメータであるとする。この場合、第1の推論パラメータは、処理単位として、被写体検出に用いられる第1の推論パラメータと撮影モードの判定に用いられる第1の推論パラメータとを含む。また、画像の加工制御のための第2の推論パラメータが、画像回復処理と符号化処理とに適用される推論パラメータであるとする。この場合、第2の推論パラメータは、処理単位として、画像回復処理に用いられる第2の推論パラメータと符号化処理に用いられる第2の推論パラメータとを含む。
第2実施形態におけるニューラルネットワーク処理部105が行う全体的な処理の流れを、図9のフローチャートを参照して説明する。CPU101は、メモリ102から読み出した第1の推論パラメータを、処理単位ごとに分けてCPU141とCPU151に通知する。通知を受けたCPU141はDMA143を制御して、被写体検出に用いられる第1の推論パラメータを読み出し、CPU151はDMA153を制御して、撮影モードの判定に用いられる第1の推論パラメータを読み出す(S901)。
CPU101は、CPU141およびCPU151に対して、第1の推論パラメータを用いたニューラルネットワークの処理を実行させる旨の通知を行う。CPU141およびCPU151は、ライブビュー画像を入力として、第1の推論パラメータを適用したニューラルネットワークの処理を行う(S902)。
次に、CPU101は、操作部104のレリーズボタンが半押しされ、フォーカスの対象が確定しているかを判定する(S903)。S903でYesと判定された場合、フローは、S905に移行する。S903でNoと判定された場合、CPU101は、レリーズボタンが半押しされていなくとも、フォーカスの対象が確定しているかを判定する(S904)。S904でNoと判定された場合、フローは、S902に戻る。
S903でYesと判定された場合、またはS904でYesと判定された場合、CPU101は、メモリ102から読み出した第2の推論パラメータを、CPU151のみに通知する。通知を受けたCPU151は、DMA153を制御して、符号化処理に用いられる第2の推論パラメータを読み込む(S905)。読み込まれた第2の推論パラメータは、内部メモリ154に記憶される。これにより、ニューラルコア150に設定されている推論パラメータは、第1の推論パラメータから第2の推論パラメータに切り替えられる。このとき、ニューラルコア140に設定されている推論パラメータは、第1の推論パラメータのままである。
CPU141は、ライブビュー画像を入力として、第1の推論パラメータを適用したニューラルネットワークの処理を行う(S906)。
CPU101は、操作部104のレリーズボタンが全押しされたかを判定する(S907)。S907でNoと判定された場合、レリーズボタンが離されているか(半押しが解除されているか)、あるいは、フォーカスの対象の確定が解除されているかを判定する(S908)。レリーズボタンが離された場合、またはフォーカスの対象の確定が解除された場合は、CPU101は、CPU151に、撮影モードの判定に用いられる第1の推論パラメータを読み込ませる(S909)。そして、S902に戻る。レリーズボタンが離された場合、またはフォーカスの対象の確定が解除された場合は、すぐに静止画の撮影が行われる可能性が低いため、2つのニューラルコアで第1の推論パラメータによる撮影制御を行えるようにしている。反対に、S908でNoの場合は、フローは、S906に戻る。
S907でYesと判定された場合、CPU101は静止画の撮影を行う(S910)。さらに、CPU151は、S910で撮影した画像を入力として、第2の推論パラメータを適用したニューラルネットワークの処理を行う。これにより、画像の加工制御のための処理として、第2の推論パラメータを用いたニューラルネットワーク処理が行われる(S911)。
このように、フォーカス対象が確定する前には、ニューラルコア140およびニューラルコア140の両方に第1の推論パラメータが設定されている。そして、所定の条件であるフォーカスの対象が確定したことに応じて、ニューラルコア150に設定されている推論パラメータのみが、第1の推論パラメータから第2の推論パラメータに切り替えられる。これにより、ニューラルコア150は、第2の推論パラメータを用いたニューラルネットワーク処理を行うことができる。これにより、静止画の撮影後すぐに第2の推論パラメータを用いたニューラルネットワーク処理を開始することができる。
ここで、ニューラルコア140に設定されている推論パラメータは、第1の推論パラメータのままである。そのため、フォーカスの対象が確定する前よりも処理速度は低下するが、フォーカスの対象が確定した後に、ライブビュー画像を入力として、第1の推論パラメータを用いたニューラルネットワーク処理を行うことができる。なお、ここでは、第1の推論パラメータを処理単位ごとに分けてCPU141とCPU151に通知するとしたが、CPU141とCPU151に、同じ第1の推論パラメータを通知するようにしてもよい。
CPU101は、S905の後で、第1の推論パラメータを用いたニューラルネットワークの処理の速度が低下していることを示す情報を表示部116に表示させてもよい。上述したように、S902の段階では、ニューラルコア140とニューラルコア150との2つのニューラルコアが、第1の推論パラメータを用いたニューラルネットワーク処理を行っている。一方、S906の段階では、ニューラルコア150は、第1の推論パラメータを用いたニューラルネットワーク処理を行っているが、ニューラルコア150は、第2の推論パラメータに切り替えられ、静止画が撮影されるまで待機している。従って、S902の段階よりもS906の段階の方が、第1の推論パラメータを用いたニューラルネットワーク処理の処理速度は遅くなる。上記の情報が表示されることで、ユーザに、被写体検出と撮影モードの判定の速度が遅くなったことについて、違和感を与えにくくなる。
なお、図9のフローチャートは、連続撮影処理においても用いることができる。図10は、連続撮影処理におけるフローチャートである。図10の連続撮影処理においては、S910までは、図9の静止画撮影処理と同じ処理を行う。S907でYesと判定され、S910でCPU101が静止画の撮影を行うと、CPU101は、連続撮影が完了したか否かを判定する(S1011)。なお、撮像装置100が撮影した静止画は、全て、メモリ102または記録媒体120に一時的に記憶されていくものとする。
S1011でNoと判定された場合、CPU141は、静止画、あるいは、静止画の後に得られたライブビュー画像を入力として、第1の推論パラメータを適用したニューラルネットワークの処理を行ってから(S1012)、次の静止画撮影を行う(S910)。
S1011でYesと判定された場合、CPU151は、S910で撮影した画像を入力として、第2の推論パラメータを適用したニューラルネットワークの処理を行う。これにより、画像の加工制御のための処理として、第2の推論パラメータを用いたニューラルネットワーク処理が行われる(S1013)。CPU101は、メモリ102または記録媒体120に一時的に記憶された静止画の全てに対して、S1013の処理を実行すると、処理は終了する。
次に、第2実施形態の動画撮影処理について説明する。CPU101は、ニューラルコア140に第1の推論パラメータの通知を行い、ニューラルコア150に第2の推論パラメータの通知を行う。ニューラルコア140は、一部の処理部に対応し、ニューラルコア150は、他の処理部に対応する。ニューラルコア140は、第1の推論パラメータを読み込む(S1101)。これにより、ニューラルコア140に第1の推論パラメータが設定される。また、ニューラルコア150は、第2の推論パラメータを読み込む(S1102)。これにより、ニューラルコア150に第2の推論パラメータが設定される。S1101より先にS1102が行われてもよいし、S1101とS1102とは同時に行われてもよい。
ニューラルコア140は、CPU101からの通知に基づき、ライブビュー画像を入力画像として、第1の推論パラメータを用いたニューラルネットワーク処理(撮影制御のための処理)を行う(S1103)。
動画撮影が開始されると(S1104)、ニューラルコア140は、動画の各フレーム画像を入力画像として、第1の推論パラメータを用いたニューラルネットワーク処理(撮影制御のための処理)を行う(S1105)。また、ニューラルコア150は、動画の各フレーム画像を入力画像として、第2の推論パラメータを用いたニューラルネットワーク処理(画像の加工制御のための処理)を行う(S1106)。S1105より先にS1006が行われてもよいし、S1105とS1106とは同時に行われてもよい。CPU101は、撮影終了の指示があったかを判定する(S1107)。S1107でNoと判定された場合、動画撮影は終了していないため、フローは、S1105に戻る。S1107でYesと判定された場合、動画撮影は終了したため、処理は終了する。
動画撮影処理では、複数のニューラルコアを用いて、第1の推論パラメータを用いたニューラルネットワーク処理と第2の推論パラメータを用いたニューラルネットワーク処理とが並列に行われる。これにより、動画撮影において、撮影制御のための処理と画像の加工制御のための処理とを並列に行うことができる。
<他の実施形態>
上述した各実施形態では、撮像装置100がCPU101およびニューラルネットワーク処理部105を有している例について説明した。撮像装置100に搭載可能なニューラルコアの回路規模には限りがある。従って、撮像装置100において、上述した各実施形態の制御が行われることで、少ないハードウェア資源のニューラルコアを有効活用できる。一方、上述した各実施形態は、撮像装置100だけでなく、所定の情報処理装置に適用することができる。
例えば、所定の情報処理装置としてエッジコンピュータを適用できる。この場合、エッジコンピュータは、CPU101およびニューラルネットワーク処理部105の機能を有する。撮像装置100は、撮影した画像を、通信部118を介して、エッジコンピュータに送信する。エッジコンピュータは、上述した各実施形態の処理を行い、処理結果を撮像装置100に送信する。そして、処理結果は、記録媒体120に記録される。この場合、情報処理装置は、取得手段および出力手段の機能を有する。撮像装置100とエッジコンピュータとが高速通信が可能な場合、各実施形態の処理は、エッジコンピュータにより実行されてもよい。また、各実施形態の処理は、エッジコンピュータではなく、例えば、クラウドサーバ等により実行されてもよい。或いは、各実施形態の処理は、スマートフォン等のスマートデバイスにより実行されてもよい。
また、図1に示されるように、撮像装置100は、外部機器217と通信可能である。従って、各実施形態の処理の一部が外部機器217により実行されてもよい。撮像装置100が、ニューラルネットワーク処理部105を有している場合、各推論パラメータは、必要に応じて、撮像装置100が、外部機器218から取得してもよい。
以上、本発明の好ましい実施の形態について説明したが、本発明は上述した各実施の形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。本発明は、上述の各実施の形態の1以上の機能を実現するプログラムを、ネットワークや記憶媒体を介してシステムや装置に供給し、そのシステム又は装置のコンピュータの1つ以上のプロセッサーがプログラムを読み出して実行する処理でも実現可能である。また、本発明は、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100 撮像装置
101 CPU
105 ニューラルネットワーク処理部
116 表示部
120 記録媒体
140 ニューラルコア
142 積和演算回路
150 ニューラルコア
152 積和演算回路

Claims (20)

  1. ニューラルネットワークの演算処理を行う処理部と、
    画像を撮影するための撮影制御のための処理に適用される第1の推論パラメータと前記画像の加工制御のための処理に適用される第2の推論パラメータとを前記処理部に設定することが可能な制御手段と、を備え、
    前記制御手段は、前記画像の撮影準備指示を受け付けたことに応じて、またはフォーカスの対象が確定したことに応じて、前記処理部に設定されている前記第1の推論パラメータを前記第2の推論パラメータに切り替えることを特徴とする情報処理装置。
  2. 前記制御手段は、前記画像の連続撮影を行う設定がされている場合、前記連続撮影が終了してから、前記第1の推論パラメータを前記第2の推論パラメータに切り替えることを特徴とする請求項1に記載の情報処理装置。
  3. 前記制御手段は、動画を撮影する設定がされている場合、前記第1の推論パラメータと前記第2の推論パラメータとのうち何れか一方を前記処理部に設定することを特徴とする請求項1に記載の情報処理装置。
  4. 前記動画の撮影に適用される前記第1の推論パラメータおよび前記第2の推論パラメータを用いたニューラルネットワークの処理の演算量は、静止画に適用される前記第1の推論パラメータおよび前記第2の推論パラメータを用いたニューラルネットワークの処理の演算量より少ないことを特徴とする請求項3に記載の情報処理装置。
  5. 表示部、をさらに備え、
    前記制御手段は、前記撮影制御のための処理と前記画像の加工制御のための処理との何れを優先させるかを選択するための画面を前記表示部に表示し、選択された処理に応じて、前記第1の推論パラメータまたは前記第2の推論パラメータを前記処理部に設定することを特徴とする請求項3または4に記載の情報処理装置。
  6. 前記制御手段は、前記撮影準備指示が解除された場合、または前記フォーカスの対象の確定が解除された場合、前記第2の推論パラメータを前記第1の推論パラメータに切り替えることを特徴とする請求項1に記載の情報処理装置。
  7. 前記制御手段は、記録された画像または動画を再生する設定がされている場合、前記第1の推論パラメータまたは前記第2の推論パラメータを、画像の再生処理に適用される第3の推論パラメータに切り替えることを特徴とする請求項1乃至6のうち何れか1項に記載の情報処理装置。
  8. ニューラルネットワークの演算処理を行う複数の処理部と、
    画像を撮影するための撮影制御のための処理に適用される第1の推論パラメータと前記画像の加工制御のための処理に適用される第2の推論パラメータとを前記ニューラルネットワークに設定することが可能な制御手段と、を備え、
    前記制御手段は、所定の条件を満たしたことに応じて、前記複数の処理部のうち一部の処理部に設定されている前記第1の推論パラメータを前記第2の推論パラメータに切り替えることを特徴とする情報処理装置。
  9. 前記所定の条件は、前記画像の撮影準備指示を受け付けたとき、またはフォーカスの対象が確定したときに満たされることを特徴とする請求項8に記載の情報処理装置。
  10. 表示部、をさらに備え、
    前記制御手段は、前記第1の推論パラメータを適用したニューラルネットワークの処理の速度が低下したことを示す情報を前記表示部に表示させることを特徴とする請求項8または9に記載の情報処理装置。
  11. 前記制御手段は、動画を撮影する設定がされている場合、前記複数の処理部のうち一部の処理部に前記第1の推論パラメータを設定し、他の処理部に前記第2の推論パラメータを設定することを特徴とする請求項9または10に記載の情報処理装置。
  12. 前記制御手段は、前記第1の推論パラメータを用いたニューラルネットワークの処理の処理結果に応じて、複数の前記第2の推論パラメータのうち何れか1つを選択することを特徴とする請求項1乃至11のうち何れか1項に記載の情報処理装置。
  13. ニューラルネットワークの演算処理を行う処理部と、
    画像を撮影するための撮影制御のための処理に適用される第1の推論パラメータと前記画像の加工制御のための処理に適用される第2の推論パラメータとを前記処理部に設定することが可能な制御手段と、を備え、
    前記制御手段は、撮影モードに応じて、前記第1の推論パラメータを前記第2の推論パラメータに切り替えるタイミングを異ならせることを特徴とする情報処理装置。
  14. 前記制御手段は、静止画を撮影するモードでは、撮影の開始が指示される前に前記第1の推論パラメータを前記第2の推論パラメータに切り替え、静止画を連続撮影するモードでは、連続撮影が完了してから、前記第1の推論パラメータを前記第2の推論パラメータに切り替えることを特徴とする請求項13に記載の情報処理装置。
  15. 前記処理部が行った処理結果を、前記画像を撮影した撮像装置に出力する出力手段、を備えることを特徴とする請求項1乃至14のうち何れか1項に記載の情報処理装置。
  16. 前記画像を撮影する撮像部と、
    請求項1乃至14の何れか1項に記載の情報処理装置を有することを特徴とする撮像装置。
  17. ニューラルネットワークの演算処理を行う処理部を有する情報処理装置の制御方法であって、
    画像を撮影するための撮影制御のための処理に適用される第1の推論パラメータと前記画像の加工制御のための処理に適用される第2の推論パラメータとを前記処理部に設定することが可能であり、前記画像の撮影準備指示を受け付けたことに応じて、またはフォーカスの対象が確定したことに応じて、前記処理部に設定されている前記第1の推論パラメータを前記第2の推論パラメータに切り替えることを特徴とする制御方法。
  18. ニューラルネットワークの演算処理を行う複数の処理部を有する情報処理装置の制御方法であって、
    画像を撮影するための撮影制御のための処理に適用される第1の推論パラメータと前記画像の加工制御のための処理に適用される第2の推論パラメータとを前記ニューラルネットワークに設定することが可能であり、所定の条件を満たしたことに応じて、前記複数の処理部のうち一部の処理部に設定されている前記第1の推論パラメータを前記第2の推論パラメータに切り替えることを特徴とする制御方法。
  19. ニューラルネットワークの演算処理を行う処理部を有する情報処理装置の制御方法であって、
    画像を撮影するための撮影制御のための処理に適用される第1の推論パラメータと前記画像の加工制御のための処理に適用される第2の推論パラメータとを前記処理部に設定することが可能であり、撮影モードに応じて、前記第1の推論パラメータを前記第2の推論パラメータに切り替えるタイミングを異ならせることを特徴とする制御方法。
  20. 請求項1乃至15のうち何れか1項に記載の情報処理装置の各手段をコンピュータに実行させるためのプログラム。
JP2019138934A 2019-07-29 2019-07-29 情報処理装置、撮像装置、制御方法およびプログラム Active JP7353847B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2019138934A JP7353847B2 (ja) 2019-07-29 2019-07-29 情報処理装置、撮像装置、制御方法およびプログラム
GB2011198.5A GB2590095B (en) 2019-07-29 2020-07-20 An information processing apparatus that performs arithmetic processing of a neural network, and an image pickup apparatus, control method, and storage medium
US16/934,130 US11496682B2 (en) 2019-07-29 2020-07-21 Information processing apparatus that performs arithmetic processing of neural network, and image pickup apparatus, control method, and storage medium
DE102020119696.2A DE102020119696A1 (de) 2019-07-29 2020-07-27 Informationsverarbeitungsvorrichtung, die eine Arithmetikverarbeitung eines neuronalen Netzwerks durchführt, und Bildaufnahmevorrichtung, Steuerverfahren und Speichermedium
CN202010738818.9A CN112312007A (zh) 2019-07-29 2020-07-28 信息处理设备、摄像设备、控制方法和存储介质
US17/848,656 US11659275B2 (en) 2019-07-29 2022-06-24 Information processing apparatus that performs arithmetic processing of neural network, and image pickup apparatus, control method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019138934A JP7353847B2 (ja) 2019-07-29 2019-07-29 情報処理装置、撮像装置、制御方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2021022862A JP2021022862A (ja) 2021-02-18
JP7353847B2 true JP7353847B2 (ja) 2023-10-02

Family

ID=72339105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019138934A Active JP7353847B2 (ja) 2019-07-29 2019-07-29 情報処理装置、撮像装置、制御方法およびプログラム

Country Status (5)

Country Link
US (2) US11496682B2 (ja)
JP (1) JP7353847B2 (ja)
CN (1) CN112312007A (ja)
DE (1) DE102020119696A1 (ja)
GB (1) GB2590095B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7129678B1 (ja) * 2021-12-24 2022-09-02 パナソニックIpマネジメント株式会社 撮像装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008060989A (ja) 2006-08-31 2008-03-13 Noritsu Koki Co Ltd 撮影画像補正方法及び撮影画像補正モジュール
JP2018060268A (ja) 2016-10-03 2018-04-12 株式会社日立製作所 認識装置および学習システム
WO2018203169A1 (ja) 2017-05-02 2018-11-08 株式会社半導体エネルギー研究所 撮像装置、及び電子機器

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2761391B2 (ja) * 1988-10-04 1998-06-04 オリンパス光学工業株式会社 焦点検出装置
JP3187861B2 (ja) * 1991-05-24 2001-07-16 オリンパス光学工業株式会社 自動焦点装置
JP3925476B2 (ja) 2003-08-08 2007-06-06 セイコーエプソン株式会社 撮影場面の判定および撮影場面に応じた画像処理
JP2005202562A (ja) 2004-01-14 2005-07-28 Konica Minolta Photo Imaging Inc 画像処理方法、画像処理装置及び画像処理プログラム
JP5053731B2 (ja) 2007-07-03 2012-10-17 キヤノン株式会社 画像表示制御装置及び画像表示制御方法及びプログラム及び記録媒体
JP2009078069A (ja) 2007-09-27 2009-04-16 Hoya Corp 内視鏡システムおよび撮影システム
CN103841323A (zh) * 2014-02-20 2014-06-04 小米科技有限责任公司 配置拍摄参数的方法、装置和终端设备
CN106060408B (zh) * 2016-07-29 2019-10-15 维沃移动通信有限公司 一种拍照方法及移动终端
JP7169094B2 (ja) * 2017-06-01 2022-11-10 株式会社東芝 画像処理システム及び医用情報処理システム
GB2570792B (en) 2017-12-26 2020-09-30 Canon Kk Image capturing apparatus, method of controlling the same, and storage medium
CN110012210B (zh) * 2018-01-05 2020-09-22 Oppo广东移动通信有限公司 拍照方法、装置、存储介质及电子设备
JP2019138934A (ja) 2018-02-06 2019-08-22 コニカミノルタ株式会社 静電潜像現像用トナー
JP2019146022A (ja) * 2018-02-21 2019-08-29 オリンパス株式会社 撮像装置及び撮像方法
JP2019215489A (ja) * 2018-06-14 2019-12-19 オリンパス株式会社 撮像装置および焦点調節方法
CN109344715A (zh) 2018-08-31 2019-02-15 北京达佳互联信息技术有限公司 智能构图控制方法、装置、电子设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008060989A (ja) 2006-08-31 2008-03-13 Noritsu Koki Co Ltd 撮影画像補正方法及び撮影画像補正モジュール
JP2018060268A (ja) 2016-10-03 2018-04-12 株式会社日立製作所 認識装置および学習システム
WO2018203169A1 (ja) 2017-05-02 2018-11-08 株式会社半導体エネルギー研究所 撮像装置、及び電子機器

Also Published As

Publication number Publication date
GB2590095A (en) 2021-06-23
JP2021022862A (ja) 2021-02-18
US11659275B2 (en) 2023-05-23
US11496682B2 (en) 2022-11-08
CN112312007A (zh) 2021-02-02
DE102020119696A1 (de) 2021-02-04
US20210037185A1 (en) 2021-02-04
US20220321783A1 (en) 2022-10-06
GB2590095B (en) 2023-10-18
GB202011198D0 (en) 2020-09-02

Similar Documents

Publication Publication Date Title
US11743583B2 (en) Imaging apparatus and setting screen thereof
JP4645685B2 (ja) カメラ、カメラ制御プログラム及び撮影方法
JP4702401B2 (ja) カメラ、カメラ制御プログラム及びカメラ制御方法
JP6652039B2 (ja) 撮像装置、撮像方法及びプログラム
JP7453772B2 (ja) 情報処理装置及びその制御方法、撮像装置システム、プログラム
JP6460868B2 (ja) 表示制御装置およびその制御方法
JP2021093568A (ja) 撮像装置、情報処理装置、及びこれらの制御方法並びにプログラム、学習済みモデル選択システム
JP7353847B2 (ja) 情報処理装置、撮像装置、制御方法およびプログラム
JP5950755B2 (ja) 画像処理装置、制御方法、プログラム及び記憶媒体
JP2013175824A (ja) 電子カメラ
JP4788172B2 (ja) 撮像装置及びプログラム
CN107295247B (zh) 图像记录装置及其控制方法
JP7458806B2 (ja) 画像処理装置および画像処理方法
JP6702792B2 (ja) 画像処理装置およびその制御方法
JP5170217B2 (ja) カメラ、カメラ制御プログラム及び撮影方法
JP5906846B2 (ja) 電子カメラ
WO2023210334A1 (ja) 画像処理装置、撮像装置及びそれらの制御方法
JP6871795B2 (ja) 撮像装置、その制御方法、プログラム及び記録媒体
JP7213657B2 (ja) 撮像装置及びその制御方法及びプログラム
JP6188484B2 (ja) 電子機器、その制御方法及びプログラム並びに記憶媒体
JP2023058934A (ja) 撮像システム、撮像装置、情報処理サーバー、撮像方法、情報処理方法、及びコンピュータプログラム
JP2023110541A (ja) 撮像システム、撮像装置、情報処理サーバー、撮像方法、情報処理方法、及びコンピュータプログラム
US20170324904A1 (en) Image pickup apparatus that shoots moving image for predetermined time period at the time of shooting still image, control method for the image pickup apparatus, and storage medium
JP2013030949A (ja) 電子機器、撮像装置およびプログラム
JP2017168984A (ja) 撮像装置及び撮像装置の制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230920

R151 Written notification of patent or utility model registration

Ref document number: 7353847

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151