JP2022175451A - 撮像装置およびその制御方法ならびにプログラム - Google Patents
撮像装置およびその制御方法ならびにプログラム Download PDFInfo
- Publication number
- JP2022175451A JP2022175451A JP2021081834A JP2021081834A JP2022175451A JP 2022175451 A JP2022175451 A JP 2022175451A JP 2021081834 A JP2021081834 A JP 2021081834A JP 2021081834 A JP2021081834 A JP 2021081834A JP 2022175451 A JP2022175451 A JP 2022175451A
- Authority
- JP
- Japan
- Prior art keywords
- image
- time
- point
- suitability
- reservation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003384 imaging method Methods 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims description 22
- 230000006870 function Effects 0.000 claims description 13
- 238000010801 machine learning Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims 3
- 238000012545 processing Methods 0.000 description 32
- 238000013528 artificial neural network Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000001454 recorded image Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/64—Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/63—Control of cameras or camera modules by using electronic viewfinders
- H04N23/633—Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Studio Devices (AREA)
- Exposure Control For Cameras (AREA)
Abstract
【課題】現在の画像から予測される好適なタイミングにおいて自動的に撮影することが可能な撮像装置を提供する。【解決手段】撮像手段から出力される第1時点の画像を用いて、第1時点より未来の第2時点の画像を予測した予測画像を生成する予測手段と、予測画像について、予測画像が記録する画像として適している度合いを示す好適度を決定する決定手段と、決定された好適度が所定の閾値より高い場合に、時刻が第2時点になったときに画像を撮像するように撮像手段を制御する制御手段と、を有する。【選択図】図4
Description
本発明は、撮像装置およびその制御方法ならびにプログラムに関する。
近年、機械学習を用いた画像予測技術の開発が盛んに行われている。被写体の行動シーンが撮影された大量の映像データを教師データとして学習させた推論モデルに対してカメラの撮影映像を入力することにより、被写体の未来の画像を予測することができる。特許文献1は、車載カメラの撮影画像を学習済みの畳み込みニューラルネットワークに入力し、カメラを備える車両がそのまま走行した場合に、運動物体が出現して衝突する可能性のある危険領域とその特徴を推定する技術を開示している。
ところで、カメラやスマートフォンなどの撮影アシスト機能に、被写体の未来の画像を予測する技術を適用することにより、より使い勝手を向上させた撮影アシスト機能が提供されることが期待されている。例えば、カメラやスマートフォンの撮影アシスト機能により、被写体の変化に応じた好適な撮影タイミングで自動的に撮影が実行されればユーザの使い勝手が向上することが考えられる。特許文献1では、将来の画像を予測する技術を利用しているものの、当該技術を撮影アシスト機能に用いることは考慮していなかった。
本発明は、上記課題に鑑みてなされ、その目的は、現在の画像から予測される好適なタイミングにおいて自動的に撮影することが可能な技術を実現することである。
この課題を解決するため、例えば本発明の撮像装置は以下の構成を備える。すなわち、
撮像手段から出力される第1時点の画像を用いて、前記第1時点より未来の第2時点の画像を予測した予測画像を生成する予測手段と、
前記予測画像について、前記予測画像が記録する画像として適している度合いを示す好適度を決定する決定手段と、
前記決定された好適度が所定の閾値より高い場合に、時刻が前記第2時点になったときに画像を撮像するように前記撮像手段を制御する制御手段と、を有することを特徴とする。
撮像手段から出力される第1時点の画像を用いて、前記第1時点より未来の第2時点の画像を予測した予測画像を生成する予測手段と、
前記予測画像について、前記予測画像が記録する画像として適している度合いを示す好適度を決定する決定手段と、
前記決定された好適度が所定の閾値より高い場合に、時刻が前記第2時点になったときに画像を撮像するように前記撮像手段を制御する制御手段と、を有することを特徴とする。
本発明によれば、現在の画像から予測される好適なタイミングにおいて自動的に撮影することが可能になる。
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
以下では撮像装置の一例として、機械学習モデルを用いて好適なタイミングで自動的に撮影することができるカメラを用いる例を説明する。しかし、本実施形態は、カメラに限らず、機械学習モデルを用いて好適なタイミングで自動的に撮影することが可能な他の任意の機器にも適用可能である。
<カメラの構成>
本実施形態に係る撮像装置の一例としてのカメラ100の機能構成例について、図1を参照して説明する。なお、図1に示す機能ブロックの1つ以上は、ASICやプログラマブルロジックアレイ(PLA)などのハードウェアによって実現されてもよいし、CPUやGPU等のプログラマブルプロセッサがソフトウェアを実行することによって実現されてもよい。また、ソフトウェアとハードウェアの組み合わせによって実現されてもよい。従って、以下の説明において、異なる機能ブロックが動作主体として記載されている場合であっても、同じハードウェアが主体として実現されうる。
本実施形態に係る撮像装置の一例としてのカメラ100の機能構成例について、図1を参照して説明する。なお、図1に示す機能ブロックの1つ以上は、ASICやプログラマブルロジックアレイ(PLA)などのハードウェアによって実現されてもよいし、CPUやGPU等のプログラマブルプロセッサがソフトウェアを実行することによって実現されてもよい。また、ソフトウェアとハードウェアの組み合わせによって実現されてもよい。従って、以下の説明において、異なる機能ブロックが動作主体として記載されている場合であっても、同じハードウェアが主体として実現されうる。
101は、制御部である。制御部101は、例えば1つ以上のCPUなどのプロセッサを含み、ROM102或いは記憶媒体108に格納されるプログラムを読み出して実行することにより、カメラ100全体の動作を制御する。制御部101は更にGPUを含んでもよい。また、制御部101は、撮影予約を行うためのハードウェアタイマ(タイマ機能ともいう)を備える。後述するように、制御部101は、好適決定部110からの出力に基づいて、画像予測部109から出力される予測画像が所定の条件を満たすかを判定したり、予測画像の未来時刻に撮影予約を設定したりする。
102は、ROM(Read Only Memory)であり、例えば不揮発性の半導体メモリで構成される。ROM102は、制御部101によって実行される制御プログラムを格納する。
103は、RAM(Random Access Memory)であり、RAM103は、例えば揮発性の半導体メモリで構成される。RAM103は、制御部101がプログラムを実行するためのワークメモリとして、或いは、各種データの一時格納領域などとして使用される。
104は、撮像部であり、撮像部104は、例えば、撮像レンズ、絞り、シャッター、CMOSセンサ等の撮像素子、およびA/D変換器等で構成される。撮像部104は、撮像レンズを介して入力されるアナログ信号をデジタルデータに変換して画像データを取得する。画像データは、RAM103に格納される。
撮像部104は、カメラが撮影しているライブビュー画像(LV画像ともいう)と記録用の静止画データを生成する。LV画像は、撮影操作中に撮像部104から所定のフレームレートで順次出力され、リアルタイムに表示部106に表示されるYUV形式の画像データである。またLV画像は、画像予測部109にも入力される。記録用の静止画データは、ユーザの撮影指示によって生成される高解像度の画像データであり、記録部107を介して記憶媒体108に記録される。記録用の静止画データは高解像度であるため、例えばJPEG形式に圧縮される。
105は、操作部である。操作部105は、ユーザの操作を受け付け、入力された情報を制御部101に通知する。操作部105は、例えばタッチパネル、ボタン、スイッチ、及び十字キーの少なくともいずれかによって構成されてよい。
106は、表示部である。表示部106は、カメラ100の状態に関する情報や、撮像部104によって生成されるライブビュー画像、記憶媒体108に記録されている画像データなどをユーザに表示する処理部である。表示部106は、例えば液晶パネル或いはLED等によって構成される。
107は、記録部である。記録部107は、記憶媒体108に対するデータの読み書きの制御を行う。記録部107は、記憶媒体108の初期化や、記憶媒体108とRAM103の間のデータ転送を制御する。
108は、記憶媒体である。記憶媒体108は、大容量の記憶領域を備えるデバイスであり、例えばメモリーカード或いはフラッシュメモリ等で構成される。記憶媒体108は、制御部101によって実行される制御プログラムを格納してもよい。
109は、画像予測部である。画像予測部109は、画像予測モデルを構成する。画像予測部109は、当該画像予測モデルの処理を実行するための回路又はプロセッサによって実現されてもよいし、制御部101によって実行される、画像予測モデルの処理のためのソフトウェアによって実現されてもよい。画像予測部109は、画像を入力し、その画像の未来時刻における予測画像を生成する。
画像予測部109の具体的な構成例について、図2(A)を参照して説明する。図2(A)に示すように、画像予測部109は、複数の予測ユニット202が連結された構成を含む。画像予測部109は、画像201が入力されると画像予測モデルの処理を行い、複数の予測画像203を出力する。予測ユニット202は、ある時刻で撮影された入力画像の次の時刻に対応する予測画像を生成して出力する。予測画像は、ある時刻(第1時点)で撮影された画像を用いて、当該時刻の次の時刻のタイミング(第2時点)において被写体や背景がどのように撮影されるかを予測して生成される画像である。また、予測画像が入力された予測ユニット202は、さらに次の時刻の予測画像を生成する。このように画像予測部109は、連結された予測ユニット202の数と同じ数の複数の予測画像を生成する。
図2(B)は、それぞれの予測ユニット202の具体的な構成例を示している。予測ユニット202は、例えばニューラルネットワークによって構成され、入力画像の特徴情報を抽出する畳み込みネットワーク204と、過去の状態を記憶して次の状態を推論する再帰型ニューラルネットワーク205とを含む。畳み込みネットワーク204は、画像認識用のディープラーニング技術として知られるCNN(Convolutional Neural Network)を構成するネットワークと同様であってよい。畳み込みネットワーク204は、フィルタを用いて画像の特徴点を凝縮する畳み込み処理と、重要な特徴点の情報を維持しながら画像データの情報量を縮小するプーリング処理を行うニューラルネットワークである。再帰型ニューラルネットワーク205は、図2(B)に示すように、再帰型ニューラルネットワーク205内の隠れ層(中間層ともいう)において状態記憶のための再帰結合をもつネットワークである。再帰型ニューラルネットワーク205は、再帰結合により時系列変化を伴う特徴を加味することができ、過去の画像に基づいて未来の予測画像を生成する。なお、再帰型ニューラルネットワーク205は、例えば長期記憶に適した再帰型ニューラルネットワークとして知られているLSTM(Long Short-Term Memory)を用いることができる。なお、ある時刻で撮影された画像に基づいて、当該時刻の次の時刻のタイミングにおける予測画像を生成可能な構成であれば、他の構成であってもよい。また、予測ユニット202のニューラルネットワークは、例えば、動画の第1時点の画像を入力画像とし、動画の次の時刻のタイミングである第2時点の画像を正解データとするような学習データを用いて学習させることができる。
110は、好適決定部である。好適決定部110は、画像が入力されると、その画像に対する撮影記録の好適度を決定する。ここで好適度情報とは、入力画像が記録する画像(記録画像ともいう)として適しているかどうかの度合い、すなわちその記録画像がユーザに好まれるかどうかの度合いを示す情報である。好適決定部110は、撮影記録の好適度を決定する処理を実行するための回路又はプロセッサによって実現されてもよいし、制御部101によって実行される、当該好適度の決定処理のためのソフトウェアによって実現されてもよい。図3を参照して、好適決定部110の構成例について説明する。好適決定部110は、上述したCNNを用いて構成されてよい。好適決定部110は、入力される画像301の特徴情報を抽出する畳み込みネットワーク302と、事前に好適度の高い大量の画像を学習データとして使って学習処理が実施された好適度決定ネットワーク303とを含む。畳み込みネットワーク302の構成は、上述した畳み込みネットワーク205と同様である。好適度決定ネットワーク303は、隠れ層に順伝搬型の全結合層を構成するネットワークであり、特徴情報に基づく好適度の分類を行った結果、出力層において好適度情報304を出力する。学習データは、例えば、フィギュアスケートの撮影では、ジャンプの頂点に達して選手の顔が正面を向いている画像に高い好適度を付与したデータ、ジャンプを始めている状態や顔が正面を向いていない画像に、より低い好適度を付与したデータが含まれてよい。学習データは、フィギュアスケートの例に限らず、様々なスポーツや様々な撮影シーンについて高い或いは低い好適度を付与した画像を含んでよい。
例えば、制御部101は、好適決定部110から出力された好適度情報に基づいて、記録画像として好適な予測画像であるかどうかを判定する。また、制御部101は、記録画像として好適であると判定された予測画像の未来時刻に撮影予約を設定する。
111は、上述した各処理部の間でやりとりされる制御信号を接続する内部バスである。
<自動撮影処理の概要>
次に、本実施形態に係る、LV画像が生成されてから自動撮影が行われるまでの処理(単に自動撮影処理ともいう)の概要について説明する。本実施形態に係る自動撮影処理は、一例として、撮影アシスト機能として用いられることが想定される。例えば、フィギュアスケートの撮影に自動撮影処理を適用する場合を考える。今からジャンプを飛ぼうとしている選手をLV映像に含めると、ジャンプの頂点に到達して選手の顔が正面を向いているタイミング、すなわち撮影に好適なタイミングで自動的に撮影を行うことが可能になる。
次に、本実施形態に係る、LV画像が生成されてから自動撮影が行われるまでの処理(単に自動撮影処理ともいう)の概要について説明する。本実施形態に係る自動撮影処理は、一例として、撮影アシスト機能として用いられることが想定される。例えば、フィギュアスケートの撮影に自動撮影処理を適用する場合を考える。今からジャンプを飛ぼうとしている選手をLV映像に含めると、ジャンプの頂点に到達して選手の顔が正面を向いているタイミング、すなわち撮影に好適なタイミングで自動的に撮影を行うことが可能になる。
以下、図4を参照して、自動撮影処理の概要について説明する。撮像部104は、撮像部104が稼働している間に一定の時間間隔でLV画像を生成して、生成したLV画像を表示部106と画像予測部109に送信する。本実施形態では一例として、LV画像は、毎秒20フレーム(50ミリ秒間隔)のスピードで、解像度が800×600であるYUVデータとして生成されるものとする。表示部106は、送信されるLV画像をリアルタイムに表示する。
画像予測部109は、入力されるLV画像に基づいて、複数の未来時刻における予測画像を生成し、生成した予測画像を予測画像バッファ401に格納する。予測画像バッファ401は、RAM103の一部に構成される予測画像を一時的に記憶するメモリ領域である。
なお、本実施形態における画像予測部109は、一例として20個の予測ユニット202で構成されるものとする。画像予測部109は、50ミリ秒間隔で入力されるLV画像を使って、最大1秒後(50ミリ秒×20)までの予測画像を生成する。例えば、画像予測部109が生成する予測画像と時刻の関係は、図5に示すようになる。
画像予測部109は、時刻t0において、LV画像ft0を使った画像予測を実行し、未来時刻t1~t20に対応する予測画像ft1~ft20を生成する。続いて50ミリ秒後の次の時刻t1では、画像予測部109は、LV画像ft1を使った画像予測を実行し、未来時刻t2~t21に対応する予測画像ft2~ft21を生成する。以降の時刻t2、t3も同様に、20個の予測画像が生成される。
次に、制御部101は、予測画像バッファ401に格納された予測画像を好適決定部110に入力し、好適決定部110から好適度情報を取得する。制御部101は、好適決定部110から取得した好適度情報に基づいて、対応する予測画像に対して撮影記録を実行すべきかどうかを判定し、実行すべきであると判定した場合には、対応する未来時刻にあわせて撮影予約を設定する。具体的には、制御部101は、対応する未来時刻にあわせて撮像部104による撮影記録を実行するようにタイマ機能を実行し、撮影予約の対象の予測画像と好適度情報を撮影予約管理テーブルに記録する。撮影予約管理テーブルは、例えば、記憶媒体108に記憶され、図6に示すテーブルのように構成される。図6に示すIDは、それぞれの撮影予約を識別するための番号であり、撮影の実行順にも相当してもよい。図6に示す予測画像IDは、撮影予約の対象となる予測画像を識別する情報であり、例えば、対応する時刻情報が分かるように表現される。時刻情報は、LV画像からの相対的な時刻でも良いし、絶対的な時刻であってもよい。図6に示す好適度は、撮影予約の対象である予測画像の好適度を示す情報であり、例えば100段階のパーセント(%)で示される。好適度は、記録画像として適しているかどうかの度合いを示すものであれば、例えば0から1までの小数値など他の数値であってもよい。図6に示す例では、3つの撮影予約が設定されている状態を示す。
なお、上述した画像予測から撮影予約までの一連の処理は、LV画像の生成周期(例えば50ミリ秒)の時間内に終了するようにリアルタイム性を保証しながら実行される。
<自動撮影処理に係る一連の動作>
次に、図7を参照して、自動撮影処理に係る一連の動作について説明する。なお、本処理は、特に明示する場合を除き、制御部101がROM102或いは記憶媒体108に記憶されたプログラムをRAM103の作業用領域に展開、実行することにより実現される。また、本処理は、画像予測部109及び好適決定部110における機械学習モデル(ニューラルネットワーク)が学習済みの状態で実行される。更に、本処理は、例えば操作部105に対するユーザ操作により、カメラ100の動作モードが撮影モードに遷移した時点で開始される。ここで撮影モードは、カメラ100の動作モードの1つであり、ユーザが撮影記録ボタンを押すことによっていつでも静止画を撮影できる動作モードである。例えば、撮像機能を稼働せず、メモリーカードに記録された静止画を液晶モニタで再生表示させるような動作モードは、これに該当しない。
次に、図7を参照して、自動撮影処理に係る一連の動作について説明する。なお、本処理は、特に明示する場合を除き、制御部101がROM102或いは記憶媒体108に記憶されたプログラムをRAM103の作業用領域に展開、実行することにより実現される。また、本処理は、画像予測部109及び好適決定部110における機械学習モデル(ニューラルネットワーク)が学習済みの状態で実行される。更に、本処理は、例えば操作部105に対するユーザ操作により、カメラ100の動作モードが撮影モードに遷移した時点で開始される。ここで撮影モードは、カメラ100の動作モードの1つであり、ユーザが撮影記録ボタンを押すことによっていつでも静止画を撮影できる動作モードである。例えば、撮像機能を稼働せず、メモリーカードに記録された静止画を液晶モニタで再生表示させるような動作モードは、これに該当しない。
S701において、撮像部104は、LV画像を1フレーム生成して、画像予測部109に出力する。S702において、画像予測部109は、撮像部104から出力されたLV画像に基づいて複数の未来時刻に対応する予測画像を生成し、生成した予測画像を予測画像バッファ401に格納する。画像予測部109は生成した画像を画像バッファ401に格納すると、制御部101に通知する。S703において、制御部101は、予測画像バッファ401から予測画像を1つ取り出して好適決定部110に入力し、好適決定部110から対応する好適度情報を取得する。
S704において、制御部101は、好適決定部110から取得した好適度情報を用いて、撮影予約を実行すべきかを判定する。例えば、制御部101は、好適度が所定の閾値より大きい場合、対応する予測画像の撮影予約を実行すべきであると判定する。所定の閾値は、例えば70%などでよい。制御部101は、好適度が所定の閾値より大きい場合、撮影予約を実行すべきと判定してS705に進み、好適度が所定の閾値以下である場合、撮影予約を実行すべきでないと判定してS711に進む。
S705において、制御部101は、予約すべきと判定した未来時刻の近い時刻に、他の撮影予約が存在するかを判定する。例えば、制御部101は、記憶媒体108の撮影予約管理テーブルを参照して、S704にて予約すべきと判定した未来時刻に近い時刻に、既に他の撮影予約が設定されているかどうかを判定する。制御部101は、撮影予約が設定されていると判定した場合はS709に進み、撮影予約が設定されていないと判定した場合はS706に進む。ここで、近い時刻に既に他の撮影予約が設定されている状態とは、互いの時間間隔が所定の時間範囲より狭く、例えば画像一枚あたりの撮影記録処理に要する時間よりも短いために、両方の撮影予約を有効にすることができない状態を意味する。本実施形態では、一例として、画像一枚あたりの撮影記録処理に要する時間を200ミリ秒とする。この場合、近い時刻に他の撮影予約が設定されているかどうかの判定は、前後200ミリ秒に他の撮影予約が含まれるかどうかの判定となる。このように、撮影予約の重複を判定することにより、現に実行することが難しい撮影予約を設定してしまうことを回避することができる。
S706において、制御部101は、S704において予約すべきと判定された撮影予約を設定する。具体的には、対応する未来時刻にあわせて撮像部104による撮影記録を実行するようにタイマ機能を実行するとともに、撮影予約を行う予測画像と好適度の情報を、記憶媒体108の撮影予約管理テーブルに追加する。また、本ステップにおいて、制御部101は、撮像部104による被写体の捕捉が継続するようにユーザに注意を促すため、カメラ100に撮影予約が設定されたこと(自動撮影を行っていること)を通知する情報を表示部106に表示する。例えば、自動撮影中であることを示す画面は、図8に示す画面801であってよい。801が画面全体であり、802は本ステップによって表示される通知情報である。通知情報802は、例えば、撮影予約が設定されたこと(自動撮影を行っていること)を示す情報と、自動撮影の期間及び自動的に撮影される画像の数を示す情報とを含む。通知情報802は、撮影予約管理テーブルの情報を用いて構成されてもよい。図8に示す通知情報802は、テキストで情報が表示される例を示しているが、テキストに限らずアイコンで示されてもよいし、通知情報が音声によって通知されてもよい。
S707において、制御部101は、S702において予測画像バッファ401に格納された予測画像の全てが、S703によって取り出されたかどうかを判定する。制御部101は、予測画像バッファ401に格納された予測画像がすべて取り出されたと判定した場合、S708に進み、全て取り出されていないと判定した場合は再びS703に戻る。
S708において、制御部101は、ユーザによってカメラ100の動作モードが撮影モードから他のモードに変更されたかどうかを判定する。他のモードに変更された場合は、本フローチャートを終了する。撮影モードのまま継続されている場合は、再びS701に戻る。
S709において、制御部101は、近い時刻に撮影予約が存在した場合の処理を行う。具体的には、制御部101は、撮影予約管理テーブルを参照し、S704にて予約すべきと判定された予測画像の好適度が、S705にて近い時刻に撮影予約済みであることが検出された予測画像の好適度よりも高いかどうかを判定する。制御部101は、予約すべきと判定された新規の予測画像の好適度が、設定済みの予測画像の好適度より高いと判定した場合はS710に進み、そうでない場合は、S704にて予約すべきと判定された撮影予約の処理を中断し、S707に進む。
S710において、制御部101は、S705にて検出された、設定済みの撮影予約を解除し、S704にて予約すべきと判定された撮影予約を新規に設定する。ここで、制御部101は、撮影予約を解除するために、対応するタイマ機能を停止すると共に、撮影予約管理テーブルからの対応する予約情報を削除する。撮影予約の設定処理の内容は、S706において説明した撮影予約の設定処理の内容と同様である。このように、近接する予測画像が存在する場合、より好適度の高い予測画像の撮影予約を優先することで、よりユーザにとって有益な画像を自動撮影によって取得することができる。
S711において、制御部101は、S704において撮影予約を実行すべきでないと判定された未来時刻と同じ時刻に、既に撮影予約が設定されているかどうかを判定する。制御部101は、記憶媒体108の撮影予約管理テーブルを参照して、S704において判定された未来時刻と同じ時刻に、既に撮影予約が設定されていると判定した場合はS712に進み、そうでない場合にはS707に進む。
S712において、制御部101は、S711において検出した、既に設定されている撮影予約を解除する。撮影予約の解除処理の内容は、S710において説明した撮影予約の解除処理の内容と同様である。このとき、本ステップにおいて制御部101は、撮影予約を解除したことに伴い、S706において開始した通知情報の表示を更新する。或いは、撮影予約が解除されたことを通知する情報を表示部106に表示してもよい。撮影予約が無くなった場合(全ての撮影予約を解除した場合)、S706において開始した通知情報の表示を消去してもよい。S711及びS712により、以前のLV画像の画像予測では撮影記録に好適であると判定されていた未来時刻であったが、その後のLV画像の画像予測において好適ではないと判定された場合に、既存の撮影予約を解除することができる。その後、制御部101は、上述のようにS707及びS708を実行して、自動撮影処理の一連の動作を終了する。
なお、上述の実施形態では、例えばカメラ100内に構成される好適決定部110の数が1つである場合を例に説明した。しかし、好適決定部110の数はこの限りではなく、カメラ100は、複数の好適決定部110を制御可能に構成されてもよい。複数の好適決定部110を構成することによってシステム構成の規模は大きくなるものの、複数の予測画像に対する好適判定処理を同時並行で実行することが可能になり、全体の処理時間を短縮することが可能となる。なお、この方法を用いることで、画像予測部109から出力される予測画像の数を増やすことが可能となる。これにより、より遠い未来時刻の画像予測を実行することができるようになる。
また、上述の実施形態では、画像予測部109及び好適決定部110がニューラルネットワークによって構成される場合を例に説明した。計算量が多いニューラルネットワークを備える画像予測部109や好適決定部110を用いる場合に、処理負荷を下げるための仕組みを更に実施するようにしてもよい。例えば、制御部101によって1つの撮影予約が設定された後は、制御部101は、その撮影予約による撮影記録が実行されるまで、あるいは、その撮影予約が解除されるまで、新規の撮影予約を設定しないようにしてもよい。そして、制御部101は、既に設定された撮影予約の時刻の調整だけを実施するようにしてもよい。例えば、制御部101は、好適決定部110による好適度の判定処理を、画像予測部109が生成する全ての予測画像に対して実行するのではなく、撮影予約の時刻に近い時刻の予測画像に対してのみ実行すればよい。ここで撮影予約の時刻に近い時刻とは、例えば撮影予約の時刻の前後300ミリ秒に含まれる時刻であってよい。このように、撮影予約の対象となる時刻を制限することにより、好適決定部110の処理負荷の軽減や、それに伴うカメラ100全体の消費電力の低減が可能となる。
以上説明したように、本実施形態では、撮像部104から出力される第1時点の画像を用いて、第1時点より未来の第2時点の画像を予測した予測画像を生成する。そして、生成した予測画像について好適度(予測画像が記録する画像として適している度合い)を決定し、決定した好適度が所定の閾値より高い場合に、時刻が第2時点になったときに画像を撮像するようにした。これにより、現在の画像から予測される好適なタイミングにおいて自動的に撮影することが可能になる。換言すれば、画像予測モデルを用いて、現在のLV画像から撮影に好適な未来の画像を予測して自動的に撮影するシステムを実現することが可能となる。また、本実施形態では、未来時刻に撮影予約を設定した後、その後生成されるLV画像によってその時刻の撮影が好適でないと判定された場合は、撮影予約を解除するようにした。このようにすることで、一度撮影予約を設定した未来時刻を、LV画像生成の度に、つまり設定した未来時刻が現在時刻に近づくにつれて、正しい撮影タイミングとなるように調整することが可能となる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
101…制御部、104…撮像部、105…操作部、106…表示部、108…記憶媒体、109…画像予測部、110…好適決定部
Claims (16)
- 撮像手段から出力される第1時点の画像を用いて、前記第1時点より未来の第2時点の画像を予測した予測画像を生成する予測手段と、
前記予測画像について、前記予測画像が記録する画像として適している度合いを示す好適度を決定する決定手段と、
前記決定された好適度が所定の閾値より高い場合に、時刻が前記第2時点になったときに画像を撮像するように前記撮像手段を制御する制御手段と、を有することを特徴とする撮像装置。 - 前記予測手段は、前記第1時点の画像に基づいて前記第1時点より未来の時点に対応する前記予測画像を生成する機械学習モデルにより構成される、ことを特徴とする請求項1に記載の撮像装置。
- 前記決定手段は、入力される画像についての前記好適度を決定する機械学習モデルにより構成される、ことを特徴とする請求項1又は2に記載の撮像装置。
- 前記第1時点の画像は、前記撮像手段から順次出力されるライブビュー画像である、ことを特徴とする請求項1から3のいずれか1項に記載の撮像装置。
- 前記制御手段は、前記決定された好適度が前記所定の閾値より高い場合に、時刻が前記第2時点になったときに画像を撮像するための撮影予約を設定する、ことを特徴とする請求項1から4のいずれか1項に記載の撮像装置。
- 前記制御手段は、前記撮影予約を設定したことに応じて、前記撮影予約が設定されたことを通知する情報を表示手段に表示させる、ことを特徴とする請求項5に記載の撮像装置。
- 前記制御手段は、前記第1時点の画像に基づいて前記第2時点の画像を撮像するための第1撮影予約を設定した後に、前記第1時点より後である第3時点の画像を用いて生成された前記予測画像の前記好適度が、前記第1時点の画像を用いて生成された前記予測画像の前記好適度よりも高いかを判定する、ことを特徴とする請求項5又は6に記載の撮像装置。
- 前記制御手段は、前記第3時点の画像を用いて生成された前記予測画像の前記好適度が、前記第1時点の画像を用いて生成された前記予測画像の前記好適度よりも高い場合、前記第1撮影予約を解除して、前記第3時点の画像に基づく第2撮影予約を設定する、ことを特徴とする請求項7に記載の撮像装置。
- 前記制御手段は、前記第1時点の画像に基づいて前記第2時点の画像を撮像するための第1撮影予約を設定した後に、前記第1時点より後である第3時点の画像を用いて生成された、前記第2時点又は前記第2時点から所定の時間範囲の前記予測画像の前記好適度が前記所定の閾値以下である場合、前記第1撮影予約を解除する、ことを特徴とする請求項5又は6に記載の撮像装置。
- 前記制御手段は、前記第1撮影予約を解除したことに応じて、撮影予約が解除されたことを通知する情報を表示手段に表示させる、又は、前記撮影予約が設定されたことを通知する前記情報を変更する、ことを特徴とする請求項8又は9に記載の撮像装置。
- 前記所定の時間範囲は、前記撮像手段から画像が出力されて記憶媒体に記録されるのに要する時間である、ことを特徴とする請求項9に記載の撮像装置。
- 前記予測手段は、前記第1時点よりも未来の複数の時点の予測画像を出力し、
前記制御手段は、前記複数の時点の予測画像について決定された前記好適度のうち、前記好適度が前記所定の閾値より高い予測画像の時点になったときに画像を撮像するように前記撮像手段を制御する、ことを特徴とする請求項5から11のいずれか1項に記載の撮像装置。 - 前記決定手段は、前記撮影予約を設定したことに応じて、前記複数の時点の予測画像のうち、前記撮影予約を設定した時点から所定の時間範囲の時点の前記予測画像についてのみ、前記好適度を決定する、ことを特徴とする請求項12に記載の撮像装置。
- 前記第2時点になったときに撮像された画像を記憶媒体に記録する記録手段を更に有する、ことを特徴とする請求項1から13のいずれか1項に記載の撮像装置。
- 撮像手段から出力される第1時点の画像を用いて、前記第1時点より未来の第2時点の画像を予測した予測画像を生成する予測工程と、
前記予測画像について、前記予測画像が記録する画像として適している度合いを示す好適度を決定する決定工程と、
前記決定された好適度が所定の閾値より高い場合に、時刻が前記第2時点になったときに画像を撮像するように前記撮像手段を制御する制御工程と、を有することを特徴とする撮像装置の制御方法。 - コンピュータを、請求項1から14のいずれか1項に記載の撮像装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021081834A JP2022175451A (ja) | 2021-05-13 | 2021-05-13 | 撮像装置およびその制御方法ならびにプログラム |
US17/739,521 US11689800B2 (en) | 2021-05-13 | 2022-05-09 | Image capturing apparatus and method of controlling the same, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021081834A JP2022175451A (ja) | 2021-05-13 | 2021-05-13 | 撮像装置およびその制御方法ならびにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022175451A true JP2022175451A (ja) | 2022-11-25 |
Family
ID=83999070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021081834A Pending JP2022175451A (ja) | 2021-05-13 | 2021-05-13 | 撮像装置およびその制御方法ならびにプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11689800B2 (ja) |
JP (1) | JP2022175451A (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102234709B1 (ko) * | 2014-09-15 | 2021-04-01 | 엘지전자 주식회사 | 이동 단말기 및 그것의 제어방법 |
JP2017162438A (ja) | 2016-03-11 | 2017-09-14 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 危険予測方法 |
US11122198B2 (en) * | 2020-01-07 | 2021-09-14 | International Business Machines Corporation | Adjusting image capture parameters via machine learning |
-
2021
- 2021-05-13 JP JP2021081834A patent/JP2022175451A/ja active Pending
-
2022
- 2022-05-09 US US17/739,521 patent/US11689800B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11689800B2 (en) | 2023-06-27 |
US20220368827A1 (en) | 2022-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104754274B (zh) | 图像再现装置及其控制方法 | |
JP4498104B2 (ja) | 監視装置、その制御方法、およびプログラム | |
US20080291285A1 (en) | Image processing apparatus for calculating global motion vector of plurality of image frames | |
JP2012044415A (ja) | 撮像装置及びその制御方法、並びにプログラム | |
CN101931753A (zh) | 目标跟踪和图像跟踪设备、操作控制方法及数字摄像机 | |
JP4798259B2 (ja) | 被写体追尾装置、およびカメラ | |
US11394870B2 (en) | Main subject determining apparatus, image capturing apparatus, main subject determining method, and storage medium | |
JP2010041435A (ja) | 撮像装置及びその制御方法 | |
JP7366722B2 (ja) | 電子機器、制御装置、制御方法、および、制御プログラム | |
JP6520975B2 (ja) | 動画像処理装置、動画像処理方法及びプログラム | |
KR20150026123A (ko) | 디지털 영상 처리 방법 및 디지털 영상 처리 장치 | |
JP2021005846A (ja) | 積層型撮像デバイス、撮像装置、撮像方法、学習方法及び画像読み出し回路 | |
CN101834987A (zh) | 数字运动画面拍摄设备及控制方法和确定对象运动的方法 | |
CN103747182B (zh) | 一种智能手机拍摄控制方法 | |
JP2022175451A (ja) | 撮像装置およびその制御方法ならびにプログラム | |
US11659275B2 (en) | Information processing apparatus that performs arithmetic processing of neural network, and image pickup apparatus, control method, and storage medium | |
JP2021061546A (ja) | 撮像装置、撮像装置の制御方法、及びプログラム | |
JP2019191661A (ja) | 画像処理装置、撮像装置、画像処理方法、及びプログラム | |
CN105611119B (zh) | 图像处理装置以及图像处理方法 | |
JP5016999B2 (ja) | 撮像装置、撮像方法、及びプログラム | |
JP7444604B2 (ja) | 画像処理装置及び方法、及び撮像装置 | |
CN110336943A (zh) | 一种场景识别方法和装置 | |
WO2023063167A1 (ja) | 撮像システム、撮像装置、情報処理サーバー、撮像方法、情報処理方法、及び記憶媒体 | |
US20240078830A1 (en) | Image processing apparatus and image processing method | |
JP2023110541A (ja) | 撮像システム、撮像装置、情報処理サーバー、撮像方法、情報処理方法、及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240507 |