WO2019065454A1

WO2019065454A1 - 撮像装置およびその制御方法

Info

Publication number: WO2019065454A1
Application number: PCT/JP2018/034818
Authority: WO
Inventors: 伸茂若松; 新之介大澤; 小川　良太; 佑樹筑比地; 佑輔清水
Original assignee: キヤノン株式会社
Priority date: 2017-09-28
Filing date: 2018-09-20
Publication date: 2019-04-04
Also published as: GB2603295B; GB2603295A; GB2604029B; CN114019744A; KR102475999B1; GB202005228D0; GB2581621A; KR20220079695A; GB2581621B; RU2021100640A3; RU2762998C2; RU2021100640A; GB2604029A; US20230362472A1

Abstract

撮影画像に関するデータに基づいて、撮影処理を変更する撮像装置であって、前記撮影処理を変更する際、自動で処理された撮影画像におけるデータよりも、ユーザによる指示がなされた撮影画像におけるデータの重みづけを大きくして変更をすることを特徴とする。

Description

撮像装置およびその制御方法

　本発明は、撮像装置およびその制御方法に関する。

　カメラ等の撮像装置による静止画・動画撮影においては、ユーザがファインダー等を通して撮影対象を決定し、撮影状況を自ら確認して撮影画像のフレーミングを調整することによって、画像を撮影するのが通常である。このような撮像装置では、ユーザの操作ミスを検知してユーザに通知したり、外部環境の検知を行い、撮影に適していない場合にユーザに通知したりする機能が備えられている。また、撮影に適した状態になるようにカメラを制御する仕組みが従来から存在している。

　このようなユーザの操作により撮影を実行する撮像装置に対し、ユーザが撮影指示を与えることなく定期的および継続的に撮影を行うライフログカメラが存在する（特表２０１６－５３６８６８号公報）。ライフログカメラは、ストラップ等でユーザの身体に装着された状態で用いられ、ユーザが日常生活で目にする光景を一定時間間隔で映像として記録するものである。ライフログカメラによる撮影は、ユーザがシャッターを切るなどの意図したタイミングで撮影するのではなく、一定の時間間隔で撮影を行うため、普段撮影しないような不意な瞬間を映像として残すことができる。

　しかしながら、ライフログカメラをユーザが身に着けた状態において、定期的に自動撮影を行った場合、ユーザの好みでない映像が取得され、本当に得たい瞬間の映像を取得できない場合があった。

　本発明は上述した課題に鑑みてなされたものであり、その目的は、ユーザが特別な操作を行うことなく、ユーザの好みの映像を取得することが可能な撮像装置を提供することである。

　本発明の技術的特徴として、撮像装置の制御方法であって、撮影ユニットにより撮影された撮影画像に関する第１のデータに基づいて、前記撮像装置の処理を変更する変更ステップを有し、前記変更ステップでは、前記撮像装置の処理を変更する際、自動で処理された撮影画像における前記第１のデータよりも、ユーザによる指示がなされた撮影画像における前記第１のデータの重みづけを大きくすることを特徴とする。

撮像装置を模式的に示す図である。ピッチ方向、ヨー方向、ロール方向を説明する図である。撮像装置の構成を示す図である。撮像装置と外部機器との構成を示す図である。外部機器の構成を示す図である。撮像装置と外部機器との構成を示す図である。外部機器の構成を示す図である。第１制御部を説明するフローチャートである。第２制御部を説明するフローチャートである。撮影モード処理を説明するフローチャートである。自動編集モード判定を説明するフローチャートである。自動編集処理を説明するフローチャートである。ニューラルネットワークを説明する図である。撮像装置の位置を中心として、全周囲でエリア分割を行う例（チルト方向、パン方向それぞれ２２．５度の場合）を説明するための図である。撮像装置の位置を中心として、全周囲でエリア分割を行う例（チルト角度が４５度以上の場合）を説明するための図である。撮影画角内でのエリア分割された例を説明するための図である。撮像されている画像の画角エリアの画像例を説明するための図である。学習モード判定を説明するフローチャートである。学習処理を説明するフローチャートである。本実施形態に係る表示処理を説明する図である。鏡筒回転駆動部の構成を示す図である。画像上の被写体の目標位置と実位置を説明する図である。撮影方向変更操作検出を説明するフローチャートである。撮影方向変更操作検出を模式的に示す図である。時間ｔａのタイミングで撮像した画像を示す図である。時間ｔｂのタイミングでユーザが固定部１０３に対して鏡筒１０２を右方向に回転させたときに撮像した画像を示す図である。時間ｔｃで補償器１７０２の制御出力をＯＦＦした状態でユーザの撮影方向変更操作によって新しい被写体の近くまでパン軸を回転させて目標となる被写体が画角に入ったときの画像を示す図である。時間ｔ４のタイミングで補償器１７０２の制御出力をＯＮした状態で撮影方向変更後の新しい被写体を追尾し、撮像した画像を示す図である。撮影方向変更操作パンの制御出力２２０１、位置偏差２２０２、移動速度２２０３の時間変化を示した図である。ユーザ操作により撮像装置の撮影方向を変更した際の装置揺れ検出部２０９の加速度センサの出力変化を示す図である。音声手動撮影判定処理を説明するフローチャートである。音方向検出値をヒストグラム処理した結果を示す図である。スマートデバイス３０１に被写体が登録されたことを通知することを説明する図である。タップ検出によるウェイクアップの場合の自動撮影処理を説明するフローチャートである。音検出によるウェイクアップの場合の自動撮影処理を説明するフローチャートである。ファイル自動削除モードの処理を説明するフローチャートである。手持ち操作アタッチメントの例を示したものである。ユーザが任意の被写体５０１１に撮像装置を向けて撮影するシーンを説明する図である。撮像装置１０１とは別のカメラ３２０１のアクセサリーシュー３２０２に機械的に取り付け可能な構成の例を示したものである。撮像装置１０１と別のカメラ３２０１とが接続した場合の撮像装置１０１の処理を説明するフローチャートである。

　〔第１の実施形態〕
　＜撮像装置の構成＞
　図１は、第１の実施形態の撮像装置を模式的に示す図である。

　図１Ａに示す撮像装置１０１は、電源スイッチの操作を行うことができる操作部材（以後、電源ボタンというが、タッチパネルへのタップやフリック、スワイプなどの操作でもよい）などが設けられている。撮像を行う撮影レンズ群や撮像素子を含む筐体である鏡筒１０２は、撮像装置１０１に取り付けられ、鏡筒１０２を固定部１０３に対して回転駆動できる回転機構を設けている。チルト回転ユニット１０４は、鏡筒１０２を図１Ｂに示すピッチ方向に回転できるモーター駆動機構であり、パン回転ユニット１０５は、鏡筒１０２をヨー方向に回転できるモーター駆動機構である。よって、鏡筒１０２は、１軸以上の方向に回転可能である。なお、図１Ｂは、固定部１０３位置での軸定義である。角速度計１０６と加速度計１０７はともに、撮像装置１０１の固定部１０３に実装されている。そして、角速度計１０６や加速度計１０７に基づいて、撮像装置１０１の振動を検出し、チルト回転ユニットとパン回転ユニットを検出した揺れ角度に基づいて回転駆動する。これにより、可動部である鏡筒１０２の振れを補正したり、傾きを補正したりする構成となっている。

　図２は、本実施形態の撮像装置の構成を示すブロック図である。

　図２において、第１制御部２２３は、プロセッサ（例えば、ＣＰＵ、ＧＰＵ、マイクロプロセッサ、ＭＰＵなど）、メモリ（例えば、ＤＲＡＭ、ＳＲＡＭなど）からなる。これらは、各種処理を実行して撮像装置１０１の各ブロックを制御したり、各ブロック間でのデータ転送を制御したりする。不揮発性メモリ（ＥＥＰＲＯＭ）２１６は、電気的に消去・記録可能なメモリであり、第１制御部２２３の動作用の定数、プログラム等が記憶される。

　図２において、ズームユニット２０１は、変倍を行うズームレンズを含む。ズーム駆動制御部２０２は、ズームユニット２０１を駆動制御する。フォーカスユニット２０３は、ピント調整を行うレンズを含む。フォーカス駆動制御部２０４は、フォーカスユニット２０３を駆動制御する。

　撮像部２０６では、撮像素子が各レンズ群を通して入射する光を受け、その光量に応じた電荷の情報をアナログ画像データとして画像処理部２０７に出力する。画像処理部２０７はＡ／Ｄ変換により出力されたデジタル画像データに対して、歪曲補正やホワイトバランス調整や色補間処理等の画像処理を適用し、適用後のデジタル画像データを出力する。画像処理部２０７から出力されたデジタル画像データは、画像記録部２０８でＪＰＥＧ形式等の記録用フォーマットに変換し、メモリ２１５や後述する映像出力部２１７に送信される。

　鏡筒回転駆動部２０５は、チルト回転ユニット１０４、パン回転ユニット１０５を駆動して鏡筒１０２をチルト方向とパン方向に駆動させる。

　装置揺れ検出部２０９は、例えば撮像装置１０１の３軸方向の角速度を検出する角速度計（ジャイロセンサ）１０６や、装置の３軸方向の加速度を検出する加速度計（加速度センサ）１０７が搭載される。装置揺れ検出部２０９は、検出された信号に基づいて、装置の回転角度や装置のシフト量などが演算される。

　音声入力部２１３は、撮像装置１０１に設けられたマイクから撮像装置１０１周辺の音声信号を取得し、アナログデジタル変換をして音声処理部２１４に送信する。音声処理部２１４は、入力されたデジタル音声信号の適正化処理等の音声に関する処理を行う。そして、音声処理部２１４で処理された音声信号は、第１制御部２２３によりメモリ２１５に送信される。メモリ２１５は、画像処理部２０７、音声処理部２１４により得られた画像信号及び音声信号を一時的に記憶する。

　画像処理部２０７及び音声処理部２１４は、メモリ２１５に一時的に記憶された画像信号や音声信号を読み出して画像信号の符号化、音声信号の符号化などを行い、圧縮画像信号、圧縮音声信号を生成する。第１制御部２２３は、これらの圧縮画像信号、圧縮音声信号を、記録再生部２２０に送信する。

　記録再生部２２０は、記録媒体２２１に対して画像処理部２０７及び音声処理部２１４で生成された圧縮画像信号、圧縮音声信号、その他撮影に関する制御データ等を記録する。また、音声信号を圧縮符号化しない場合には、第１制御部２２３は、音声処理部２１４により生成された音声信号と画像処理部２０７により生成された圧縮画像信号とを、記録再生部２２０に送信し記録媒体２２１に記録させる。

　記録媒体２２１は、撮像装置１０１に内蔵された記録媒体でも、取外し可能な記録媒体でもよい。記録媒体２２１は、撮像装置１０１で生成した圧縮画像信号、圧縮音声信号、音声信号などの各種データを記録することができ、不揮発性メモリ２１６よりも大容量な媒体が一般的に使用される。例えば、記録媒体２２１は、ハードディスク、光ディスク、光磁気ディスク、ＣＤ－Ｒ、ＤＶＤ－Ｒ、磁気テープ、不揮発性の半導体メモリ、フラッシュメモリ、などのあらゆる方式の記録媒体を含む。

　記録再生部２２０は、記録媒体２２１に記録された圧縮画像信号、圧縮音声信号、音声信号、各種データ、プログラムを読み出す（再生する）。そして読み出した圧縮画像信号、圧縮音声信号を、第１制御部２２３は画像処理部２０７及び音声処理部２１４に送信する。画像処理部２０７及び音声処理部２１４は、圧縮画像信号、圧縮音声信号を一時的にメモリ２１５に記憶させ、所定の手順で復号し、復号した信号を映像出力部２１７、音声出力部２１８に送信する。

　音声入力部２１３は複数のマイクが撮像装置１０１に搭載されており、音声処理部２１４は複数のマイクが設置された平面上の音の方向を検出することができ、後述する探索や自動撮影に用いられる。さらに、音声処理部２１４では、特定の音声コマンドを検出する。音声コマンドは事前に登録されたいくつかのコマンドの他、ユーザが特定音声を撮像装置に登録できる構成にしてもよい。また、音シーン認識も行う。音シーン認識では、予め大量の音声データを基に機械学習により学習させたネットワークにより音シーン判定を行う。例えば、「歓声が上がっている」、「拍手している」、「声を発している」などの特定シーンを検出するためのネットワークが音声処理部２１４に設定されている。そして、特定音シーンや特定音声コマンドを検出すると、第１制御部２２３や第２制御部２１１に、検出トリガ信号を出力する構成になっている。

　撮像装置１０１のメインシステム全体を制御する第１制御部２２３とは別に設けられた、第２制御部２１１が第１制御部２２３の供給電源を制御する。

　第１電源部２１０と第２電源部２１２は、第１制御部２２３と第２制御部２１１を動作させるための、電源をそれぞれ供給する。撮像装置１０１に設けられた電源ボタンの押下により、まず第１制御部２２３と第２制御部２１１の両方に電源が供給されるが、後述するように、第１制御部２２３は、第１電源部２１０へ自らの電源供給をＯＦＦするように制御される。第１制御部２２３が動作していない間も、第２制御部２１１は動作しており、装置揺れ検出部２０９や音声処理部２１４からの情報が入力される。第２制御部は各種入力情報を基にして、第１制御部２２３を起動するか否かの判定処理を行い、起動判定されると第１電源部に電源供給指示をする構成になっている。

　音声出力部２１８は、例えば撮影時などに撮像装置１０１に内蔵されたスピーカーから予め設定された音声パターンを出力する。

　ＬＥＤ制御部２２４は、例えば撮影時などに撮像装置１０１に設けられたＬＥＤを予め設定された点灯点滅パターンを制御する。

　映像出力部２１７は、例えば映像出力端子からなり、接続された外部ディスプレイ等に映像を表示させるために画像信号を送信する。また、音声出力部２１８、映像出力部２１７は、結合された１つの端子、例えばＨＤＭＩ（登録商標）（Ｈｉｇｈ－Ｄｅｆｉｎｉｔｉｏｎ　Ｍｕｌｔｉｍｅｄｉａ　Ｉｎｔｅｒｆａｃｅ）端子のような端子であってもよい。

　通信部２２２は、撮像装置１０１と外部装置との間で通信を行うもので、例えば、音声信号、画像信号、圧縮音声信号、圧縮画像信号などのデータを送信したり受信したりする。また、撮影開始や終了コマンド、パン・チルトやズーム駆動等の、撮影にかかわる制御信号を受信して、撮像装置１０１と相互通信可能な外部機器の指示から撮像装置１０１を駆動する。また、撮像装置１０１と外部装置との間で、後述する学習処理部２１９で処理される学習にかかわる各種パラメータなどの情報を送信したり受信したりする。通信部２２２は、例えば、赤外線通信モジュール、Ｂｌｕｅｔｏｏｔｈ（登録商標）通信モジュール、無線ＬＡＮ通信モジュール、ＷｉｒｅｌｅｓｓＵＳＢ、ＧＰＳ受信機等の無線通信モジュールである。

　＜外部通信機器との構成＞
　図３は、撮像装置１０１と外部装置３０１との無線通信システムの構成例を示す図である。撮像装置１０１は撮影機能を有するデジタルカメラであり、外部装置３０１はＢｌｕｅｔｏｏｔｈ通信モジュール、無線ＬＡＮ通信モジュールを含むスマートデバイスである。

　撮像装置１０１とスマートデバイス３０１は、例えばＩＥＥＥ８０２．１１規格シリーズに準拠した無線ＬＡＮによる通信３０２と、例えばＢｌｕｅｔｏｏｔｈ　Ｌｏｗ　Ｅｎｅｒｇｙ（以下、「ＢＬＥ」と呼ぶ）などの、制御局と従属局などの主従関係を有する通信３０３とによって通信可能である。なお、無線ＬＡＮ及びＢＬＥは通信手法の一例であり、各通信装置は、２つ以上の通信機能を有し、例えば制御局と従属局との関係の中で通信を行う一方の通信機能によって、他方の通信機能の制御を行うことが可能であれば、他の通信手法が用いられてもよい。ただし、一般性を失うことなく、無線ＬＡＮなどの第１の通信は、ＢＬＥなどの第２の通信より高速な通信が可能であり、また、第２の通信は、第１の通信よりも消費電力が少ないか通信可能距離が短いかの少なくともいずれかであるものとする。

　スマートデバイス３０１の構成を、図４を用いて説明する。

　スマートデバイス３０１は、例えば、無線ＬＡＮ用の無線ＬＡＮ制御部４０１、及び、ＢＬＥ用のＢＬＥ制御部４０２に加え、公衆無線通信用の公衆回線制御部４０６を有する。また、スマートデバイス３０１は、パケット送受信部４０３をさらに有する。無線ＬＡＮ制御部４０１は、無線ＬＡＮのＲＦ制御、通信処理、ＩＥＥＥ８０２．１１規格シリーズに準拠した無線ＬＡＮによる通信の各種制御を行うドライバや無線ＬＡＮによる通信に関するプロトコル処理を行う。ＢＬＥ制御部４０２は、ＢＬＥのＲＦ制御、通信処理、ＢＬＥによる通信の各種制御を行うドライバやＢＬＥによる通信に関するプロトコル処理を行う。公衆回線制御部４０６は、公衆無線通信のＲＦ制御、通信処理、公衆無線通信の各種制御を行うドライバや公衆無線通信関連のプロトコル処理を行う。公衆無線通信は例えばＩＭＴ（Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｍｕｌｔｉｍｅｄｉａ　Ｔｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ）規格やＬＴＥ（Ｌｏｎｇ　Ｔｅｒｍ　Ｅｖｏｌｕｔｉｏｎ）規格などに準拠したものである。パケット送受信部４０３は、無線ＬＡＮ並びにＢＬＥによる通信及び公衆無線通信に関するパケットの送信と受信との少なくともいずれかを実行するための処理を行う。なお、本例では、スマートデバイス３０１は、通信においてパケットの送信と受信との少なくともいずれかを行うものとして説明するが、パケット交換以外に、例えば回線交換など、他の通信形式が用いられてもよい。

　スマートデバイス３０１は、例えば、制御部４１１、記憶部４０４、ＧＰＳ受信部４０５、表示部４０７、操作部４０８、音声入力音声処理部４０９、電源部４１０をさらに有する。制御部４１１は、例えば、記憶部４０４に記憶される制御プログラムを実行することにより、スマートデバイス３０１全体を制御する。記憶部４０４は、例えば制御部４１１が実行する制御プログラムと、通信に必要なパラメータ等の各種情報とを記憶する。後述する各種動作は、記憶部４０４に記憶された制御プログラムを制御部４１１が実行することにより、実現される。

　電源部４１０はスマートデバイス３０１に電源を供給する。表示部４０７は、例えば、ＬＣＤやＬＥＤのように視覚で認知可能な情報の出力、又はスピーカー等の音出力が可能な機能を有し、各種情報の表示を行う。操作部４０８は、例えばユーザによるスマートデバイス３０１の操作を受け付けるボタン等である。なお、表示部４０７及び操作部４０８は、例えばタッチパネルなどの共通する部材によって構成されてもよい。

　音声入力音声処理部４０９は、例えばスマートデバイス３０１に内蔵された汎用的なマイクから、ユーザが発した音声を取得し、音声認識処理により、ユーザの操作命令を取得する構成にしてもよい。

　また、スマートデバイス内の専用のアプリケーションを介して、ユーザの発音により音声コマンドを取得する。そして、無線ＬＡＮによる通信３０２を介して、撮像装置１０１の音声処理部２１４に特定音声コマンド認識させるための特定音声コマンドとして登録することもできる。

　ＧＰＳ（Ｇｌｏｂａｌ　ｐｏｓｉｔｉｏｎｉｎｇ　ｓｙｓｔｅｍ）４０５は、衛星から通知されるＧＰＳ信号を受信し、ＧＰＳ信号を解析し、スマートデバイス３０１の現在位置（経度・緯度情報）を推定する。もしくは、位置推定は、ＷＰＳ（Ｗｉ－Ｆｉ　Ｐｏｓｉｔｉｏｎｉｎｇ　Ｓｙｓｔｅｍ）等を利用して、周囲に存在する無線ネットワークの情報に基づいて、スマートデバイス３０１の現在位置を推定するようにしてもよい。取得した現在のＧＰＳ位置情報が予め事前に設定されている位置範囲（所定半径の範囲以内）に位置している場合に、ＢＬＥ制御部４０２を介して撮像装置１０１へ移動情報を通知し、後述する自動撮影や自動編集のためのパラメータとして使用する。また、ＧＰＳ位置情報に所定以上の位置変化があった場合に、ＢＬＥ制御部４０２を介して撮像装置１０１へ移動情報を通知し、後述する自動撮影や自動編集のためのパラメータとして使用する。

　上記のように撮像装置１０１とスマートデバイス３０１は、無線ＬＡＮ制御部４０１、及び、ＢＬＥ制御部４０２を用いた通信により、撮像装置１０１とデータのやりとりを行う。例えば、音声信号、画像信号、圧縮音声信号、圧縮画像信号などのデータを送信したり受信したりする。また、スマートデバイスから撮像装置１０１の撮影などの操作指示であったり、音声コマンド登録データ送信や、ＧＰＳ位置情報に基づいた所定位置検出通知や場所移動通知を行う。また、スマートデバイス内の専用のアプリケーションを介しての学習用データの送受信も行う。なお、外部装置３０１はスマートデバイス３０１に限定されない。例えば、表示部４０７や操作部４０８などを省き、音声入力に特化した装置であってもよい。この装置では、前述したマイクから、ユーザが発した音声を取得し、音声認識処理により、ユーザの操作命令を取得し、撮像装置１０１へ通知する。このほかに、この装置では、音声認識と、クラウドとの通信機能、スピーカーを利用したニュースの読み上げ機能を有してもよい。また、検索エンジンを用いた調べものの音出力や、対話システムの機能を有してもよい。

　＜アクセサリ類の構成＞
　図５は、撮像装置１０１と通信可能である外部装置５０１との構成例を示す図である。撮像装置１０１は撮影機能を有するデジタルカメラであり、外部装置５０１は、例えばＢｌｕｅｔｏｏｔｈ通信モジュールなどにより撮像装置１０１と通信可能である各種センシング部を含むウエアラブルデバイスである。

　ウエアラブルデバイス５０１において、例えばユーザの腕などに装着できるような構成になっており、所定の周期でユーザの脈拍、心拍、血流等の生体情報を検出するセンサやユーザの運動状態を検出できる加速度センサ等が搭載されている。

　生体情報検出部５０２は、例えば、脈拍を検出する脈拍センサ、心拍を検出する心拍センサ、血流を検出する血流センサ、導電性高分子による皮膚の接触によって電位の変化を検出したことを検知するセンサを含む。本実施形態では、生体情報検出部５０２として心拍センサを用いて説明する。心拍センサは、例えばＬＥＤ等を用いて皮膚に赤外光を照射し、体組織を透過した赤外光を受光センサで検出して信号処理することによりユーザの心拍を検出する。生体情報検出部５０２は、検出した生体情報を信号として、後述する制御部６０７へ出力する。

　ユーザの運動状態を検出する揺れ検出部５０３は、例えば、加速度センサやジャイロセンサが搭載しており、加速度の情報に基づきユーザが移動しているかどうかや、腕を振り回してアクションをしているかどうかなどのモーションを検出することができる。

　また、ユーザによるウエアラブルデバイス５０１の操作を受け付ける操作部５０５や、ＬＣＤやＬＥＤのように視覚で認知可能な情報を出力する表示部５０４が搭載される。

　ウエアラブルデバイス５０１の構成を、図６を用いて説明する。

　ウエアラブルデバイス５０１は、例えば、制御部６０７、通信部６０１、生体情報検出部５０２、揺れ検出部５０３、表示部５０４、操作部５０５、電源部６０６、記憶部６０８を有する。

　制御部６０７は、例えば、記憶部６０８に記憶される制御プログラムを実行することにより、ウエアラブルデバイス５０１全体を制御する。記憶部６０８は、例えば制御部６０７が実行する制御プログラムと、通信に必要なパラメータ等の各種情報とを記憶する。後述する各種動作は、例えば記憶部６０８に記憶された制御プログラムを制御部６０７が実行することにより、実現される。

　電源部６０６はウエアラブルデバイス５０１に電源を供給する。表示部５０４は、例えば、ＬＣＤやＬＥＤのように視覚で認知可能な情報の出力、又はスピーカー等の音出力が可能な機能を有し、各種情報の表示を行う。操作部５０５は、例えばユーザによるウエアラブルデバイス５０１の操作を受け付けるボタン等である。なお、表示部５０４及び操作部５０５は、例えばタッチパネルなどの共通する部材によって構成されてもよい。

　また、操作部は、例えばウエアラブルデバイス５０１に内蔵された汎用的なマイクから、ユーザが発した音声を取得し、音声処理によりユーザが発した音声を取得し、音声認識処理により、ユーザの操作命令を取得する構成にしてもよい。

　生体情報検出部５０２や揺れ検出部５０３から制御部６０７で処理された各種検出情報は、通信部６０１により、撮像装置１０１へ検出情報を送信する。

　例えば、ユーザの心拍の変化を検出したタイミングで検出情報を撮像装置１０１に送信したり、歩行移動／走行移動／立ち止まりなどの移動状態の変化のタイミングで検出情報を送信したりする。また、例えば、予め設定された腕ふりのモーションを検出したタイミングで検出情報を送信したり、予め設定された距離の移動を検出したタイミングで検出情報を送信したりする。

　図３０は、手持ち操作アタッチメントの例を示したものである。

　撮像装置本体１０１には例えば撮影指示を行うシャッターボタンなどの操作部材を設けずに、アタッチメントに設けられた各操作部材により撮像装置１０１を操作できる構成をとってもよい。

　図３１のように、ユーザが任意の被写体５０１１にカメラを向けて撮影したい場合がある。そのとき、カメラのパン・チルトが自動的に動いてしまうと、ユーザが撮影したい被写体にカメラを向ける動作も邪魔をしてしまう可能性がある。そこで、手持ち操作アタッチメント５００１内に、カメラ任せのオート設定のモードと、ユーザが手動カメラ操作を行えるモードとを切り替えることができる切り替えスイッチ５００５を設けてもよい。その場合、切り替えスイッチ５００５が手動カメラ操作のモードに設定されている場合、カメラ振れ補正のためのパン・チルト駆動は行うが、被写体探索のために大きなパン・チルト角度変更を行うことはない。

　或いは、切り替えスイッチ５００５を設けなくても、アタッチメント５００１が撮像装置１０１と接続されたか否かを検出できるアタッチメント検出部５００２を設けてもよい。この場合、アタッチメントが装着されている場合は、カメラ振れ補正のためのパン・チルト駆動は行うが、被写体探索のために大きなパン・チルト角度変更を行うことはしないようにしてもよい。アタッチメント装着の検出は、電圧の変化やＩＤなど既存の方法でよい。

　切り替えスイッチ５００５、或いはアタッチメント検出部５００２により手動カメラ操作モードになっているとき、被写体探索のための大きなパン・チルト角度変更を行うことはしないが、カメラ振れ補正のためのパン・チルト駆動は行う。ここで、カメラ光軸を重力方向に対して一定方向に保つような傾き補正も行うことはできるが、ユーザ操作の邪魔をしてしまう可能性がある。そこで、カメラ振れ補正は低周波（例えば０．１Ｈｚ以下の周波数領域）をカットして高周波成分のみの補正を行う。

　被写体探索のためのパン・チルト駆動を行わない場合でも、パン・チルトの方向をユーザが手動で変更したい場合がある。図３１のようにして撮像装置１０１を被写体５１０１に向けて撮影するような場合、ユーザは撮像装置１０１のチルト角度を撮像装置１０１の上方向に光軸が向くように操作して撮影を行ったりする。その場合、手持ち操作アタッチメント５００１内に、パン・チルト方向が変更することができる操作部材５００３を設けてもよい。操作部材５００３はＸＹ座標で自由に平行移動させることができるようにし、操作した方向によって、パン・チルトを動かす方法をとってもよい。例えば、操作部材を上方向に移動させた場合、チルトをカメラ上方向に駆動し、操作部材を下方向に移動させた場合、チルトをカメラ下方向に駆動し、操作部材を右左に移動させるとパンが方向に合わせて駆動させる。

　また、ユーザが任意のタイミングで撮影を行うことができるシャッターボタン５００４を設けてもよい。また、撮影モード（例えば、静止画撮影モード／動画撮影モード／パノラマ撮影モード／タイムラプス撮影モードなど）を切り替えることのできるスイッチ５００６を設けてもよい。

　また、手持ち操作アタッチメント５００１から、撮像装置１０１に操作指示をする方法は、非接触通信手段を用いてもよい。

　撮像装置１０１と手持ち操作アタッチメント５００１にそれぞれ設けた電気信号を接続するコネクタにより、操作指示を行うこともできるが、撮像装置１０１に電池が内包されている場合、手持ち操作アタッチメントに電池用のコネクタが必要ない。そのため、レリーズなどの操作用にあえて、コネクタを設けると、接続部分での防滴機能を付加する必要や、諸々の部品が必要になり、装置の肥大化やコストの増大になってしまう。

　非接触通信手段は、Ｂｌｕｅｔｏｏｔｈ　Ｌｏｗ　Ｅｎｅｒｇｙ（ＢＬＥ）を用いてもよいし、ＮＥＡＲ　ＦＩＥＬＤ　ＣＯＭＭＵＮＩＣＡＴＩＯＮ（ＮＦＣ）ＢＬＥを用いてもよいし、他の方法であってもよい。

　また、手持ち操作アタッチメント５００１の電波発生動力は、電源の容量が小さく小型のものでよく、例えばボタン電池やシャッターボタン５００４を押す力で微量な電力を発生させる手段をとってもよい。

　このように、撮像装置とは別体の、撮像装置へレリーズ指示を行う操作部材と、撮像装置の回転機構を駆動する指示を行う操作部材を有するアタッチメントを撮像装置に装着できる構成としてもよい。また、撮影ユニットの静止画モード、動画モード、パノラマモード、タイムラプスモードの何れか２つ以上を設定できる撮像モード変更指示を行う操作部材を有するアタッチメントを撮像装置に装着できる構成としてもよい。アタッチメントから撮像装置に対しての操作部材による操作指示は、非接触通信手段により通知する。また、撮像装置は、撮像装置に装着されるアタッチメント情報を検出し、アタッチメント情報に基づいて、振れ補正手段の制御周波数帯域を変更してもよい。このアタッチメント情報の検出によって、重力方向を基準とした一定方向の角度を保持する傾き補正を行うか否かを変更することができる。アタッチメント情報の検出によって、振れ補正の制御帯域の低周波側をカットしてもよい。

　図３２は、撮像装置１０１とは別のカメラ３２０１のアクセサリーシュー３２０２に機械的に取り付け可能な構成の例を示したものである。

　図３２に示すようにアクセサリーシューに取り付けた場合、撮像装置１０１とカメラ３２０１の取り付け方向及び、カメラ３２０１の光軸方向と撮像装置１０１の光軸方向の角度差が既知となる。したがって、カメラ３２０１と撮像装置１０１を協調して制御することが容易となる。

　撮像装置１０１とカメラ３２０１間での情報通知は、アクセサリーシューと接続する箇所に電気的な接点を設けておいて、撮像装置１０１とカメラ３２０１との情報を通知する仕組みにすればよい。また、撮像装置１０１とカメラ３２０１とを例えばＵＳＢなどの通信ケーブルを介して情報を通知する仕組みにしてもよい。また、無線通信（ＢＬＥ、ＮＦＣなど）を用いてもよいし、他の方法でもよい。

　撮像装置１０１とカメラ３２０１との連携については、後述する。

　＜撮像動作のシーケンス＞
　図７は、本実施形態における撮像装置１０１の第１制御部２２３が受け持つ動作の例を説明するフローチャートである。

　ユーザが撮像装置１０１に設けられた電源ボタンを操作すると、第１電源部２１０により電源供給部から、第１制御部２２３及び撮像装置１０１の各ブロックに電源を供給させる。

　また、同様に第２制御部２１１においても第２電源部２１２により電源供給部から、第２制御部に電源を供給されるが、第２制御部の動作の詳細については後述する図８のフローチャートを用いて説明する。

　電源が供給されると、図７の処理がスタートする。ステップ７０１では、起動条件の読み込みが行われる。本実施形態においては、起動条件は以下である。
（１）電源ボタンが手動で押下されて電源起動
（２）外部機器（例えば３０１）から外部通信（例えばＢＬＥ通信）からの指示で電源起動
（３）Ｓｕｂプロセッサ（第２制御部２１１）から、電源起動

　ここで、（３）のＳｕｂプロセッサから電源起動の場合は、Ｓｕｂプロセッサ内で演算された起動条件が読み込まれることになるが、詳細は後述する図８で説明する。

　また、ここで読み込まれた起動条件は、被写体探索や自動撮影時の１つのパラメータ要素として用いられるが、後述して説明する。起動条件読み込みが終了するとステップ７０２に進む。

　ステップ７０２では、各種センサの読み込みが行われる。ここで読み込まれるセンサは、装置揺れ検出部２０９からのジャイロセンサや加速度センサなどの振動検出するセンサであったりする。また、チルト回転ユニット１０４やパン回転ユニット１０５の回転位置であったりする。また、音声処理部２１４にて検出される音声レベルや特定音声認識の検出トリガや音方向検出だったりする。

　また、図１乃至図６には図示していないが、環境情報を検出するセンサでも情報を取得する。

　例えば、所定の周期で撮像装置１０１の周辺の温度を検出する温度センサや、撮像装置１０１の周辺の気圧の変化を検出する気圧センサがある。また、撮像装置１０１の周辺の明るさを検出する照度センサや、撮像装置１０１の周辺の湿度を検出する湿度センサや、撮像装置１０１の周辺の紫外線量を検出するＵＶセンサ等を備えてもよい。検出した温度情報や気圧情報や明るさ情報や湿度情報やＵＶ情報に加え、検出した各種情報から所定時間間隔での変化率を算出した温度変化量や気圧変化量や明るさ変化量や湿度変化量や紫外線変化量などを後述する自動撮影などの判定に使用する。

　ステップ７０２で各種センサ読み込みが行われるとステップ７０３に進む。

　ステップ７０３では、外部機器からの通信が指示されているかを検出し、通信指示があった場合、外部機器との通信を行う。

　例えば、スマートデバイス３０１から、無線ＬＡＮやＢＬＥを介した、リモート操作であったり、音声信号、画像信号、圧縮音声信号、圧縮画像信号などのデータを送信したり受信したりする。また、スマートデバイス３０１からの撮像装置１０１の撮影などの操作指示や、音声コマンド登録データ送信や、ＧＰＳ位置情報に基づいた所定位置検出通知や場所移動通知や学習用データの送受信の指示があるかどうかの読み込みを行う。

　また、例えば、ウエアラブルデバイス５０１から、ユーザの運動情報、腕のアクション情報、心拍などの生体情報の更新がある場合、ＢＬＥを介した情報の読み込みを行う。また、上述した環境情報を検出する各種センサは、撮像装置１０１に搭載してもよいが、スマートデバイス３０１或いはウエアラブルデバイス５０１に搭載していてもよく、その場合、ＢＬＥを介した環境情報の読み込みも行う。ステップ７０３で外部機器からの通信読み込みが行われると、ステップＳ７０４に進む。

　ステップ７０４では、モード設定判定が行われる。ステップ７０４で設定されるモードは、以下の内から判定され選ばれる。

　（１）自動撮影モード
　［モード判定条件］
　後述する学習により設定された各検出情報（画像、音、時間、振動、場所、身体の変化、環境変化）や、自動撮影モードに移行してからの経過時間や、過去の撮影情報などから、自動撮影を行うべきと判定されると、自動撮影モードに設定される。

　［モード内処理］
　自動撮影モード処理（ステップ７１０）では、各検出情報（画像、音、時間、振動、場所、体の変化、環境変化）に基づいて、パン・チルトやズームを駆動して被写体を自動探索する。そして、ユーザの好みの撮影が行えるタイミングであると判定されると、静止画一枚撮影、静止画連続撮影、動画撮影、パノラマ撮影、タイムラプス撮影など様々な撮影方法の中から、撮影方法の判定処理が行われ、自動で撮影が行われる。

　（２）自動編集モード
　［モード判定条件］
　前回自動編集を行ってからの経過時間と、過去の撮影画像情報から、自動編集を行うべきと判定されると、自動編集モードに設定される。

　［モード内処理］
　自動編集モード処理（ステップ７１２）では、学習に基づいた静止画像や動画像の選抜処理を行い、学習に基づいて画像効果や編集後動画の時間などにより、一つの動画にまとめたハイライト動画を作成する自動編集処理が行われる。

　（３）画像転送モード
　［モード判定条件］
　スマートデバイス内の専用のアプリケーションを介した指示により、画像自動転送モードに設定されている場合、前回画像転送を行ってからの経過時間と過去の撮影画像情報から画像自動を行うべきと判定されると、自動画像転送モードに設定される。

　［モード内処理］
　画像自動転送モード処理（ステップ７１４）では、撮像装置１０１は、ユーザの好みであろう画像を自動で抽出し、スマートデバイス３０１にユーザの好みの画像を自動で抽出し、画像転送が行われる。ユーザの好みの画像抽出は、後述する各画像に付加されたユーザの好みを判定したスコアにより行う。

　（４）学習モード
　［モード判定条件］
　前回学習処理を行ってからの経過時間と、学習に使用することのできる画像に対応付けられた情報や学習データの数などから、自動学習を行うべきと判定されると、自動学習モードに設定される。または、スマートデバイス３０１からの通信を介して学習データが設定されるように指示があった場合も本モードに設定される。

　［モード内処理］
　自動学習モード処理（ステップ７１６）では、ユーザの好みに合わせた学習を行う。スマートデバイス３０１での各操作、スマートデバイス３０１からの学習情報通知などの情報を基にニューラルネットワークを用いて、ユーザの好みに合わせた学習が行われる。スマートデバイス３０１での各操作の情報としては、例えば、撮像装置からの画像取得情報、専用アプリケーションを介して手動による編集指示がされた情報、撮像装置内の画像に対してユーザが入力した判定値情報がある。

　また、個人認証の登録や音声登録、音シーン登録、一般物体認識登録などの、検出に関する学習や、上述した低消費電力モードの条件などの学習も同時に行われる。

　（５）ファイル自動削除モード
　［モード判定条件］
　前回ファイル自動削除を行ってからの経過時間と、画像を記録している不揮発性メモリ２１６の残容量とから、ファイル自動削除を行うべきと判定されると、ファイル自動削除モードに設定される。

　［モード内処理］
　ファイル自動削除モード処理（ステップ７１８）では、不揮発性メモリ２１６内の画像の中から、各画像のタグ情報と撮影された日時などから自動削除されるファイルを指定し（三択処理）削除する。

　なお、自動撮影モード処理、自動編集モード処理、学習モード処理についての詳細は、後述する。

　ステップ７０５ではステップ７０４でモード設定判定が低消費電力モードに設定されているかどうかを判定する。低消費電力モード判定は、後述する「自動撮影モード」、「自動編集モード」、「画像自動転送モード」、「学習モード」、「ファイル自動削除モード」、の何れのモードの判定位条件でもない場合は、低消費電力モードになるように判定される。判定処理が行われるとステップ７０５に進む。

　ステップ７０５では、低消費電力モード条件であると判定されれば、ステップ７０６に進む。

　ステップ７０６では、Ｓｕｂプロセッサ（第２制御部２１１）へ、Ｓｕｂプロセッサ内で判定する起動要因に係る各種パラメータを（揺れ検出判定用パラメータ、音検出用パラメータ、時間経過検出パラメータ）を通知する。各種パラメータは後述する学習処理にて、学習されることによって値が変化する。ステップ７０６の処理を終了すると、ステップ７０７に進み、Ｍａｉｎプロセッサ（第１制御部２２３）の電源をＯＦＦして、処理を終了する。

　一方、ステップ７０５で低消費電力モードでないと判定されると、ステップ７０９に進み、モード設定が自動撮影モードであるか否かを判定し、自動撮影モードであればステップ７１０に進み、自動撮影モード処理が行われる。処理が終了すると、ステップ７０２に戻り、処理を繰り返す。ステップ７０９で、自動撮影モードでないと判定されると、ステップ７１１に進む。

　ステップ７１１では、モード設定が自動編集モードであるか否かを判定し、自動編集モードであればステップ７１２に進み、自動編集モード処理が行われる。処理が終了すると、ステップ７０２に戻り、処理を繰り返す。ステップ７１１で、自動編集モードでないと判定されると、ステップ７１３に進む。

　ステップ７１３では、モード設定が画像自動転送モードであるか否かを判定し、画像自動転送モードであればステップ７１４に進み、画像自動転送モード処理が行われる。処理が終了すると、ステップ７０２に戻り、処理を繰り返す。ステップ７１３で、画像自動転送モードでないと判定されると、ステップ７１５に進む。

　ステップ７１５では、モード設定が学習モードであるか否かを判定し、学習モードであればステップ７１６に進み、学習モード処理が行われる。処理が終了すると、ステップ７０２に戻り、処理を繰り返す。ステップ７１５で、学習モードでないと判定されると、ステップ７１７に進む。

　ステップ７１７では、モード設定がファイル自動削除モードであるか否かを判定し、ファイル自動削除モードであればステップ７１８に進み、ファイル自動削除モード処理が行われる。処理が終了すると、ステップ７０２に戻り、処理を繰り返す。ステップ７１７で、ファイル自動削除モードでないと判定されると、ステップ７０２に戻り、処理を繰り返す。

　図８は、本実施形態における撮像装置１０１の第２制御部２１１が受け持つ動作の例を説明するフローチャートである。

　ユーザが撮像装置１０１に設けられた電源ボタンを操作すると、第１電源部２１０により電源供給部から第１制御部２２３へ電源が供給されるのと同様に第２制御部２１１においても第２電源部２１２により電源供給部から第２制御部２１１に電源が供給される。電源が供給されると、Ｓｕｂプロセッサ（第２制御部２１１）が起動され、図８の処理がスタートする。

　ステップ８０１では、サンプリングの周期となる所定期間が経過したか否かを判定する。例えば１０ｍｓｅｃに設定された場合、１０ｍｓｅｃ周期で、ステップ８０２に進む。所定期間が経過していないと判定されると、Ｓｕｂプロセッサは何も処理をせずにステップ８０１に戻って所定期間が経過するのを待つ。

　ステップ８０２では、学習情報の読み込みが行われる。学習情報は、図７のステップ７０６でのＳｕｂプロセッサへ情報通信する際に、転送された情報であり、例えば以下の情報が読み込まれる。
（１）特定揺れ検出の判定条件
（２）特定音検出の判定条件
（３）時間経過判定の判定条件

　ステップ８０２で学習情報が読み込まれると、ステップ８０３に進み、揺れ検出値が取得される。揺れ検出値は、装置揺れ検出部２０９からのジャイロセンサや加速度センサなどの振動検出するセンサからの出力値である。

　ステップ８０３で揺れ検出値が取得されると、ステップ８０４に進み、予め設定された揺れ状態検出の処理を行う。ここでは、ステップ８０２で読み込まれた学習情報によって、判定処理を変更する。いくつかの例を説明する。

　（１）タップ検出
　ユーザが撮像装置１０１を例えば指先などで叩いた状態（タップ状態）を、撮像装置１０１に取り付けられた加速度センサの出力値より検出することが可能である。３軸の加速度センサの出力を所定サンプリングで特定の周波数領域に設定したバンドパスフィルタ（ＢＰＦ）に通すことで、タップによる加速度変化の信号領域を抽出することができる。ＢＰＦ後の加速度信号を所定時間ＴｉｍｅＡ間に、所定閾値ＴｈｒｅｓｈＡを超えた回数が、所定回数ＣｏｕｎｔＡであるか否かにより、タップ検出を行う。ダブルタップの場合は、ＣｏｕｎｔＡは２に設定され、トリプルタップの場合は、ＣｏｕｎｔＡは３に設定される。また、ＴｉｍｅＡやＴｈｒｅｓｈＡについても、学習情報によって変化させることができる。

　（２）揺れ状態の検出
　撮像装置１０１の揺れ状態を、撮像装置１０１に取り付けられたジャイロセンサや加速度センサの出力値より検出することが可能である。ジャイロセンサや加速度センサの出力をＨＰＦで高周波成分をカットし、ＬＰＦで低周波成分をカットした後、絶対値変換を行う。算出した絶対値が所定時間ＴｉｍｅＢ間に、所定閾値ＴｈｒｅｓｈＢを超えた回数が、所定回数ＣｏｕｎｔＢ以上であるか否かにより、振動検出を行う。例えば撮像装置１０１を机などに置いたような揺れが小さい状態か、ウエアラブルで撮像装置１０１を装着し歩いているような揺れが大きい状態かを判定することが可能である。また、判定閾値や判定のカウント数の条件を複数もつことで、揺れレベルに応じた細かい揺れ状態を検出することも可能である。

　ＴｉｍｅＢやＴｈｒｅｓｈＢやＣｏｕｎｔＢについても、学習情報によって変化させることができる。

　上記は揺れ検出センサの条件判定による特定揺れ状態検出の方法を説明した。しかしながら、所定時間内でサンプリングされた揺れ検出センサのデータから、ニューラスネットワークを用いた揺れ状態判定器に入力することで、学習させたニューラルネットワークにより、事前に登録しておいた特定揺れ状態を検出することも可能である。その場合、ステップ８０２での学習情報読み込みはニューラルネットワークの重みパラメータとなる。

　ステップ８０４で特定揺れ状態検出処理が行われると、ステップ８０５に進み、予め設定された特定音検出処理を行う。ここでは、ステップ８０２で読み込まれた学習情報によって、検出判定処理を変更する。いくつかの例を説明する。

　（１）特定音声コマンド検出
　特定の音声コマンドを検出する。音声コマンドは事前に登録されたいくつかのコマンドの他、ユーザが特定音声を撮像装置に登録できる。

　（２）特定音シーン認識
　予め大量の音声データを基に機械学習により学習させたネットワークにより音シーン判定を行う。例えば、「歓声が上がっている」、「拍手している」、「声を発している」などの特定シーンを検出する。検出するシーンは学習によって変化する。

　（３）音レベル判定
　所定時間の間で、音レベルの大きさがレベル所定値を超えている時間を加算するなどの方法によって、音レベル判定による検出を行う。所定時間やレベル所定値の大きさなどが学習によって変化する。

　（４）音方向判定
　複数のマイクが設置された平面上の音の方向を検出することができ、所定大きさの音レベルに対して、音の方向を検出する。

　音声処理部２１４内で上記の判定処理が行われており、事前に学習された各設定により、特定音検出がされたかをステップ８０５で判定する。

　ステップ８０５で特定音検出処理が行われると、ステップ８０６に進む。ステップ８０６では、Ｍａｉｎプロセッサ（第１制御部２２３）はＯＦＦ状態であるか否かを判定し、ＭａｉｎプロセッサがＯＦＦ状態であれば、ステップ８０７に進み、予め設定された時間経過検出処理を行う。ここでは、ステップ８０２で読み込まれた学習情報によって、検出判定処理を変更する。学習情報は、図７で説明したステップ７０６でのＳｕｂプロセッサ（第２制御部２１１）へ情報通信する際に、転送された情報である。ＭａｉｎプロセッサがＯＮからＯＦＦへ遷移したときからの経過時間が計測されており、経過時間がパラメータＴｉｍｅＣ以上であれば、時間経過と判定され、ＴｉｍｅＣより小さければ、時間経過とは判定されない。ＴｉｍｅＣは、学習情報によって変化するパラメータである。

　ステップ８０７で時間経過検出処理が行われると、ステップ８０８に進み、低消費電力モード解除判定がされたかを判定する。低消費電力モード解除条件は以下によって判定される。
（１）特定揺れ検出の判定条件
（２）特定音検出の判定条件
（３）時間経過判定の判定条件

　それぞれ、ステップ８０４での特定揺れ状態検出処理により、特定揺れ検出の判定条件に入ったか否かを判定できる。また、ステップ８０５での特定音検出処理により、特定音検出の判定条件に入ったか否かを判定できる。また、ステップ８０７での時間経過検出処理により、時間経過検出の判定条件に入ったか否かを判定できる。したがって、何れか一つ以上の条件に入っていれば、低消費電力モード解除を行うような判定が行われる。

　ステップ８０８で解除条件判定されると、ステップ８０９に進みＭａｉｎプロセッサの電源をＯＮし、ステップ８１０で、低消費電力モード解除と判定された条件（揺れ、音、時間）をＭａｉｎプロセッサに通知し、ステップ８０１に戻り処理をループする。

　ステップ８０８で何れの解除条件にも当てはまらなく、低消費電力モード解除判定でないと判定されると、ステップ８０１に戻り処理をループする。

　ステップ８０６で、ＭａｉｎプロセッサがＯＮ状態であると判定されている場合、ステップ８０３乃至８０５までで取得した情報をＭａｉｎプロセッサに通知し、ステップ８０１に戻り処理をループする。

　本実施形態においては、ＭａｉｎプロセッサがＯＮ状態においても揺れ検出や特定音検出をＳｕｂプロセッサで行い、検出結果をＭａｉｎプロセッサに通知する構成にしている。しかしながら、ＭａｉｎプロセッサがＯＮの場合は、ステップ８０３乃至８０５の処理を行わず、Ｍａｉｎプロセッサ内の処理（図７のステップ７０２）で揺れ検出や特定音検出を検出する構成にしてもよい。

　上記のように図７のステップ７０４乃至ステップ７０７や、図８の処理を行うことで、低消費電力モードに移行する条件や低消費電力モードを解除する条件が、ユーザの操作に基づいて学習される。これにより、撮像装置１０１を所有するユーザの使い勝手に合わせた撮像動作を行うことができる。学習の方法については後述する。

　上記、揺れ検出や音検出や時間経過による低消費電力モード解除方法について詳しく説明したが、環境情報により低消費電力モード解除を行ってもよい。環境情報は温度や気圧や明るさや湿度や紫外線量の絶対量や変化量が所定閾値を超えたか否かで判定することができ、後述する学習により閾値を変化させることもできる。

　また、揺れ検出や音検出や時間経過の検出情報や、各環境情報の絶対値や変化量をニューラルネットワークに基づく判断によって、低消費電力モード解除を判定してもできるし、この判定処理は、後述する学習によって、判定条件を変更することができる。

　＜自動撮影モード処理＞
　図９を用いて、自動撮影モード処理の詳細を説明する。前述したように、以下の処理は、本実施形態における撮像装置１０１の第１制御部２２３が制御を受け持つ。

　Ｓ９０１では、画像処理部２０７に撮像部２０６で取り込まれた信号を画像処理させ、被写体認識用の画像を生成させる。

　生成された画像からは、人物や物体認識などの被写体認識が行われる。

　人物を認識する場合、被写体の顔や人体を検出する。顔検出処理では、人物の顔を判断するためのパターンが予め定められており、撮像された画像内に含まれる該パターンに一致する箇所を人物の顔画像として検出することができる。

　また、被写体の顔としての確からしさを示す信頼度も同時に算出し、信頼度は、例えば画像内における顔領域の大きさや、顔パターンとの一致度等から算出される。

　物体認識についても同様に、予め登録されたパターンに一致する物体を認識することができる。

　また、撮像された画像内の色相や彩度等のヒストグラムを使用する方法で特徴被写体を抽出する方法などもある。この場合、撮影画角内に捉えられている被写体の画像に関し、その色相や彩度等のヒストグラムから導出される分布を複数の区間に分け、区間ごとに撮像された画像を分類する処理が実行される。

　例えば、撮像された画像について複数の色成分のヒストグラムが作成され、その山型の分布範囲で区分けし、同一の区間の組み合わせに属する領域にて撮像された画像が分類され、被写体の画像領域が認識される。

　認識された被写体の画像領域ごとに評価値を算出することで、当該評価値が最も高い被写体の画像領域を主被写体領域として判定することができる。

　以上の方法で、撮像情報から各被写体情報を得ることができる。

　Ｓ９０２では、像揺れ補正量の算出を行う。具体的には、まず、装置揺れ検出部２０９において取得した角速度および加速度情報に基づいて撮像装置の絶対角度の算出を行う。そして、絶対角度を打ち消す角度方向にチルト回転ユニット１０４およびパン回転ユニット１０５を動かす防振角度を求め、像揺れ補正量とする。なお、ここでの像揺れ補正量算出処理は、後述する学習処理によって、演算方法を変更することができる。

　Ｓ９０３では、撮像装置の状態判定を行う。角速度情報や加速度情報やＧＰＳ位置情報などで検出した角度や移動量などにより、現在、撮像装置がどのような振動／動き状態なのかを判定する。

　例えば、車に撮像装置１０１を装着して撮影する場合、移動された距離によって大きく周りの風景などの被写体情報が変化する。

　そのため、車などに装着して速い速度で移動している「乗り物移動状態」か否かを判定し、後に説明する自動被写体探索に使用することができる。

　また、角度の変化が大きいか否かを判定し、撮像装置１０１が揺れ角度がほとんどない「置き撮り状態」であるのかを判定する。

　「置き撮り状態」である場合は、撮像装置１０１自体の角度変化はないと考えてよいので、置き撮り用の被写体探索を行うことができる。

　また、比較的、角度変化が大きい場合は、「手持ち状態」と判定され、手持ち用の被写体探索を行うことができる。

　Ｓ９０４では、被写体探索処理を行う。被写体探索は、以下の処理によって構成される。

　（１）エリア分割
　図１３を用いて、エリア分割を説明する。図１３Ａのように撮像装置（原点Ｏが撮像装置位置とする）位置を中心として、全周囲でエリア分割を行う。図１３Ａの例においては、チルト方向、パン方向それぞれ２２．５度で分割している。図１３Ａのように分割すると、チルト方向の角度が０度から離れるにつれて、水平方向の円周が小さくなり、エリア領域が小さくなる。よって、図１３Ｂのように、チルト角度が４５度以上の場合、水平方向のエリア範囲は２２．５度よりも大きく設定している。図１３Ｃ、Ｄに撮影画角内でのエリア分割された例を示す。軸１３０１は初期化時の撮像装置１０１の方向であり、この方向角度を基準位置としてエリア分割が行われる。１３０２は、撮像されている画像の画角エリアを示しており、そのときの画像例を図１３Ｄに示す。画角に写し出されている画像内ではエリア分割に基づいて、図１３Ｄの１３０３～１３１８のように画像分割される。

　（２）エリア毎の重要度レベルの算出
　前記のように分割した各エリアについて、エリア内に存在する被写体やエリアのシーン状況に応じて、探索を行う優先順位を示す重要度レベルを算出する。被写体の状況に基づいた重要度レベルは、例えば、エリア内に存在する人物の数、人物の顔の大きさ、顔向き、顔検出の確からしさ、人物の表情、人物の個人認証結果に基づいて算出する。また、シーンの状況に応じた重要度レベルは、例えば、一般物体認識結果、シーン判別結果（青空、逆光、夕景など）、エリアの方向からする音のレベルや音声認識結果、エリア内の動き検知情報等である。また、撮像装置の状態判定（Ｓ９０３）で、撮像装置の振動状態が検出されており、振動状態に応じても重要度レベルが変化するようにもすることができる。例えば、「置き撮り状態」と判定された場合、顔認証で登録されている中で優先度の高い被写体（例えば撮像装置のユーザである）を中心に被写体探索が行われるように、特定人物の顔認証を検出すると重要度レベルが高くなるように判定される。また、後述する自動撮影も上記顔を優先して行われることになり、撮像装置のユーザが撮像装置を身に着けて持ち歩き撮影を行っている時間が多くても、撮像装置を取り外して机の上などに置くことで、ユーザが写った画像も多く残すことができる。このときパン・チルトにより探索可能であることから、撮像装置の置き角度などを考えなくても、適当に設置するだけでユーザが写った画像やたくさんの顔が写った集合写真などを残すことができる。なお、上記条件だけでは、各エリアに変化がない限りは、最も重要度レベルが高いエリアが同じとなり、その結果探索されるエリアがずっと変わらないことになってしまう。そこで、過去の撮影情報に応じて重要度レベルを変化させる。具体的には、所定時間継続して探索エリアに指定され続けたエリアは重要度レベルを下げたり、後述するＳ９１０にて撮影を行ったエリアでは、所定時間の間重要度レベルを下げたりしてもよい。

　（３）探索対象エリアの決定
　前記のように各エリアの重要度レベルが算出されたら、重要度レベルが高いエリアを探索対象エリアとして決定する。そして、探索対象エリアを画角に捉えるために必要なパン・チルト探索目標角度を算出する。

　Ｓ９０５では、パン・チルト駆動を行う。具体的には、像振れ補正量とパン・チルト探索目標角度に基づいた制御サンプリングでの駆動角度を加算することで、パン・チルト駆動量を算出し、鏡筒回転駆動部２０５によって、チルト回転ユニット１０４、パン回転ユニット１０５をそれぞれ駆動制御する。

　Ｓ９０６ではズームユニット２０１を制御しズーム駆動を行う。具体的には、Ｓ９０４で決定した探索対象被写体の状態に応じてズームを駆動させる。例えば、探索対象被写体が人物の顔であるとき、画像上の顔が小さすぎると検出可能な最小サイズを下回ることで検出ができず、見失ってしまう恐れがある。そのような場合は、望遠側にズームすることで画像上の顔のサイズが大きくなるように制御する。一方で、画像上の顔が大きすぎる場合、被写体や撮像装置自体の動きによって被写体が画角から外れやすくなってしまう。そのような場合は、広角側にズームすることで、画面上の顔のサイズが小さくなるように制御する。このようにズーム制御を行うことで、被写体を追跡するのに適した状態を保つことができる。

　Ｓ９０４乃至Ｓ９０６では、パン・チルトやズーム駆動により被写体探索を行う方法を説明したが、広角なレンズを複数使用して全方位を一度に撮影する撮像システムで被写体探索を行ってもよい。全方位カメラの場合、撮像によって得られる信号すべてを入力画像として、被写体検出などの画像処理を行うと膨大な処理が必要となる。そこで、画像の一部を切り出して、切り出した画像範囲の中で被写体の探索処理を行う構成にする。上述した方法と同様にエリア毎の重要レベルを算出し、重要レベルに基づいて切り出し位置を変更し、後述する自動撮影の判定を行う。これにより画像処理による消費電力の低減や高速な被写体探索が可能となる。

　Ｓ９０７では、ユーザ（手動）による撮影指示があったがどうかを判定し、撮影指示があった場合、Ｓ９１０に進む。この時、ユーザ（手動）による撮影指示は、撮像装置１０１に設けられたシャッターボタン押下によるものや、手持ち操作アタッチメント５００１に設けられたシャッターボタン押下によるものでもよい。また、撮像装置の筺体を指等で軽く叩く（タップ）、音声コマンド入力、外部機器からの指示などによってもよい。タップ操作による撮影指示は、ユーザが撮像装置の筺体をタップした際、装置揺れ検出部２０９によって短期間に連続した高周波の加速度を検知し、撮影のトリガとする撮影指示方法である。音声コマンド入力は、ユーザが所定の撮影を指示する合言葉（例えば「写真とって」等）を発声した場合、音声処理部２１４で音声を認識し、撮影のトリガとする撮影指示方法である。外部機器からの指示は、例えば撮像装置とＢｌｕｅｔｏｏｔｈ接続したスマートフォン等から、専用のアプリケーションを介して送信されたシャッター指示信号をトリガとする撮影指示方法である。

　Ｓ９０８では、自動撮影判定を行う。自動撮影判定では、自動撮影を行うかどうかの判定と、撮影方法の判定（静止画一枚撮影、静止画連続撮影（連写）、動画撮影、パノラマ撮影、タイムラプス撮影などの内どれを実行するかの判定）を行う。

　なお、目の前にある物の撮影のため、ユーザが撮像装置を身に着けたまま、少し前方に突き出しながら撮影するようなシーンが考えられる。このようなシーンにおいては、例えばさっと通常静止画を撮影してくれることが望まれる。景勝地を撮影するため、ユーザが首から下げていた撮像装置を手持ちに切り替え、前方上方に掲げながら撮影するようなシーンも考えられる。このようなシーンでは、例えばパノラマ撮影が期待されていたり、そうでない場合であっても、パノラマ撮影をした画像をユーザに提示することで、ユーザはそのような撮影方法を知り、今後の撮影に生かすことが可能となる。そこで、これらの判別を行うため、例えば保持状態から撮影に至るまでの撮像装置の移動距離を検出することにより、シーンを判別する。このように、撮像装置の構え方によって、好まれる撮影方法が異なる場合があるため、撮影に至る際の撮像装置の状態に応じて撮影方法を切り替えることが可能となる。また、被写体がやや上方にあり、それを撮影するために上に掲げて撮影するシーンの場合のユーザの目的としては、さっと通常静止画を撮影してくれることが望まれる。そこで、これらの判別を行うため、例えば被写体距離を検出する。これによりシーンを判別することが可能となる。このように、被写体の状態によって、好まれる撮影方法が異なる場合があるため、撮影に至る際の撮像装置の状態、及び見えている被写体の状態に応じて撮影方法を切り替えることが可能となる。目の前にある縦長の被写体の撮影のため、ユーザが首から下げていた撮像装置を手持ちに切り替え、上向きに構えながら撮影している状態を示している。これは、例えば観光地で高層建築物を撮影するようなシーンが考えられる。このようなシーンでは、例えば縦向きのパノラマ撮影が期待されていたり、そうでない場合であっても、縦向きのパノラマ撮影をした画像をユーザに提示することで、ユーザはそのような撮影方法を知り、今後の撮影に生かすことが可能となる。そこで、このような場合においては、保持角度を検出する。これにより、シーンを判別することが可能となる。なお、この時の被写体の状態として、例えば被写体までの距離、及び被写体の上下、左右の領域にある被写体までの距離をさらに判定することにより、縦向きのパノラマと横向きのパノラマのどちらが好ましいかという判別の精度を上げることも可能である。すなわち、被写体・及びその上下領域の距離が同程度の距離にあるのであれば、縦方向のパノラマ撮影を行うといった判断をすることが可能となる。また、３６０度撮影のため、ユーザが首から下げていた撮像装置を手持ちに切り替え、真上に構えながら撮影しているシーンが考えられる。これは、例えば山頂で周囲を見回す画像を撮影するようなシーンが考えられる。この時、例えばユーザは外部機器を用いて３６０度撮影モードに設定し、撮影指示を行うことが考えられる。そこで、例えばこのような場合には外部機器を操作しようとした時に、３６０度撮影への移行を伺うようなＵＩを提示すれば、ユーザの操作の手間を削減することが可能となる。さらには、そのようなことを何度か繰り返すうちに、ユーザは外部機器を操作するまでもなく、真上に掲げてシャッターボタンを押下するだけで３６０度撮影が行えることを期待するようになる。そこで、このような場合においては、例えば保持状態から撮影に至るまでの撮像装置の移動方向が真上方向だった場合は３６０度撮影を行うといったようにすることで、ユーザの撮影の手間を軽減することが可能になる。

　このように、撮像装置の状態、及び被写体の状態に基づいて撮影方法を切り替えることにより、撮影時、及び撮影画像確認時におけるユーザの手間を軽減することが可能となる。

　なお、このような撮像装置の状態と被写体の状態に応じた、期待される撮影方法の判定においても、＜自動撮影を行うかどうかの判定＞での判定方法と同様に、ニューラルネットワークに基づく判断によって撮影方法を判定することもできる。また、この判定処理は、後述する学習処理によってユーザごとに判定条件を変更することも可能である。このような場合、学習の初期段階においては複数の撮影方法により複数の画像を記録しておき、後述する学習処理において、ユーザがどの撮影方法の画像を好んだかに応じて、判定条件を変えていくことが可能である。

　このように、ユーザによる手動撮影指示があった場合において、ユーザの意図に応じた撮影方法の判定に関して説明したが、このような処理はＳ９０８ｂのような、手動撮影指示が無い場合の自動撮影判定処理においても、適用することが可能である。すなわち、撮像装置を構えたと判定された際に、その撮像装置の構え方を検出することにより、同様にユーザの意図を反映した撮影方法の判定を行うことも可能である。

　また、撮像装置の加速度を監視することで、自動撮影時においても、撮像装置の構え方を検出し、ユーザの意図を反映した撮影方法を判定してもよい。

　（１）自動撮影を行うかどうかの判定
　自動撮影を行うかどうかの判定は以下の２つの判定に基づいて行う。１つは、Ｓ９０４にて得られたエリア別の重要度レベルに基づき、重要度レベルが所定値を超えている場合、自動撮影を実施する判定を下す。２つめは、ニューラルネットワークに基づく判定である。ニューラルネットワークの一例として、多層パーセプトロンによるネットワークの例を図１２に示す。ニューラルネットワークは、入力値から出力値を予測することに使用されるものであり、予め入力値と、その入力に対して模範となる出力値とを学習しておくことで、新たな入力値に対して、学習した模範に倣った出力値を推定することができる。なお、学習の方法は後述する。図１２の１２０１およびその縦に並ぶ丸は入力層のニューロンであり、１２０３およびその縦に並ぶ丸は中間層のニューロンであり、１２０４は出力層のニューロンである。１２０２のような矢印は各ニューロンを繋ぐ結合を示している。ニューラルネットワークに基づく判定では、入力層のニューロンに対して、現在の画角中に写る被写体や、シーンや撮像装置の状態に基づいた特徴量を入力として与え、多層パーセプトロンの順伝播則に基づく演算を経て出力層から出力された値を得る。そして、出力の値が閾値以上であれば、自動撮影を実施する判定を下す。なお、被写体の特徴は、現在のズーム倍率、現在の画角における一般物体認識結果、顔検出結果、現在画角に写る顔の数、顔の笑顔度・目瞑り度、顔角度、顔認証ＩＤ番号、被写体人物の視線角度、シーン判別結果、特定の構図の検出結果等を使用する。また、前回撮影時からの経過時間、現在時刻、ＧＰＳ位置情報および前回撮影位置からの変化量、現在の音声レベル、声を発している人物、拍手、歓声が上がっているか否か等を使用してもよい。また、振動情報（加速度情報、撮像装置の状態）、環境情報（温度、気圧、照度、湿度、紫外線量）等を使用してもよい。更に、ウエアラブルデバイス５０１からの情報通知がある場合、通知情報（ユーザの運動情報、腕のアクション情報、心拍などの生体情報など）も特徴として使用してもよい。この特徴を所定の範囲の数値に変換し、特徴量として入力層の各ニューロンに与える。そのため、入力層の各ニューロンは上記使用する特徴量の数だけ必要となる。

　なお、このニューラルネットワークに基づく判断は、後述する学習処理によって、各ニューロン間の結合重みを変化させることによって、出力値が変化し、判断の結果を学習結果に適応させることができる。

　また、図７のステップ７０２で読み込んだＭａｉｎプロセッサの起動条件によって、自動撮影される判定も変化する。例えば、タップ検出による起動や特定音声コマンドによる起動の場合は、ユーザが現在撮影してほしいための操作である可能性が非常に高い。そこで、撮影頻度が多くなるように設定されるようになる。

　（２）撮影方法の判定
　撮影方法の判定では、Ｓ９０１乃至Ｓ９０４において検出した、撮像装置の状態や周辺の被写体の状態に基づいて、静止画撮影、動画撮影、連写、パノラマ撮影などの内どれを実行するかの判定を行う。例えば、被写体（人物）が静止している場合は静止画撮影を実行し、被写体が動いている場合は動画撮影または連写を実行する。また、被写体が撮像装置を取り囲むように複数存在している場合や、前述したＧＰＳ情報に基づいて景勝地であることが判断できた場合には、パン・チルトを操作させながら順次撮影した画像を合成してパノラマ画像を生成するパノラマ撮影処理を実行してもよい。なお、＜自動撮影を行うかどうかの判定＞での判定方法と同様に、撮影前に検出した各種情報をニューラルネットワークに基づく判断によって、撮影方法を判定することもできるし、この判定処理は、後述する学習処理によって、判定条件を変更することができる。

　Ｓ９０９では、Ｓ９０８の自動撮影判定により撮影する判定が下された場合、Ｓ９１０に進み、下されなかった場合、撮影モード処理終了へと進む。

　Ｓ９１０では、自動撮影を開始する。この時、Ｓ９０８にて判定された撮影方法による撮影を開始する。その際、フォーカス駆動制御部２０４によるオートフォーカス制御を行う。また、不図示の絞り制御部およびセンサゲイン制御部、シャッター制御部を用いて、被写体が適切な明るさになるような露出制御を行う。さらに、撮影後には画像処理部２０７において、オートホワイトバランス処理、ノイズリダクション処理、ガンマ補正処理等、種々の画像処理を行い、画像を生成する。

　なお、この撮影の際に、所定の条件を満たした時、撮像装置が撮影対象となる人物に対し撮影を行う旨を報知処理した上で撮影する手段を取ってもよい。報知の方法は、例えば、音声出力部２１８からの音声やＬＥＤ制御部２２４によるＬＥＤ点灯光を使用してもよいし、パン・チルトを駆動することにより視覚的に被写体の視線を誘導するモーション動作をしてもよい。所定の条件は、例えば、画角内における顔の数、顔の笑顔度・目瞑り度、被写体人物の視線角度や顔角度、顔認証ＩＤ番号、個人認証登録されている人物の数党である。また、撮影時の一般物体認識結果、シーン判別結果、前回撮影時からの経過時間、撮影時刻、ＧＰＳ情報に基づく現在位置が景勝地であるか否か、撮影時の音声レベル、声を発している人物の有無、拍手、歓声が上がっているか否か等である。また、振動情報（加速度情報、撮像装置の状態）、環境情報（温度、気圧、照度、湿度、紫外線量）等である。これらの条件に基づき報知撮影を行うことによって、重要性が高いシーンにおいてカメラ目線の好ましい画像を残すことができる。

　また、所定の条件を複数もち、各条件に応じて音声を変更したり、ＬＥＤの点灯方法（色や点滅時間など）を変更したり、パン・チルトのモーション方法（動き方や駆動速度）を変更してもよい。

　このような撮影前の報知についても、撮影画像の情報、或いは撮影前に検出した各種情報をニューラルネットワークに基づく判断によって、報知の方法やタイミングを判定することもできる。また、この判定処理は、後述する学習処理によって、判定条件を変更することができる。

　Ｓ９１１では、Ｓ９１０にて生成した画像を加工したり、動画に追加したりといった編集処理を行う。画像加工については、具体的には、人物の顔や合焦位置に基づいたトリミング処理、画像の回転処理、ＨＤＲ（ハイダイナミックレンジ）効果、ボケ効果、色変換フィルタ効果などである。画像加工は、Ｓ９１０にて生成した画像を元に、上記の処理の組み合わせによって複数生成し、前記Ｓ９１０にて生成した画像とは別に保存するとしてもよい。また、動画処理については、撮影した動画または静止画を、生成済みの編集動画にスライド、ズーム、フェードの特殊効果処理をつけながら追加するといった処理をしてもよい。Ｓ９１１での編集についても、撮影画像の情報、或いは撮影前に検出した各種情報をニューラルネットワークに基づく判断によって、画像加工の方法を判定することもできるし、この判定処理は、後述する学習処理によって、判定条件を変更することができる。

　Ｓ９１２では撮影画像の学習情報生成処理を行う。ここでは、後述する学習処理に使用する情報を生成し、記録する。具体的には、今回の撮影画像における、撮影時のズーム倍率、撮影時の一般物体認識結果、顔検出結果、撮影画像に写る顔の数、顔の笑顔度・目瞑り度、顔角度、顔認証ＩＤ番号、被写体人物の視線角度等である。また、シーン判別結果、前回撮影時からの経過時間、撮影時刻、ＧＰＳ位置情報および前回撮影位置からの変化量、撮影時の音声レベル、声を発している人物、拍手、歓声が上がっているか否か等である。また、振動情報（加速度情報、撮像装置の状態）、環境情報（温度、気圧、照度、湿度、紫外線量）、動画撮影時間、手動撮影指示によるものか否か、等である。更にユーザの画像の好みを数値化したニューラルネットワークの出力であるスコアも演算する。

　これらの情報を生成し、撮影画像ファイルへタグ情報として記録する。あるいは、不揮発性メモリ２１６へ書き込むか、記録媒体２２１内に、所謂カタログデータとして各々の撮影画像の情報をリスト化した形式で保存する、としてもよい。

　Ｓ９１３では過去撮影情報の更新を行う。具体的には、Ｓ９０８の説明で述べたエリア毎の撮影枚数や、個人認証登録された人物毎の撮影枚数、一般物体認識で認識された被写体毎の撮影枚数、シーン判別のシーン毎の撮影枚数について、今回撮影された画像が該当する枚数のカウントを１つ増やす。

　（音声認識による手動撮影の例）
　上記図９のＳ９０７で、説明したとおり、ユーザ（手動）による撮影指示は、音声コマンド入力による指示もある。音声コマンド入力は、ユーザが自分自身を含む撮影を行いたい場合の音声コマンド入力（例えば「私の写真撮って」等）を含む。そして、パン・チルトやズームを用いた探索処理にて、声を発声した被写体を探索し、撮影画角内に音声コマンドを発声した被写体を含めた撮影を実行する。

　音声コマンドによるユーザ自身の撮影について、図２４にフローチャートを用いて説明する。図２４は図９のＳ９０７の処理内で判定される処理である。

　Ｓ９０７手動撮影指示処理内で、音声コマンド入力による撮影か否かの判定を行う。Ｓ２４０１では、音声処理部２１４で特定の音声コマンド入力（例えば「私の写真撮って」等）を検出したか否かを判定し、音声コマンド検出がなかった場合、Ｓ２４１６に進み、手動撮影判定はされずに音声手動撮影判定処理を終了する。Ｓ２４０１で音声コマンド検出があった場合、Ｓ２４０２に進む。

　Ｓ２４０２では、音声コマンドを検出した音の方向を算出するが、音の方向の信頼度の高い順から第１音方向、第２音方向、或いは第３第４の音方向の候補を算出する。音方向検出の精度が非常に高い場合は、複数の候補を算出して、その後の探索処理なども行う必要がない。しかし、音声コマンド検出時の周辺の騒音の状態であったり、音反射などの物体環境の影響などで、検出した音方向にはノイズが含まれていることがあり得るため、複数の候補を算出している。

　具体的には、音声コマンドを検出した時点を基準として所定時間前までに検出されたすべての音方向検出の値から算出する。予め登録された音声コマンドを発声する時間は、ある程度予測することが可能である（例えば「私の写真撮って」がコマンドの場合、コマンドを発声するのに要する時間をパラメータとして設定しておく）。上記所定時間内で検出されたすべての音方向検出値から図２５のようなヒストグラム処理にて、第１ピーク２５０１を第１音声方向、第２ピーク２５０２を第２音声方向と設定する。第１音声方向と第２音声方向をそれぞれ算出し、Ｓ２４０５に進む。

　Ｓ２４０３では、パン・チルトのリトライ設定がされているか否かを判定する。パン・チルトのリトライ設定は後のＳ２４１５でパン・チルトリトライが設定され、本フローの音声手動撮影判定処理がスタートした時点ではパン・チルトリトライ判定がされていない状態になっている。Ｓ２４０３でパン・チルトリトライが設定されていない場合、Ｓ２４０４に進み、音方向にＳ２４０２で算出した第１音声方向を音方向に設定する。Ｓ２４０３でパン・チルトリトライが設定されていると判定された場合、Ｓ２４０５に進み、音方向にＳ２４０４で算出した第２音声方向を音方向に設定する。Ｓ２４０４とＳ２４０５の処理が終了すると、Ｓ２４０６に進む。

　Ｓ２４０６では、上記設定した音方向と現在のパン・チルト角度との差が所定範囲外、即ち音方向と現在の画角中心との差が所定範囲外であるか否かを判定する。そして、所定範囲外の場合、Ｓ２４０７に進み、パン・チルトの角度を検出した音方向が画角中心にくるようにパン・チルト駆動を行い、Ｓ２４０８に進む。Ｓ２４０６で音方向と現在の画角中心との差が所定範囲内である場合は、音方向が画角内の中心付近に位置しているので、パン・チルトを駆動せずにＳ２４０８に進む。

　Ｓ２４０８では、撮影画像を画像処理解析にて主被写体が現在画角内にいるかどうかを判定する。具体的な判定方法としては以下に示す。

　（１）畳み込みニューラルネットワークによる主被写体検出
　画像認識処理の一般的な機械学習手段として、畳み込みニューラルネットワークによる主被写体検出が知られている。畳み込みニューラルネットワークによって、検出した主被写体（声掛けした被写体）の有無と、存在すれば画像上の位置情報が得られる。或いは、顔検出や人体検出結果に基づいて、各人物の領域を切り出した画像毎に畳み込みニューラルネットワークによる主被写体判定を行い、主被写体を推定してもよい。この畳み込みニューラルネットワークは、音声コマンドによる発声を行った人物の画像に基づいて予め学習されたものとして用意しておくが、後に説明する方法で使用していくうちに学習させていくこともできる。

　（２）ニューラルネットワークによる主被写体検出
　現在の画角中に写る人物毎に、被写体の特徴量を入力として与え、各人物に対して、主被写体判定を行う方法がある。その場合、顔の表情判定結果や目瞑り度、顔角度、顔認証ＩＤ番号、被写体人物の視線角度などの顔の特徴の他にも、ジェスチャー判定結果、画像シーン判結果、現在の音レベル、音シーン判定結果などを入力する特徴としてしようしてもよい。このニューラルネットワークについても、音声コマンドによる発声を行った人物の画像に基づいて被写体特徴量に基づいた学習されたものであり、後に説明する方法で使用していくうちに学習させていくこともできる。

　（３）人物毎の特徴の判定による被写体検出
　被写体は撮像装置１０１に向かって音声コマンドを発声した後であるので、カメラの方向を向いている可能性が非常に高い。そこで、顔認証ＩＤ番号、顔表情結果、顔角度、視線方向、ジェスチャー判定結果のそれぞれの検出結果に重み係数をかけ単純に判定を行ってもよい。顔認証ＩＤが登録済みの場合、主被写体である可能性が高い。顔表情の笑顔度が高い場合、主被写体である可能性が高い。顔角度や視線方向がカメラの方向を向いている場合、主被写体である可能性が高い。ジェスチャー（例えば、カメラに向かって手ふりなど）を行っている場合、主被写体である可能性が高い。何れか１つ以上の情報を用いて、主被写体を推定してもよい。

　何れかの方法を用いて、主被写体が現画角内にいるかどうかを判定することもできるし、（１）～（３）を組み合わせて判定してもよい。

　Ｓ２４０８で、画像解析を行ったらＳ２４０９に進み、Ｓ２４０８の処理にて主被写体が見つかったか否かを判定する。Ｓ２４０９にて主被写体ありと判定されると、Ｓ２４１０に進む。Ｓ２４１０では、ズームやパン・チルトを駆動して構図調整を行い、Ｓ２４１１に進む。主被写体を含む画像を撮影するのに適した構図の判定は、ニューラルネットワークによる判定を行ってもよい。また、後述する学習処理によって、各ニューロン間の結合重みを変化させることによって、出力値が変化し、判断の結果を学習結果に適応させることもできる。

　Ｓ２４１１では、手動撮影指示があったと判定し、Ｓ２４１６に進み、音声手動撮影判定処理を終了し、図９のＳ９１０に進み、撮影が開始される。

　Ｓ２４０９で現在画角内に主被写体なしと判定されると、Ｓ２４１２に進む。

　Ｓ２４１２では、Ｓ２４０７でパン・チルトを完了してから所定の時間が経過したかを判定する。Ｓ２４０６で音方向と現在画角中心が所定範囲内と判定されていた場合は、判定された時点からの時間の経過で判定する。ここで、所定時間が経過していなければ、Ｓ２４１３に進みズームによる探索を行う。音声コマンドを発声した被写体が画角内において非常に小さい場合は、顔の大きさが小さく顔に対する解像度も小さいので画像解析による検出精度に影響を及ぼしている可能性がある。そこで、その場合は画角を狭くする方向にズームを駆動して再度Ｓ２４０８からの処理を行う。また、音声コマンドを発声した被写体が画角内において大きすぎた場合は、人物の全体像が分からず、例えばジェスチャーをしているなどを考慮して判定することができない。そこで、画角を広くする方向にズームを駆動して再度Ｓ２４０８からの処理を行う。

　Ｓ２４１２で、パン・チルトを完了してから所定の時間が経過したと判定されると、設定した音方向に、音声コマンドを発声した被写体が存在していないと判断する。そして、次の候補の音方向を探索するため、Ｓ２４１４に進み、パン・チルトのリトライ動作がこれまでに行われていたかを判定し、リトライされていなければ、Ｓ２４１５に進み、パン・チルトリトライと設定し、Ｓ２４０３に戻る。このとき、パン・チルトリトライ設定がされているのでＳ２４０３での判定により、Ｓ２４０５の第２音声方向の音方向に画角を設定し、再度主被写体の探索処理を行う。図２４の例では第１音声方向と第２方向の２つの候補について探索する方法を示してあるが、第３第４の方向を検出してリトライを繰り返してもよい。

　Ｓ２４１４でパン・チルトリトライがすでにされていると判定されると、Ｓ２４１６に進み、手動撮影判定はされずに音声手動撮影判定処理を終了する。このとき、音声コマンドを検出したにも関わらず、撮影が行われなかったことをユーザに知らせるために、報知処理する手段を取ってもよい。報知の方法は、例えば、音声出力部２１８からの音声やＬＥＤ制御部２２４によるＬＥＤ点灯光を使用してもよい。また、パン・チルトを駆動することにより視覚的に被写体の視線を誘導するモーション動作をしてもよいし、スマートデバイス３０１やウエアラブルデバイス５０１へ通信し、通知する方法をとってもよい。

　図２４では、ユーザが自分自身を含む撮影を行いたい場合の音声コマンド入力を行った場合の撮影について説明した。しかしながら、音声コマンド入力は、ユーザが自分自身を主要被写体として登録されたい場合の音声コマンド入力（例えば「私を登録して」「私を追いかけて」等）でもよい。その場合、上記探索処理にて、声を発声した被写体を探索し、被写体を登録する。被写体が登録されるとその後、登録した被写体を中心に自動撮影が行われる。また、パン・チルトやズーム駆動により、画角内に登録した被写体を常に保持しながら、撮影を行うこともできる。

　被写体登録の音声コマンドを入力した場合、図２４の処理の内、Ｓ２４１１の処理を被写体登録する処理に変更することで実現可能である。

　被写体を登録する場合も、顔認証登録を行いやすい画角や、着用している衣服の色検出登録などを行いやすいように、パン・チルトやズームを駆動して検出・登録処理を行うことになる。

　また、撮像装置１０１にモニタがない場合、登録された被写体を確認することはできない。そこで、図２６に示すように、スマートデバイス３０１に被写体が登録されたことを通知するようにしてもよいし、登録された被写体の画像データも送信し、ユーザが確認できるようにしてもよい。

　被写体を登録すると通信手段２２２によりスマートデバイス３０１に、登録された旨がわかる通知２６０２を行うデータを通信２６０１する。ユーザのスマートデバイス３０１の操作により、被写体を確認すると、画像データを送信２６０３し、スマートデバイスに登録した被写体２６０４が確認できるように表示する。この確認できる表示とは、撮像装置１０１が顔認証していることを示すために、顔枠またはその近辺（下）に当該登録されている被写体２６０４の関連画像を重畳表示するようにしてもよい。動画撮影中に表示してもよいし、動画再生時に表示してもよい。

　このように登録された被写体をユーザで確認できるように通知することで、万が一登録された被写体が間違っていた場合でも、再度被写体登録をユーザに促すことができる。また、正解か不正解かが判定可能であるので、後に説明する学習処理によって、学習し、変化していくことも可能になる。

　本実施形態では、パン・チルトとズーム駆動の両方を使って、音声コマンド入力による音方向の撮影や被写体登録を説明したが、パン・チルトのみを使って撮影や被写体登録を行うこともできるし、ズーム駆動のみを使って撮影や被写体登録を行うこともできる。

　パン・チルトのみを使う場合、図２４では、Ｓ２４１２およびＳ２４１３は行われない。

　ズーム駆動のみを使う場合、音方向を検出した後、音方向が画角内に入るようにズーム駆動を設定し、またズーム駆動で主被写体を探して、撮影や被写体登録を行う。

　＜自動編集モード処理（ハイライト動画）＞
　次に、本実施形態における自動編集モード処理（ハイライト動画）について説明する。

　図７のステップ７０４のモード設定判定にて、自動編集処理（ハイライト動画）を行うか否かを判定し、自動編集処理を行う場合、ステップ７１２の自動編集モード処理を行う。

　自動編集モードの判定条件を説明する。自動編集モードに移行するか否かは、前回編集処理を行ってからの経過時間や、前回編集処理を行った時点以降で撮影された各画像のタグ情報（学習情報やユーザの画像の好みを数値化したスコアなど）に基づいて判定される。ステップ７０４のモード設定判定処理内で判定される、自動編集モードに移行すべきか否かの判定処理フローを図１０に示す。

　ステップ７０４のモード設定判定処理内で自動編集モード判定が開始指示されると、図１０の処理がスタートする。ステップ１００１では、前回自動編集処理が行われてからの経過時間ＴｉｍｅＤを取得し、ステップ１００２に進む。ステップ１００２では、前回編集処理を行った時点以降で撮影された各画像に対応した学習情報やスコアなどを取得し、ステップ１００３に進む。ステップ１００３では、ステップ１００２で取得した各データから自動編集を行うべきかどうかを判定するための評価値ＤＢを演算する。評価値の演算方法は、例えば、各画像情報から画像の特徴を抽出し、特徴の種類が多い場合は点数が高くなるようにする。また、上記自動撮影で説明したとおり各画像には、ユーザの好みを判定されたスコアが演算されており、スコアが高い画像が多い場合も点数が高くなるようにする。また、撮影された数が多くても点数は高くなるように計算する。これにより評価値はスコアの点数の高さに依存し、画像の数に依存し、特徴の種類にも異存することになる。ステップ１００４に進む。ステップ１００４では、ＴｉｍｅＤから閾値ＤＡを演算する。例えば、ＴｉｍｅＤが所定値よりも小さい場合の閾値ＤＡａが、所定値よりも大きい場合の閾値ＤＡｂよりも大きく設定されており、時間経過によって、閾値が小さくなるように設定してある。これにより、撮影データが少ない場合においても、時間経過が大きいと自動編集処理を行うようにすることで、使用時間に応じて撮像装置が自動的にハイライト動画を作成してくれるようにしてある。

　ステップ１００４の処理を終了すると、ステップ１００５に進み、評価値ＤＢが、閾値ＤＡより大きい場合、ステップ１００６に進む。前回自動編集を行った時点から、自動編集すべきデータを得ることができた、或いは時間経過が大きく、自動編集を行うべきだと判定された場合であるので、自動編集モードをＴＲＵＥにして、自動編集モード判定を終了する。ステップ１００５で、評価値ＤＢが閾値ＤＡ以下である場合は、自動編集すべきデータが揃っていないと判定され、自動編集処理は行わないように自動編集モード判定をＦＡＬＳＥにし、自動編集モード判定処理を終了する。

　次に自動編集モード処理（ステップ７１２）内の処理について説明する。自動編集モード処理の詳細なフローを図１１に示す。

　Ｓ１１０１にて、記録媒体２２１に保存された静止画像、動画像の選抜処理を第１制御部２２３で実施し編集に使用する画像を選抜し、Ｓ１１０２へ進む。

　ここでいう画像選抜処理とは、撮影された静止画像、動画像の中の顔の数、顔のサイズ、色群などのメタデータを画像毎に抽出を行い、評価値に換算し定めた閾値以上のものを列挙する事とする。後述する学習により、静止画像及び動画像の選抜比率を決定し、ユーザの設定、撮影頻度、各設定を顧みて優先的に選抜を行うようにする。

　Ｓ１１０２にて、Ｓ１１０１で選抜された画像に対して第１制御部２２３、画像処理部２０７で画像効果付与を行いＳ１１０３に進む。

　ここでいう画像効果付与とは、静止画像において、人物の顔や合焦位置の中心でのトリミング処理、画像の回転処理、ＨＤＲ（ハイダイナミックレンジ）効果、ボケ効果、スライド、ズーム、フェードの特殊効果処理、色フィルタ効果などとする。

　動画像においても同様に色フィルタ付与を行う。

　Ｓ１１０３にて、第１制御部２２３にて画像再生時間の設定を行いＳ１１０４に進む。Ｓ１１０１にて選抜された画像を用いて、Ｓ１１０５で説明するハイライト動画を作成のため、後述する学習に基づいて適切な画像の再生時間を設定する。

　Ｓ１１０４にて、第１制御部２２３にてＳ１１０５で説明するハイライト動画に付与する音楽（ＢＧＭ）の設定を行いＳ１１０５に進む。音楽（ＢＧＭ）の設定についても後述する学習した結果よりユーザへ提供する最も適切なものを設定する事とする。

　Ｓ１１０５にて、第１制御部２２３にてＳ１１０１からＳ１１０４で行った結果を用いて一連のハイライト動画作成を行う。作成したハイライト動画は、記録媒体２２１に保存する。

　なお、上記説明した画像の選抜や、画像効果付与や、再生時間やＢＧＭ選択は、各画像に付加されているタグ情報（撮影画像の情報、或いは撮影前に検出した各種情報）から、ニューラルネットワークに基づく判断によって、判定することができる。また、この判定処理は、後述する学習処理によって、判定条件を変更することもできる。

　＜ファイル自動削除モード処理＞
　次に、本実施形態におけるファイル自動削除モードの処理について説明する。

　本実施形態では、記録媒体の空き容量がなくなると撮影ができず、ユーザの意図したときに撮影ができなかったり、自動撮影において狙ったシーンを撮影することができなかったりする恐れがある。ユーザ操作により画像を削除することも可能だが、煩雑である。そこで、以下説明する処理によって条件に応じた撮影画像の自動削除を行う必要がある。その一方でユーザが後で必要とする画像を削除してしまう恐れもあるため、適切な画像を選択して削除を行う必要がある。

　図２９のファイル自動削除モードの処理フローの一例によって処理を説明する。

　Ｓ２９０１では記憶媒体の空き容量を確認する。Ｓ２９０２では記憶媒体の空き容量に応じて目標の削除枚数を決定する。目標の削除枚数は、例えば空き容量が少ないほど多く、撮影頻度の設定が高いほど多く設定する。なお、後述する学習によって変化させてもよい。Ｓ２９０３では、後述するユーザの画像の好みを数値化したスコアの降順に記憶媒体内に保存されている撮影済み画像をソートしたリストを作成する。Ｓ２９０４からは、ソートしたリストの上位から下位に向かって一枚ずつ画像を削除するかどうかを判定し、削除する処理を実行する。Ｓ２９０５ではリスト上の対象の画像が削除条件に該当するかどうかを判定する。

　削除する条件は、例えば、ユーザが手動撮影した画像でないこと、ユーザが高評価をつけた画ではないことを用いてもよい。これらは、ユーザが気に入っているか、あとから必要とする可能性のある画であるため削除条件から除外することが望ましい。

　また、自動転送モードでスマートデバイスなど外部通信機器に転送済みであることや、ユーザが外部通信機器からその画像を閲覧していないこと、などを用いてもよい。転送済みであれば、転送先の画像を利用可能であるため、削除してもユーザの不利益にはなりにくい。また、ユーザが一度も閲覧していない自動撮影画像は、ユーザが認知していないため、画像を削除しても不利益を感じることはないと考えられる。削除条件に該当する場合は、Ｓ２９０６に進み、画像を削除した後Ｓ２９０７に進む。該当しない場合は、削除を行わずＳ２９０７に進む。Ｓ２９０７では、削除目標枚数を達成しているかどうかを判別する。達成していれば自動削除モードの処理を終了する。達成していなければ、Ｓ２９０４に戻り、リストの次の順位の画像について、順次処理を繰り返す。Ｓ２９０４にてリスト上に対象とする画像がなくなれば処理を終了する。

　＜学習モード処理＞
　次に、本実施形態におけるユーザの好みに合わせた学習について説明する。

　本実施形態では、図１２に示すようなニューラルネットワークを用い、機械学習アルゴリズムを使用して、学習処理部２１９にてユーザの好みに合わせた学習を行う。ニューラルネットワークは、入力値から出力値を予測することに使用されるものであり、予め入力値の実績値と出力値の実績値を学習しておくことで、新たな入力値に対して、出力値を推定することができる。ニューラルネットワークを用いることにより、前述の自動撮影や自動編集、被写体探索に対して、ユーザの好みに合わせた学習を行う。

　また、ニューラルネットワークに入力する特徴データともなる被写体登録（顔認証や一般物体認識など）を登録したり、撮影報知制御や低消費電力モード制御やファイル自動削除を学習によって変更することも行う。

　本実施形態において、学習処理により、学習される要素は以下である。

　（１）自動撮影
　自動撮影に対する学習について説明する。自動撮影では、ユーザの好みに合った画像の撮影を自動で行うための学習を行う。図９のフローを用いた説明で上述したように、撮影後（ステップＳ９１２）に学習情報生成処理が行われている。後述する方法により学習させる画像を選択させ、画像に含まれる学習情報を基に、ニューラルネットワークの重みを変化させることで学習する。学習は、自動撮影タイミングの判定を行うニューラルネットワークの変更と、撮影方法（静止画撮影、動画撮影、連写、パノラマ撮影など）の判定をニューラルネットワークの変更で行われる。

　（２）自動編集
　自動編集に対する学習について説明する。自動編集は、図９のステップ９１１での撮影直後の編集と、図１１で説明したハイライト動画の編集のそれぞれに対して学習が行われる。撮影直後の編集について説明する。後述する方法により学習させる画像を選択させ、画像に含まれる学習情報を基に、ニューラルネットワークの重みを変化させることで学習する。撮影或いは撮影直前の情報により得られた各種検出情報をニューラルネットワークに入力し、編集方法（トリミング処理、画像の回転処理、ＨＤＲ（ハイダイナミックレンジ）効果、ボケ効果、色変換フィルタ効果など）の判定を行う。ハイライト動画の編集について説明する。ハイライト動画は、ユーザの好みに合ったアルバム動画作成を自動で行うための学習を行う。後述する方法により学習させる画像を選択させ、画像に含まれる学習情報を基に、ニューラルネットワークの重みを変化させることで学習する。撮影或いは撮影直前の情報により得られた各種検出情報をニューラルネットワークに入力し、画像効果付与（トリミング処理、回転処理、ＨＤＲ効果、ボケ効果、スライド、ズーム、フェード、色変換フィルタ効果、ＢＧＭ、時間、静止画動画比率）の判定を行う。

　（３）被写体探索
　被写体探索に対する学習について説明する。被写体探索では、ユーザの好みに合った被写体の探索を自動で行うための学習を行う。図９のフローを用いた説明で上述したように、被写体探索処理（ステップＳ９０４）において、各エリアの重要度レベルを算出し、パン・チルト、ズームを駆動し、被写体探索を行っている。学習は撮影画像や探索中の検出情報によって学習され、ニューラルネットワークの重みを変化させることで学習する。探索動作中の各種検出情報をニューラルネットワークに入力し、重要度レベルの算出を行い、重要度レベルに基づきパン・チルトの角度を設定することで学習を反映した被写体探索を行う。また、重要度レベルに基づくパン・チルト角度の設定以外にも、例えば、パン・チルト駆動（速度、加速度、動かす頻度）の学習も行う。

　（４）被写体登録
　被写体登録に対する学習について説明する。被写体登録では、ユーザの好みに合った被写体の登録やランク付けを自動で行うための学習を行う。学習として、例えば、顔認証登録や一般物体認識の登録、ジェスチャーや音声認識、音によるシーン認識の登録を行う。認証登録は人と物体に対する認証登録を行い、画像取得される回数や頻度、手動撮影される回数や頻度、探索中の被写体の現れる頻度からランク設定を行う。登録された情報は、各ニューラルネットワークを用いた判定の入力として登録されることになる。

　（５）撮影報知制御
　撮影報知に対する学習について説明する。図９のＳ９１０で説明したように、撮影直前に、所定の条件を満たしたとき、撮像装置が撮影対象となる人物に対して撮影を行う旨を報知した上で撮影することも行う。例えば、パン・チルトを駆動することにより視覚的に被写体の視線を誘導するモーションや、音声出力部２１８から発するスピーカー音や、ＬＥＤ制御部２２４によるＬＥＤ点灯光を使用する。上記報知の直後に被写体の検出情報（例えば、笑顔度、目線検出、ジェスチャー）が得られたか否かで、検出情報を学習に使用するかを判定し、ニューラルネットワークの重みを変化させることで学習する。または、後述する方法により学習させる画像を選択させ、画像に含まれる学習情報を基に、ニューラルネットワークの重みを変化させることで学習する。画像には、撮影直前にどのように報知動作が行われたかの情報が埋め込まれており、選択された画像に付加された検出情報や上記撮影直前の報知動作情報を教師データとして学習する。撮影直前の各検出情報をニューラルネットワークに入力し、報知を行うか否かの判定や、各報知動作（音（音レベル／音の種類／タイミング）、ＬＥＤ光（色、点灯時間、点滅間隔）、パン・チルトモーション（動き方、駆動速度））の判定を行う。各報知動作の学習については、予め用意された報知方法（音、ＬＥＤ光、パン・チルトモーションの複合動作）の中からどの報知を行うかを選択する学習を行う方法でもよい。また、音、ＬＥＤ光、パン・チルトモーションの各報知動作それぞれに対して別々のニューラルネットワークを設けてそれぞれの動作を学習する方法でもよい。

　（６）低消費電力モード制御
　図７、図８を用いて、説明したようにＭａｉｎプロセッサ（第１制御部２２３）の供給電源をＯＮ／ＯＦＦする制御を行うが、低消費電力モードからの復帰条件や、低消費電力状態への遷移条件の学習が行われる。

　まず、低消費電力モードを解除する条件の学習について説明する。

　［タップ検出］
　上述したとおり、所定時間ＴｉｍｅＡや所定閾値ＴｈｒｅｓｈＡを学習により変化させる。上記のタップ検出の閾値を下げた状態での仮タップ検出も行っており、タップ検出前に仮タップ検出が判定されていたか否かで、ＴｉｍｅＡやＴｈｒｅｓｈＡのパラメータを検出し易いように設定する。また、タップ検出後の検出情報から、起動要因ではなかった（上述した被写体探索や自動撮影判定の結果、撮影対象がいない）と判定されると、ＴｉｍｅＡやＴｈｒｅｓｈＡのパラメータを検出し難いように設定する。起動時の撮影対象がいるか否かの判定は後述する学習方法により学習された画像に埋め込まれた被写体検出情報により変化することになる。

　［揺れ状態検出］
　上述したとおり、所定時間ＴｉｍｅＢや所定閾値ＴｈｒｅｓｈＢや所定回数ＣｏｕｎｔＢなど学習により変化させる。揺れ状態により起動条件に入った場合、起動を行うが、起動後所定時間間の検出情報から、起動要因ではなかった（上述した被写体探索や自動撮影判定の結果、撮影対象がいない）と判定されると、揺れ状態判定のパラメータを変更し、起動し難いように学習する。また、揺れが大きい状態での撮影頻度が高いと判定されると、揺れ状態判定により起動し易いように設定する。起動時の撮影対象がいるか否かの判定や、揺れが大きい状態での撮影頻度が多いかの判定は、後述する学習方法により学習された画像に埋め込まれた被写体検出情報や撮影時の揺れ情報などにより変化することになる。

　［音検出］
　ユーザが検出したい特定音声や、特定音シーンや、特定音レベルを、例えば外部機器３０１の専用アプリケーションと通信を介して、手動で設定することでの学習ができる。また、複数の検出を音声処理部に予め設定しておき、後述する方法により学習させる画像を選択させ、画像に含まれる撮影前後の音情報などの学習情報を基に、学習する。これにより、起動要因とする音判定（特定音コマンドや、「歓声」「拍手」などの音シーン）を設定でき、音検出による起動を学習することができる。

　［環境情報検出］
　ユーザが起動したい環境情報変化の条件を、例えば外部機器３０１の専用アプリケーションと通信を介して、手動で設定することでの学習ができる。例えば、温度や気圧や明るさや湿度や紫外線量の絶対量や変化量の特定条件によって起動させることができる。また、各環境情報に基づく、判定閾値を学習することもできる。環境情報による起動後後の検出情報から、起動要因ではなかった（上述した被写体探索や自動撮影判定の結果、撮影対象がいない）と判定されると、各判定閾値のパラメータを検出し難いように設定したりする。或いは、後述する学習方法により学習された画像に埋め込まれた各環境の情報から学習することで、環境情報による起動を学習することができる。例えば、温度上昇時において撮影された画像を多く学習させた場合、温度上昇時に駆動し易いように学習がされることになる。また、上記各パラメータは、電池の残容量によっても変化する。例えば、電池残量が少ないときは各種判定に入り難くなり、電池残量が多いときは各種判定に入り易くなる。具体的には、ユーザが必ず撮像装置を起動してほしい要因でない条件である揺れ状態検出結果や、音検出の音シーン検出は、電池残量によって各検出判定のし易さが変化することになる。

　次に、低消費電力状態への遷移条件の学習について説明する。

　図７に示したとおり、モード設定判定７０４で、「自動撮影モード」「自動編集モード」「画像自動転送モード」「学習モード」「ファイル自動削除モード」の何れでもないと判定されると、低消費電力モードに入る。各モードの判定条件については、上述したとおりであるが、各モードを判定される条件についても学習によって変化する。自動撮影モードについては、上述したとおり、エリア毎の重要度レベルを判定し、パン・チルトで被写体探索をしながら自動撮影を行う。エリア毎の重要度レベルは、エリア内の人物や物体などの被写体の数や大きさなどによって算出されるため、周囲に被写体がいないようなシチュエーションでは、すべてのエリアの重要度レベルが低くなる。そこで、例えば、すべてのエリアの重要度レベルや、各エリアの重要度レベルを加算した値が、所定閾値以下かどうかという条件に基づいて自動撮影モードを解除するとしてもよい。これによって、周囲に被写体がいないような撮影の必要性が低いシチュエーションにおいて、自動撮影モードを解除し、低消費電力状態へ移行することができる。このとき、自動撮影モードに遷移してからの経過時間によって所定閾値を下げていってもよい。自動撮影モードに遷移してから経過時間が大きくなるにつれて低消費電力モードへ移行し易くしている。また、電池の残容量によって所定閾値を変化させることで、電池もちを考慮した低消費電力モード制御を行うことができる。例えば、電池残量が少ないときは閾値が小さくなり、電池残量が多いときは閾値が大きくなる。ここで、前回自動撮影モードに遷移してからの経過時間と撮影枚数によって、Ｓｕｂプロセッサに対して、次回低消費電力モード解除条件のパラメータ（経過時間閾値ＴｉｍｅＣ）を設定する。

　上記の各閾値は学習によって変化する。学習は、例えば外部機器３０１の専用アプリケーションと通信を介して、手動で撮影頻度や起動頻度などを設定することで、学習ができる。また、撮像装置１０１電源ボタンをＯＮしてから、電源ボタンをＯＦＦするまでの経過時間の平均値や時間帯ごとの分布データを蓄積し、各パラメータを学習する構成にしてもよい。その場合、電源ＯＮからＯＦＦまでの時間が短いユーザに対しては低消費電力モードからの復帰や、低消費電力状態への遷移の時間間隔が短くなり、電源ＯＮからＯＦＦまでの時間が長いユーザに対しては間隔が長くなるように学習される。また、探索中の検出情報によっても学習される。学習によって設定された重要となる被写体が多いと判断されている間は、低消費電力モードからの復帰や、低消費電力状態への遷移の時間間隔が短くなり、重要となる被写体が少ない間は、間隔が長くなるように学習される。

　（７）ファイル自動削除
　ファイル自動削除に対する学習について説明する。ファイル自動削除では、ファイルの空き容量や優先して削除する画像の選択などについて学習を行う。後述する方法により学習させる画像を選択させ、画像に含まれる学習情報を基に、ニューラルネットワークの重みを変化させることで学習することができる。上述したように、上記自動撮影で説明したとおり各画像には、ユーザの好みを判定されたスコアが演算されており、スコアが低い画像が優先して記録媒体２２１から削除される。また、スコアの点数だけでなく、記録媒体２２１内の各画像に埋め込まれた撮影日時や、後述する方法で、選択されたハイライト動画（自動編集された動画）の編集内容によって学習する。例えば、取得されたハイライト動画が、短い時間間隔で撮影された画像が多い場合、撮影された日時が古いファイルが優先的に削除されるが、長い時間間隔で撮影された画像を含む場合、日時が古くてもスコアの高いファイルは削除しないように学習される。或いは、逐次所定時間間隔で、記録媒体２２１内の各画像のスコアを再計算するようにする。スコア算出時のニューラルネットワークには撮影日時情報も入力されており、短い時間間隔で撮影された画像が多い場合、撮影日時が古いファイルはスコアが低くなるように学習される。これにより、優先的に削除されるようになり、長い時間間隔で撮影された画像を含む場合、日時が古くてもスコアは低くならないように学習されることで、日時が古くてもスコアの高いファイルは削除しないように学習される。他の例では、後述する方法で学習させる画像が選択されるが、選択される画像の日時が比較的新しいものを集中して選択されることが多い場合、撮影された日時が古いファイルを優先的に削除される。しかし、選択される画像の日時が古いものも選択されることが多い場合は、日時が古くてもスコアの高いファイルは削除しないように学習する。他の例では、撮影頻度が多くなるように学習されている場合は、ファイルの空き領域を多くとるようにファイルが自動削除され、撮影頻度が少なくなるように学習されている場合は、ファイルの空き領域は少なくていいようにファイルの自動削除が行われる。他の例では、動画の撮影頻度が多くなるように学習されている場合、ファイルの空き領域を多くとるようにファイルが自動削除され、静止画の撮影頻度が多くなるように学習されている場合、ファイルの空き領域は少なくなるようにファイルの自動削除が行われる。

　（８）像揺れ補正
　像揺れ補正に対する学習について説明する。像揺れ補正は、図９のＳ９０２で補正量を算出し、補正量に基づいてＳ９０５でパン・チルトを駆動することにより、像揺れ補正を行う。像揺れ補正では、ユーザの揺れの特徴に合わせた補正を行うための学習を行う。撮影画像に対して、例えば、ＰＳＦ（Ｐｏｉｎｔ　Ｓｐｒｅａｄ　Ｆｕｎｃｔｉｏｎ）を推定することにより、ブレの方向及び大きさを推定することが可能である。図９のＳ９１２の学習用情報生成では、推定したブレの方向と大きさが、情報として画像に付加されている。図７のステップ７１６での学習モード処理内では、推定したブレの方向と大きさを出力として、撮影時の各検出情報を入力として、揺れ補正用のニューラルネットワークの重みを学習させる。撮影時の各検出情報とは、撮影前所定時間における画像の動きベクトル情報や、検出した被写体（人や物体）の動き情報、振動情報（ジャイロ出力、加速度出力、撮像装置の状態）等である。他にも、環境情報（温度、気圧、照度、湿度）、音情報（音シーン判定、特定音声検出、音レベル変化）、時間情報（起動からの経過時間、前回撮影時からの経過時間）、場所情報（ＧＰＳ位置情報、位置移動変化量）なども入力に加えて判定してもよい。Ｓ９０２での補正量算出時において、上記各検出情報をニューラルネットワークに入力することで、その瞬間撮影したときのブレの大きさを推定することができ、推定したブレの大きさが大きいときは、シャッター速度を短くするなどの制御が可能となる。また、推定したブレの大きさが大きいときはブレ画像になってしまうので撮影を禁止するなどの方法もとれる。また、パン・チルト駆動角度には制限があるため、駆動端に到達してしまうとそれ以上補正を行うことができないが、上記のように撮影時のブレの大きさと方向を推定することで、露光中揺れ補正するためのパン・チルト駆動に必要な範囲を推定できる。露光中可動範囲の余裕がない場合は、揺れ補正量を算出するフィルタのカットオフ周波数を大きくして、可動範囲を超えないように設定することで、大きなブレを抑制することもできる。また、可動範囲を超えそうな場合は、露光直前にパン・チルトの角度を可動範囲を超えそうな方向とは逆の方向に回転してから、露光開始することで、可動範囲を確保してブレない撮影を行うこともできる。これにより、ユーザの撮影時の特徴や使い方に合わせて揺れ補正を学習することができるので、ブレのない画像を撮影することができる。また、上述した「撮影方法の判定」において、流し撮り撮影を行うか否かを判定し、撮影前までの検出情報から、被写体がブレなく撮影するためのパン・チルト駆動速度を推定して、被写体ブレ補正を行ってもよい。ここで、流し撮り撮影は、動いている被写体はブレがなく、動いていない背景が流れる撮影である。その場合、上記各検出情報をニューラルネットワークに入力することで、静止画像撮影中の駆動速度を推定する。学習は、画像を各ブロックで分割して、各ブロックのＰＳＦを推定することで、主被写体が位置するブロックでのブレの方向及び大きさを推定し、その情報を基に学習することができる。また、後述する学習方法により、選択された画像の背景の流れ量に基づいて、背景の流し量を学習することもできる。その場合、選択された画像の中で、主被写体が位置しないブロックでのブレの大きさを推定し、その情報を基にユーザの好みを学習することができる。学習した好みの背景流し量に基づいて、撮影時のシャッター速度を設定することで、ユーザの好みにあった流し撮り効果が得られる撮影を自動で行うことができる。

　（９）画像自動転送
　画像自動転送に対する学習について説明する。画像自動転送では、記録媒体２２１に記録された画像の中から、優先して転送する画像の選択処理や転送頻度などについて学習を行う。後述する方法により学習させる画像を選択させ、画像に含まれる学習情報を基に、ニューラルネットワークの重みを変化させることで学習することができる。上述したように、上記自動撮影で説明したとおり各画像には、ユーザの好みを判定されたスコアが演算されており、スコアが高い画像が優先して画像転送する。また、過去に画像転送した画像に対応した学習情報も画像転送判定に使用する。後述する方法で学習させる画像が選択されると、画像に含まれる学習情報（特徴量）の何を重要視するかが設定され、過去に画像転送した画像が同じような特徴量を含むものが多い場合、別の特徴量を含み且つスコアの高い画像を転送するように設定する。また、撮像装置の各状態に応じて、画像転送頻度も変化する。電池の残容量によって変化する。例えば、電池残量が少ないときは、画像転送され難く、電池残量が多いときは、画像転送しやすくなるように設定される。具体的に例えば、前回自動転送された時からの経過時間と、その経過時間の間で撮影された画像の中で最も高いスコアとを乗算し、乗算した値が閾値を超えた時に画像転送するようにしておき、閾値を電池残量によって変化するような構成をとっても実現できる。他の例では、撮像装置１０１が設定された撮影頻度に応じて、画像自動転送の頻度を変更する。撮影頻度が多くなるように学習されている場合は、画像自動転送の頻度も多くなるように設定され、撮影頻度が少なくなるように学習されている場合は、画像自動転送の頻度も少なくなるように設定される。このとき撮影頻度によって上記閾値を変化させることで撮影頻度設定に応じた画像転送頻度を変更できる。他の例では、ファイル（記録媒体２２１）の空き容量に応じて、画像自動転送の頻度を変更することも行われる。ファイルの空き容量が多い場合は、画像自動転送の頻度は少なく、ファイルの空き容量が少ない場合は、画像自動転頻度が多くなるように設定される。このときファイル空き容量によって上記閾値を変化させることでファイル空き容量に応じた画像転送頻度を変更できる。

　次に、学習方法について説明する。

　学習方法としては、「撮像装置内の学習」と「通信機器との連携による学習」がある。

　撮像装置内学習の方法について、以下説明する。

　（１）ユーザによる撮影指示時の検出情報による学習
　図９のステップＳ９０７乃至Ｓ９１３で説明したとおり、本実施形態においては、撮像装置１０１は、手動撮影と自動撮影の２つの撮影を行うことができる。ステップＳ９０７で手動操作による撮影指示（上記説明したとおり、３つの判定に基づいて行う）があった場合は、ステップＳ９１２において、撮影画像は手動で撮影された画像であるとの情報が付加される。また、ステップＳ９０９にて自動撮影ＯＮと判定されて撮影された場合においては、ステップＳ９１２において、撮影画像は自動で撮影された画像であると情報が付加される。

　ここで手動撮影される場合、ユーザの好みの被写体、好みのシーン、好みの場所や時間間隔を基に撮影された可能性が非常に高い。よって、手動撮影時に得られた各特徴データや撮影画像の学習情報を基とした学習が行われるようにする。

　また、手動撮影時の検出情報から、撮影画像における特徴量の抽出や個人認証の登録、個人ごとの表情の登録、人の組み合わせの登録に関して学習を行う。また、被写体探索時の検出情報からは、例えば、個人登録された被写体の表情から、近くの人や物体の重要度を変更するような学習を行う。また、図１７乃至図２２を用いて後述する「ユーザが手でパン・チルトを回転させること」によっても、画角の変化が指示された場合には、回転後に画角内に存在する被写体を学習する。これも、手動操作の検出情報による学習の一部である。

　（２）被写体探索時の検出情報による学習
　被写体探索動作中において、個人認証登録されている被写体が、どんな人物、物体、シーンと同時に写っているかを判定し、同時に画角内に写っている時間比率を演算しておく。

　例えば、個人認証登録被写体の人物Ａが個人認証登録被写体の人物Ｂと同時に写っている時間比率が所定閾値よりも高い場合重要度が高いと判定できる。このため、人物Ａと人物Ｂが画角内に入る場合は、自動撮影判定の点数が高くなるように各種検出情報を学習データとして保存して学習モード処理７１６で学習する。

　他の例では、個人認証登録被写体の人物Ａが一般物体認識により判定された被写体「猫」と同時に写っている時間比率が所定閾値よりも高い場合、重要度が高いと判定できる。このため、人物Ａと「猫」が画角内に入る場合は、自動撮影判定の点数が高くなるように各種検出情報を学習データとして保存する。そして、学習モード処理７１６で学習する。

　このように、探索中の被写体の現れる頻度が高い場合に、自動撮影判定の点数が高くなるようにすると、個人認証登録されている被写体の近くの人や物体の重要度も、高くなるように変更することができる。

　また、個人認証登録被写体の人物Ａの笑顔度を検出したり、表情を検出により「喜び」「驚き」などが検出されたとき、同時に写っている被写体は重要であるように学習される処理が行われる。また、表情が「怒り」「真顔」などが検出されたときの、同時に写っている被写体は重要である可能性が低いので学習することはしないなどの処理が行われる。

　次に、本実施形態における外部通信機器との連携による学習を説明する。

　本実施形態における外部通信機器との連携による学習には、以下の方法がある。

　（３）外部通信機器で画像を取得したことによる学習
　図３で説明したとおり、撮像装置１０１と外部機器３０１は、通信３０２、３０３の通信手段を有している。主に通信３０２によって画像の送受信が行われ、外部機器３０１内の専用のアプリケーションを介して、撮像装置１０１内の画像を外部機器３０１に通信取得することができる。また、撮像装置１０１内の保存されている画像データのサムネイル画像を外部機器３０１内の専用のアプリケーションを介して、閲覧可能な構成である。これにより、ユーザはサムネイル画像の中から、自分が気に入った画像を選択して、画像確認し、画像取得指示を操作することで外部機器３０１に画像取得できる。

　このとき、ユーザが画像を選んで送信指示し取得しているので、取得された画像はユーザの好みの画像である可能性が非常に高い。よって取得された画像は、学習すべき画像であると判定し、取得された画像の学習情報を基に学習することでユーザの好みの各種学習を行うことができる。

　操作例を説明する。スマートデバイスである外部機器３０１の専用のアプリケーションを介して、撮像装置１０１内の画像を閲覧している例を図１６に示す。表示部４０７に撮像装置内に保存されている画像データのサムネイル画像（１６０４乃至１６０９）を表示してあり、ユーザは自分が気に入った画像を選択し画像取得を行える。このとき、表示方法を変更する表示方法変更部（１６０１、１６０２、１６０３）が設けられている。１６０１を押下すると表示順序が日時優先表示モードに変更され、撮像装置１０１内画像の撮影日時の順番で表示部４０７に画像が表示される（例えば、１６０４は日時が新しく、１６０９が日時は古いように表示される）。１６０２を押下するとおすすめ画像優先表示モードに変更される。図９ステップＳ９１２で演算した各画像に対してユーザの好みを判定したスコアに基づいて、撮像装置１０１内画像のスコアの高い順番で表示部４０７に画像が表示される（例えば、１６０４はスコアが高く、１６０９がスコアは低いように表示される）。１６０３を押下すると人物や物体被写体を指定でき、続いて特定の人物や物体被写体を指定すると特定の被写体のみを表示することもできる。

　１６０１乃至１６０３は同時に設定をＯＮすることもでき、例えばすべての設定がＯＮされている場合、指定された被写体のみを表示し、且つ、撮影日時が新しい画像が優先され、且つ、スコアの高い画像が優先され、表示されることになる。

　このように、撮影画像に対してもユーザの好みを学習しているため、撮影された大量の画像の中から簡単な確認作業でユーザの好みの画像のみを簡単に抽出することが可能である。

　（４）外部通信機器を介して、画像に判定値を入力することによる学習
　上記で説明したとおり、撮像装置１０１と外部機器３０１は、通信手段を有しており、撮像装置１０１内の保存されている画像を外部機器３０１内の専用のアプリケーションを介して、閲覧可能な構成である。ここで、ユーザは、各画像に対して点数付を行う構成にしてもよい。ユーザが好みと思った画像に対して高い点数（例えば５点）を付けたり、好みでないと思った画像に対して低い点数（例えば１点）を付けることができ、ユーザの操作によって、撮像装置が学習していくような構成にする。各画像の点数は、撮像装置内で学習情報と共に再学習に使用する。指定した画像情報からの特徴データを入力した際のニューラルネットワークの出力が、ユーザが指定した点数に近づくように学習される。

　本実施形態では、通信機器３０１を介して、撮影済み画像にユーザが判定値を入力する構成にしたが、撮像装置１０１を操作して、直接、画像に判定値を入力する構成にしてもよい。その場合、例えば、撮像装置１０１にタッチパネルディスプレイを設け、タッチパネルディスプレイ画面表示部に表示されたＧＵＩボタンをユーザが押下して、撮影済み画像を表示するモードに設定する。そして、ユーザは撮影済み画像を確認しながら、各画像に判定値を入力するなどの方法により、同様の学習を行うことができる。

　（５）外部通信機器内の保存されている画像を解析することによる学習
　外部機器３０１は、記憶部４０４を有し、記憶部４０４には撮像装置１０１で撮影された画像以外の画像も記録される構成とする。このとき、外部機器３０１内に保存されている画像は、ユーザが閲覧し易く、公衆回線制御部４０６を介して、共有サーバに画像をアップロードすることも容易なため、ユーザの好みの画像が多く含まれる可能性が非常に高い。

　外部機器３０１は専用のアプリケーションを介して、記憶部４０４に保存されている画像を、撮像装置１０１内での学習処理部２１９と同等の学習処理を制御部４１１により処理可能な構成にしてもよい。この場合、処理された学習用データを撮像装置１０１に通信することで、学習する構成にできる。また、撮像装置１０１に学習させたい画像やデータを送信して、撮像装置１０１内で学習するような構成にしてもよい。

　また、専用のアプリケーションを介して、記憶部４０４に保存されている画像の中から、学習させたい画像をユーザが選択して、学習する構成にすることもできる。

　（６）外部通信機器で、ＳＮＳのサーバにアップロードされた情報からの学習
　人と人の繋がりに主眼をおいた社会的なネットワークを構築できるサービスやウェブサイトであるソーシャル・ネットワーキング・サービス（ＳＮＳ）における情報を学習に使用する方法について説明する。画像をＳＮＳにアップロードする際に、スマートデバイスから画像に関するタグを入力した上で、画像と共に送信する技術がある。また、他のユーザがアップロードした画像に対して好き嫌いを入力する技術もあり、他のユーザがアップロードした画像が、外部機器３０１を所有するユーザの好みの写真であるかも判定できる。

　外部機器３０１内にダウンロードされた専用のＳＮＳアプリケーションで、上記のようにユーザが自らアップロードした画像と画像についての情報を取得することができる。また、ユーザが他のユーザがアップロードした画像に対して好きかどうかを入力することにより、ユーザの好みの画像やタグ情報を取得することもできる。それらの画像やタグ情報を解析し、撮像装置１０１内で学習セットできるようにする構成にする。

　上記のようにユーザがアップロードした画像や、ユーザが好きと判定した画像を取得し、撮像装置１０１内での学習処理部２１９と同等の学習処理を制御部４１１により処理可能な構成にしてもよい。これにより、処理された学習用データを撮像装置１０１に通信することで、学習する構成にすることもできる。もしくは、撮像装置１０１に学習させたい画像を送信して、撮像装置１０１内で学習するような構成にしてもよい。

　また、タグ情報から、ＳＮＳ内に設けられた画像フィルタから、図７の自動編集モード処理７１２や図９の編集Ｓ９１１の、色変換フィルタ効果が変化するように学習する。

　或いは、タグ情報に設定された被写体情報から、ユーザが好みであろう被写体情報を推定し、ニューラルネットワークに入力する検出すべき被写体として登録することによる学習を行う。この被写体情報は、例えば、犬、猫など被写体物体情報や、ビーチなどのシーン情報や、スマイルなどの表情情報などが考えられる。

　また、上記ＳＮＳでのタグ情報（画像フィルタ情報や被写体情報）の統計値から、世の中で今現在流行っている画像情報を推定し、撮像装置１０１内で学習セットできるようにする構成にすることもできる。

　（７）外部通信機器で、パラメータを変更することによる学習
　上記で説明したとおり、撮像装置１０１と外部機器３０１は、通信手段を有しており、撮像装置１０１内に現在設定されている学習パラメータを外部機器３０１に通信し、外部機器３０１の記憶部４０４に保存することができる。学習パラメータとしては、例えば、ニューラルネットワークの重みや、ニューラルネットワークに入力する被写体の選択などが考えられる。また、外部機器３０１内の専用のアプリケーションを介して、専用のサーバにセットされた学習パラメータを公衆回線制御部４０６を介して取得して、撮像装置１０１内の学習パラメータに設定することもできる構成とする。これにより、ある時点でのパラメータを外部機器３０１に保存しておいて、撮像装置１０１に設定することで学習パラメータを戻すこともできるし、他のユーザが持つ学習パラメータを専用のサーバを介して取得し自身の撮像装置１０１に設定することもできる。

　また、外部機器３０１の専用のアプリケーションを介して、ユーザが登録した音声コマンドや認証登録、ジェスチャーを登録できるようにしてもよいし、重要な場所を登録してもよい。これらの情報は、自動撮影モード処理（図９）で説明した撮影トリガが自動撮影判定の入力データとして扱われる。

　また、撮影頻度や起動間隔、静止画動画割合や好みの画像など設定することができる構成にし、＜低消費電力モード制御＞で説明した起動間隔や、＜自動編集＞で説明した静止画動画割合などの設定を行ってもよい。

　（８）外部通信機器で、画像を手動編集された情報からの学習
　外部機器３０１の専用のアプリケーションにユーザの操作により手動で編集できる機能を持たせ、編集作業の内容を学習にフィードバックすることもできる。例えば、画像効果付与の編集が可能であり、画像の学習情報に対して、手動で編集した画像効果付与が判定されるように、自動編集のニューラルネットワークを学習させる。画像効果は、例えば、トリミング処理、回転処理、スライド、ズーム、フェード、色変換フィルタ効果、時間、静止画動画比率、ＢＧＭが考えられる。

　ここで、ユーザ自身が撮影（１）や画像選択（（３）乃至（８））した学習の場合、ユーザが意図的に操作したことから、ユーザの好みを反映させることに対して信頼性のある学習で可能性が高い。しかし、（２）被写体探索時の検出情報による学習は、ユーザが意図時に操作したことによる学習ではないため、ユーザが望まない学習が行われる可能性が含まれている。例えば、探索中に画像情報から、個人認証登録されている被写体と同時に写っている別の人物や物体やシーンを学習するが、頻繁に同時に写っている被写体が必ずしもユーザの好みであるとは限らない。そこで、ユーザが意図的に操作したことによる学習でない（２）場合よりも、ユーザが意図的に撮影、或いは画像選択した場合の学習（（１）、（３）乃至（８））の方を優先的に学習させる。

　学習用のデータは、撮影時或いは探索中にタグ情報として記録された各種データ（画像情報や振動情報や環境情報や音情報や場所情報など）であり、学習に反映する場合は、この各種データをリスト化した形式で保存している。学習のためのデータ群の数は固定値で決められた数を持つことにする。学習のためのデータ群は、ユーザが意図的に行った学習データである領域と、ユーザが意図的ではない学習データである領域の２つの領域に分割しており、領域のデータ数の比率は、ユーザが意図的に行った学習データ領域の方が大きくなるような比率にしておく。新しい学習反映指示がされた場合、各領域に対応した学習データから削除し、新たな学習データを追加する。例えば、ユーザが意図的に行った学習データを２つ追加する場合は、ユーザが意図的に行った学習データ領域から２つのデータを削除して、新たな２つのデータを追加して再学習する。

　このような構成にすることで、ユーザが意図的に操作したことによる学習でない（２）ときよりも、ユーザが意図的に撮影、或いは画像選択した場合の学習（（１）、（３）乃至（８））の方を優先的に学習させることができる。

　或いは、学習用の各種データの中には、学習データが生成された日付時刻が管理されており、学習データが生成された日付時刻からの経過時間に応じた重み付係数Ｌａを計算する。重み付係数Ｌａは経過時間が大きくなるほど小さくなるように更新されていく。また、ユーザが意図的に行った学習データか、ユーザが意図的ではない学習データかによる重み付係数Ｌｂも、各学習データに対応して管理される。重み付係数Ｌｂは、ユーザが意図的に行った学習データの場合、ユーザが意図的ではない学習データよりも大きくなるように設定される。また、ユーザが意図的に行った学習データの中でも、（１）、（３）乃至（８）のどの学習であるかによって重み付係数Ｌｂを変更してもよい。

　新たな学習データが追加になる場合、現在の学習データ群の中で、重み付係数ＬａとＬｂを乗算した値が最も小さい学習データから優先してデータを削除してから、追加データを挿入し、更新された学習データ群を元に機械学習を行う。

　もしも、図１乃至図６の構成では、撮像装置側に画面がなく優先度の設定が難しく、また、外部装置側のメニューで設定する場合にはユーザの手間を要する。しかし、優先度のフラグ付けのための操作ではなく、撮影処理のための操作や編集処理のための操作に基づいて、自動的に優先度のフラグ付けをすれば、ユーザの手間を削減することができる。また、撮影画像を用いて自動で優先度を評価する場合、例えば、所定時間間隔で撮影している画像を評価する場合、同じものばかり撮影してしまうが必ずしも主要な被写体ではない可能性があり、ユーザの意図が反映されない場合がある。これに対して、本実施形態では、ユーザが意図的に行った処理に基づく優先度のフラグ付けのため、ユーザの意図を十分反映したものとなる可能性が高い。

　次に、学習処理シーケンスについて説明する。

　図７のステップ７０４のモード設定判定にて、学習処理を行うべきか否かを判定し、学習処理を行う場合、学習モードであると判定され、ステップ７１６の学習モード処理を行う。

　学習モードの判定条件を説明する。学習モードに移行するか否かは、前回学習処理を行ってからの経過時間と、学習に使用できる情報の数、通信機器を介して学習処理指示があったかなどから判定される。ステップ７０４のモード設定判定処理内で判定される、学習モードに移行すべきか否かの判定処理フローを図１４に示す。

　ステップ７０４のモード設定判定処理内で学習モード判定が開始指示されると、図１４の処理がスタートする。ステップ１４０１では、外部機器３０１からの登録指示があるかどうかを判定する。ここでの登録は、上記説明した学習するための登録指示があったかどうかの判定である。例えば、＜通信機器で画像取得された画像情報による学習＞や、＜通信機器を介して、画像に判定値を入力することによる学習＞がある。また、＜通信機器内の保存されている画像を解析することによる学習＞や、＜通信機器内の保存されている画像を解析することによる学習＞などがある。ステップ１４０１で、外部機器からの登録指示があった場合、ステップＳ１４１０に進み、学習モード判定をＴＲＵＥにして、ステップ７１６の処理を行うように設定する。ステップＳ１４０１で外部機器からの登録指示がない場合、ステップ１４０２に進む。ステップ１４０２では外部機器からの学習指示があるかどうかを判定する。ここでの学習指示は＜通信機器で、撮像装置パラメータを変更することによる学習＞のように、学習パラメータをセットする指示があったかどうかの判定である。ステップ１４０２で、外部機器からの学習指示があった場合、ステップＳ１４１０に進み、学習モード判定をＴＲＵＥにして、ステップ７１６の処理を行うように設定し、学習モード判定処理を終了する。ステップ１４０２で外部機器からの学習指示がない場合、ステップ１４０３に進む。

　ステップ１４０３では、予定された学習条件を満たしているかを判定する。例えば、毎日２４：００に学習するといった予定時間に基づく学習条件を用いてもよい。これによって、定期的な学習実行が行われるため、学習結果の新鮮さを一定に保つことができる。別の例として、撮像装置１０１を電源ボタン押下による電源ＯＦＦが指示されたことを条件にしてもよい。その際は、学習処理が終了してから、電源をＯＦＦにする。学習処理は一般的に長い処理時間が必要となるが、電源ＯＦＦ時のようなユーザがしばらく撮影などに使用しないことが想定されるタイミングで実行することで、ユーザの使用を妨げずに行うことができる。予定学習条件を満たしている場合は、ステップＳ１４１０に進む。条件を満たしていない場合はステップ１４０４に進む。ステップ１４０４では、撮影が行われる可能性を判定する。前記の通り、学習処理には時間がかかるため、撮影を行う可能性のあるタイミングでの実施は避けた方が良い。そこで、例えば、手動撮影が過去一定時間以上指示されていない、自動撮影モードにおけるエリアの重要度レベルが所定以下であるといった条件に基づいて、しばらくのあいだ撮影が行われる可能性が低いことを判定する。撮影可能性が低いと判定された場合は、ステップ１４０５に進む。そうでない場合は、ステップ１４１１に進み、学習モード判定をＦＡＬＳＥとする。ステップ１４０５では、前回学習処理（ニューラルネットワークの重みの再計算）が行われてからの経過時間ＴｉｍｅＮを取得し、ステップＳ１４０６に進む。ステップ１４０６では、学習する新規のデータ数ＤＮ（前回学習処理が行われてからの経過時間ＴｉｍｅＮの間で、学習するように指定された画像の数）を取得し、ステップ１４０７に進む。ステップ１４０７では、ＴｉｍｅＮから閾値ＤＴを演算する。例えば、ＴｉｍｅＮが所定値よりも小さい場合の閾値ＤＴａが、所定値よりも大きい場合の閾値ＤＴｂよりも大きく設定されており、時間経過によって、閾値が小さくなるように設定してある。これにより、学習データが少ない場合においても、時間経過が大きいと再度学習するようにすることで、使用時間に応じて撮像装置が学習変化し易いようにしてある。

　ステップ１４０７で閾値ＤＴを演算すると、ステップ１４０８に進み、学習するデータ数ＤＮが、閾値ＤＴよりも大きいか否かを判定する。ＤＮが、閾値ＤＴよりも大きい場合、ステップ１４０９に進み、ＤＮを０に設定した後、ステップ１４１０に進み、学習モード判定をＴＲＵＥにして、ステップ７１６の処理を行うように設定し、学習モード判定処理を終了する。

　ステップ１４０８でＤＮが、閾値ＤＴ以下の場合、ステップ１４１１に進む。外部機器からの登録指示も、外部機器からの学習指示もなく、且つ学習データ数も所定値以下であるので、学習モード判定をＦＡＬＳＥにし、ステップ７１６の処理は行わないように設定し、学習モード判定処理を終了する。

　次に、学習モード処理（ステップ７１６）内の処理について説明する。学習モード処理の詳細なフローを図１５に示す。

　図７のステップ７１５での学習モードと判定され、ステップ７１６に進むと、図１５の処理がスタートする。ステップ１５０１では、外部機器３０１からの登録指示があるかどうかを判定する。ステップ１５０１で、外部機器からの登録指示があった場合、ステップ１５０２に進む。ステップ１５０２では、各種登録処理を行う。

　各種登録は、ニューラルネットワークに入力する特徴の登録であり、例えば顔認証の登録や、一般物体認識の登録や、音情報の登録や、場所情報の登録などである。

　登録処理を終了すると、ステップ１５０３に進み、ステップ１５０２で登録された情報から、ニューラルネットワークへ入力する要素を変更する。

　ステップ１５０３の処理を終了すると、ステップ１５０７に進む。

　ステップ１５０１で外部機器３０１からの登録指示がない場合、ステップ１５０４に進み、外部機器３０１からの学習指示があるかどうかを判定する。外部機器からの学習指示があった場合、ステップ１５０５に進み、外部機器から通信された学習パラメータを各判定器（ニューラルネットワークの重みなど）に設定し、ステップ１５０７に進む。

　ステップ１５０４で外部機器からの学習指示がない場合、ステップ１５０６で学習（ニューラルネットワークの重みの再計算）を行う。ステップ１５０６の処理に入るのは、図１４を用いて説明したように、学習するデータ数ＤＮが閾値を超えて、各判定器の再学習を行える条件である。誤差逆伝搬法或いは、勾配降下法などの方法を使って再学習させ、ニューラルネットワークの重みを再計算して、各判定器のパラメータを変更する。学習パラメータが設定されると、ステップ１５０７に進む。

　ステップ１５０７では、ファイル内の画像に対して、再度、スコアを付与する。本実施形態においては、学習結果に基づいてファイル（記録媒体２２１）内に保存されているすべての撮影画像にスコアを付けておき、付けられたスコアに応じて、自動編集や自動ファイル削除を行う構成となっている。よって、再学習や外部機器からの学習パラメータのセットが行われた場合には、撮影済み画像のスコアも更新を行う必要がある。よって、ステップ１５０７では、ファイル内に保存されている撮影画像に対して新たなスコアを付ける再計算が行われ、処理が終了すると学習モード処理を終了する。

　本実施形態においては、ユーザが好んでいると思われるシーンを抽出し、その特徴を学習し、自動撮影や自動編集といった動作に反映させることにより、ユーザの好みの映像を提案する方法を説明したが、本発明はこの用途に限定されない。例えば、あえてユーザ自身の好みとは異なる映像を提案する用途に用いることもできる。その実現方法の例としては、以下のとおりである。

　（１）好みを学習させたニューラルネットワークを用いる方法
　学習については、上記説明したとおりユーザの好みの学習を実施する。そして、「自動撮影」のＳ９０８において、ニューラルネットワークの出力値が、教師データであるユーザの好みとは異なることを示す値であるときに自動撮影する。例えば、ユーザが好んだ画像を教師画像とし、教師画像と類似する特徴を示すときに高い値が出力されように学習をさせた場合は、逆に出力値が所定以上低いことを条件として自動撮影を行う。また、同様に被写体探索処理や自動編集処理においても、ニューラルネットワークの出力値が、教師データであるユーザの好みとは異なることを示す値となる処理を実行する。

　（２）好みとは異なるシチュエーションを学習させたニューラルネットワークを用いる方法
　この方法では、学習処理の時点で、ユーザの好みとは異なるシチュエーションを教師データとして学習を実行する。例えば、手動で撮影した画像はユーザが好んで撮影したシーンであるとして、これを教師データとする学習方法を上述した。これに対し、本実施形態では逆に手動撮影した画像は教師データとして使用せず、所定時間以上手動撮影が行われなかったシーンを教師データとして追加する。あるいは、教師データの中に手動撮影した画像と特徴が類似するシーンがあれば、教師データから削除してもよい。また、外部通信機器で画像取得した画像と特徴が異なる画像を教師データに加えるか、画像取得した画像と特徴が似た画像を教師データから削除してもよい。このようにすることで、教師データには、ユーザの好みと異なるデータが集まり、学習の結果、ニューラルネットワークは、ユーザの好みと異なるシチュエーションを判別することができるようになる。そして、自動撮影ではそのニューラルネットワークの出力値に応じて撮影を行うことで、ユーザの好みとは異なるシーンを撮影できる。また、自動編集では、同様にユーザの好みとは異なる編集画像の提案が可能となる。

　上記説明したとおり、あえてユーザ自身の好みとは異なる映像を提案することにより、ユーザが手動で撮影をしそびれてしまうシーンにおいて撮影を行うことで撮り逃しを減少させる効果がある。また、ユーザ自身の発想にないシーンでの撮影や編集効果を提案することで、ユーザに気付きを与えたり、嗜好の幅を広げたりといった効果が期待できる。

　また、上記の手段を組み合わせることで、ユーザの好みと多少似ているが一部違うシチュエーションの提案というように、ユーザの好みに対する適合度合いを調節することも容易である。ユーザの好みに対する適合度合いは、モード設定や、前記各種センサの状態、前記検出情報の状態に応じて変更してもよい。

　本実施形態においては、撮像装置１０１内で、学習する構成を基に説明したが、外部機器３０１側に学習処理をもち、学習に必要なデータを外部機器３０１に通信し、外部機器側でのみ学習を実行する構成でも同様の学習効果を実現可能である。その場合、上記＜通信機器で、パラメータを変更することによる学習＞で説明したように、外部機器側で学習したニューラルネットワークの重みなどのパラメータを撮像装置１０１に通信により設定することで学習を行う構成にしてもよい。

　また、撮像装置１０１内と、外部機器３０１内の両方に、それぞれ学習処理をもつ構成にしてもよい。例えば撮像装置１０１内で学習モード処理７１６が行われるタイミングで外部機器３０１が持つ学習情報を撮像装置１０１に通信し、学習パラメータをマージすることで学習を行う構成にしてもよい。

　また、上述の自動撮影モード処理（図９）のＳ９０７では、ユーザ（手動）による撮影指示があったがどうかを判定し、撮影指示があった場合、Ｓ９１０に進む構成とした。ここで、ユーザ（手動）による撮影指示は、撮像装置が向いている方向（以下撮影方向）を、ユーザが手で回転させることによって指示できるようにしてもよい。図１７は鏡筒回転駆動部２０５の構成を示すブロック図である。図１７の１７０１～１７０７は、パン軸の駆動に関わる構成である。図１７の１７０８～１７１４は、チルト軸の駆動制御に関わる構成である。パン軸の駆動とチルトの駆動に関わる基本的な構成は同じであるため、パン軸の駆動に関わる構成のみ説明を行い、チルト軸の駆動に関わる構成の説明については省略する。１７０１は被写体の画像上での目標位置と現在位置の差からパン軸１７０６を駆動する際の目標位置を算出するための画像位置－パン位置変換部である。図１８は撮像装置で撮像された画像における被写体の現在位置と目標位置の関係を表した図である。１８０１は、撮像装置が被写体探索中に画像処理部２０７にて得られたある瞬間の画像である。１８０２は被写体の現在位置（ｘ１、ｙ１）を示したものである。１８０３は被写体の目標位置（ｘ０、ｙ０）を示したものである。画像上の被写体の目標位置１８０３と現在位置１８０２の差からパンおよびチルトの目標位置を算出する際には、以下の式を用いる。
ｋｐ（ｆ）×（ｘ１－ｘ０）　　　（式１）
ｋｔ（ｆ）×（ｙ１－ｙ０）　　　（式２）

　ｋｐ（ｆ）は撮像装置の焦点距離ｆに応じて変化する被写体の画像上での目標位置と現在位置の差からパンの目標位置算出するための変換係数である。ｋｔ（ｆ）は撮像装置の焦点距離ｆに応じて変化する被写体の画像上での目標位置と現在位置の差からチルトの目標位置算出するための変換係数である。

　図１７の１７０２は補償器である。補償器１７０２は、現在のパン位置と画像位置－パン位置変換部１７０１で算出されたパンの目標位置との差を無くすように、ＰＩＤ制御演算を行うことで制御出力を算出する。１７０３は撮影方向変更操作検出部であり、パンの目標位置と現在位置の差（以下、位置偏差）と制御出力、パンの移動速度から撮影方向変更操作を検出する。撮影方向変更操作検出部１７０３で撮影方向の変更を検出した場合には、制御出力をＯＦＦにしてパンの駆動を停止する。一方、撮影方向変更操作検出部１７０３で撮影方向の変更を検出しなかった場合には、補償器１７０２にて算出された制御出力に応じてパンの駆動制御を行う。１７０４は、補償器１７０２にて算出された制御出力に応じた駆動信号を生成するためのドライバである。１７０５は、パン軸１７０６を駆動するためのアクチュエータである超音波モータ（ＵＳＭ）である。１７０７は、パン位置の時間変化からパンの移動速度を算出するための移動速度検出部である。移動速度検出部１７０７は、制御サンプリング毎のパン位置の変化量からパンの移動速度を算出する。図１９は、ユーザ操作による撮影方向変更操作を検出して、撮影方向変更操作後の撮影エリアを重要な領域として学習情報を更新するフローを示したフローチャートである。

　Ｓ１９０１において、ユーザによる撮像装置の撮影方向変更操作の有無の判定を行う。ユーザによる撮影方向変更操作の検出は、撮影方向変更操作検出部１７０３で、後述する制御出力および位置偏差が所定の条件を満たした場合に撮影方向変更有と判定する。Ｓ１９０１で撮影方向変更操作を検出した場合には、Ｓ１９０２に進み、位置制御動作を停止する。被写体追尾中や探索中であった場合には中断したうえで位置制御動作を停止する。一方、Ｓ１９０１で撮影方向変更操作を検出しなかった場合は、撮影方向変更操作の検出を継続する。Ｓ１９０２で位置制御を停止させた後は、Ｓ１９０３に進んでユーザによる撮影方向変更操作の終了判定を行う。

　撮影方向変更操作の終了判定は、撮影方向変更操作検出部１７０３で、パンの移動速度により撮影方向変更操作の継続または終了を判定する。撮影方向変更操作が終了したと判定した場合には、Ｓ１９０４に進み、撮影方向変更操作の終了判定後の撮影エリア情報を記憶する。記憶するエリアは、撮像装置の位置、パン位置、チルト位置、焦点距離から決まる画角を各分割エリアと比較して最も近いエリアを記憶する。Ｓ１９０３で撮影方向変更操作中であると判定した場合は、撮影方向変更操作終了の検出を継続する。Ｓ１９０５では、Ｓ１９０４で記憶したエリアを他の分割エリアよりも重要なエリアとして学習情報を更新する。Ｓ１９０６では、被写体追尾および位置制御を有効にしたうえでＳ１９０１に進み、撮影方向変更操作の検出を再開する。この際、撮像装置１０１が追尾していることをユーザに知らせるために、追尾対象の画像もしくはその周辺に、前述した顔認証とは異なる特殊画像（画像エフェクト）を表示する。ユーザが撮影方向変更操作を行う例として、撮像装置１０１で花を撮影中にユーザが鏡筒１０２を手で回転させることにより、撮像装置１０１の光軸が画角外の特定の人物に向くように撮影方向変更操作した時の例を説明する。図２０は、撮像装置１０１で花２００１を撮影中に人物２００３の方向にユーザの手で鏡筒１０２を回転させた後に、人物２００３が存在するエリアを重要エリアとして学習情報を更新する例を説明するための模式図である。図２０の２００２は、花２００１を撮影中の撮像装置１０１の光軸である。２００４はユーザが手で撮影方向を変更させた後の光軸である。２００５は、ユーザが撮影方向を変更した際の鏡筒１０２の回転方向を示している。図２１および図２２を用いて、花２００１を撮影中にユーザ操作により人物２００３の方向に撮影方向を変更した後に人物２００３が存在するエリアを重要なエリアとして学習情報を更新するまでの動作について説明する。図２１Ａ、Ｂ、Ｃ、Ｄは、花を撮影中から撮影方向を変更して特定人物２００３の方向に撮影方向を変化させて学習情報を更新するまでの間に撮像されたある瞬間の画像を示した図である。図２２は、花を撮影中にユーザが撮影方向を特定人物２００３の方向に変更して、変更後の画角のエリアを重要なエリアとして学習情報を更新するまでの間のパンの制御出力２２０１、位置偏差２２０２、移動速度２２０３の時間変化を示した図である。図２２のｔａ、ｔｂ、ｔｃ、ｔｄはそれぞれ図２１Ａ、Ｂ、Ｃ、Ｄに示す画像を撮像した時間である。図２２のＴｈＣは、ユーザが手で鏡筒１０２を回転させたことを判定するために使用する制御出力の閾値である。ＴｈＤｉｆｆは、ユーザが手で鏡筒１０２を回転させたことを判定するために使用する位置偏差の閾値である。制御出力がＴｈＣ以上でかつ位置偏差がＴｈＤｉｆｆ以上である時間が所定時間（図２２はｔ２－ｔ１）継続した場合にユーザにより撮影方向の変更がなされたとして、補償器１７０２の制御出力をＯＦＦする。ＴｈＶは、ユーザが撮影方向操作を終了したと判定するために使用するパン軸の移動速度の閾値である。ＣＭａｘは補償器１７０２の制御出力の最大値である。位置制御する際には、制御出力を－ＣＭａｘからＣＭａｘの範囲で変更する事によって被写体が画像上の目標位置に位置するようにパン軸の駆動を制御する。図２２のｔ１はユーザが撮影方向操作を開始してから制御出力２２０１がＴｈＣ以上でかつ位置偏差がＴｈＤｉｆｆ以上となったときの時間を示している。ｔ２は、制御出力２２０１がＴｈＣ以上でかつ位置偏差２２０２がＴｈＤｉｆｆ以上である時間が撮影方向変更判定時間（ｔ２－ｔ１）経過した時間を示している。ｔ３は時間ｔ２以降にはじめてパン軸の移動速度がＴｈＶ以下となったときの時間を示している。ｔ４は移動速度が時間ｔ３でＴｈＶ以下となってからの経過時間が撮影方向変更終了判定時間（ｔ４－ｔ３）となった時間を示している。

　図２１Ａは、花２００１を撮影中に時間ｔａのタイミングで撮像した画像を示している。図２１Ａの２１０１は追尾、探索または撮影対象となる被写体を示す被写体枠である。２１０２は、被写体枠２１０１の中心の画像上の目標位置となる目標点を示したものである。２１０２の２つ線が交差する点が被写体の画像上での目標位置である。通常の撮影動作中（撮影方向変更操作中でない状態）は、被写体枠２１０１の中心と目標点２１０２が重なるように、パン軸またはチルト軸を駆動制御することによって、位置合わせを行う。図２１Ｂは、図２１Ａの状態において時間ｔｂのタイミングでユーザが固定部１０３に対して鏡筒１０２を右方向に回転させたときに撮像した画像である。図２１Ｂの黒塗りの矢印は、位置制御のパンの駆動方向、白抜きの矢印はユーザの撮影方向変更操作による鏡筒１０２の回転方向である。時間ｔｂにおける制御出力２２０１、位置偏差２２０２を見ると、制御出力が最大値のＣＭａｘとなっているにもかかわらず、位置偏差２２０２は増加傾向にある。このことからユーザが意図的にパン軸を回転させていると判定することができる。本実施形態では、ユーザが手で鏡筒１０２を回転させている状態である事を検知してから、補償器１７０２の制御出力をＯＦＦするまでに所定時間（ｔ２－ｔ１）だけ待ってから撮影方向変更の判定を行っている。これは、意図せずにユーザが鏡筒に触れてしまった場合や、探索駆動中のパン軸またはチルト軸の負荷変動による影響で、ユーザが方向変更操作を行ってない場合に撮影方向変更有と判定しないための対策である。ユーザの撮影方向変更操作を開始してから撮影方向変更判定を素早く行うために、確定するまでの時間を短縮したり、無くしてもよい。

　図２１Ｃは、時間ｔｃで補償器１７０２の制御出力をＯＦＦした状態でユーザの撮影方向変更操作によって新しい被写体の近くまでパン軸を回転させて目標となる被写体が画角に入ったときの図である。このように新たな撮影対象となる被写体が画角に入るまでユーザは撮影方向変更操作を継続する必要がある。本実施形態に示す撮像装置１０１のように撮影方向変更中の画像を直接確認できない場合にはスマートデバイスを使用して変更中の画像を確認しながら操作を行うことで撮影対象となる被写体が画角に入ったことを確認する。その他の撮影対象の被写体が画角内に入った事をユーザが知る手段として、撮影方向変更中に新たな被写体が画角内に入った場合にはＬＥＤ制御部２２４によりＬＥＤを発光させるか音声出力部２１８にて音声出力させることでユーザに報知するようにしてもよい。

　図２１Ｄは、時間ｔ４のタイミングで補償器１７０２の制御出力をＯＮした状態で撮影方向変更後の新しい被写体を追尾、撮影中の画像である。時間ｔ４は、時間ｔｄでパンの移動速度２２０３がＴｈＶ以下となる時間が撮影方向変更操作終了判定時間（ｔ４－ｔ３）以上経過後のタイミングである。時間ｔ４でユーザによる撮影方向変更操作が終了したと判定した場合にはｔ４の時点での撮影エリアをユーザの好みのエリアとして他のエリアよりも重要度を高く設定したうえで学習情報を更新する。また、このエリアに存在する被写体を重要な被写体として追尾、撮影、認証登録のいずれか一つ以上の動作を行うようにしてもよい。たとえば、図２１Ｄに示すように、ユーザによる撮影方向変更操作が終わったことを検出したタイミングで人物２００３が画角内に存在する場合には、人物２００３を重要な被写体として追尾、撮影、認証登録のいずれかの動作を行う。学習情報更新処理は、自動的に行わずにユーザによる学習指示があった場合のみ行うようにしてもよい。例えば、画角に被写体が入ったことを撮像装置がユーザに報知した後に、事前に登録しておいた学習指示用の特定音声コマンドを入力した場合のみ学習情報の更新を行うようにするなど、ユーザから学習指示があった場合のみ学習情報を更新するようにしてもよい。

　本実施形態では、ユーザによる撮像装置の撮影方向変更操作の開始および終了の検出を補償器の制御出力、位置偏差、駆動軸の移動速度によって検出する例を示したが、ユーザによる撮影方向操作を検出可能であれば他の方法で検出してもよい。例えば、装置揺れ検出部２０９からのジャイロセンサや加速度センサの信号の時間変化に基づいてユーザによる撮影方向変更の有無を検出するようにしてもよい。図２３は、ユーザ操作により撮像装置の撮影方向を変更した際の装置揺れ検出部２０９の加速度センサの出力変化を示している。２３０１は、加速度の時間変化を示している。ＴｈＡ１は、ユーザが撮影方向変更操作を開始したと判定する際に使用する加速度の閾値である。ＴｈＡ２は、ユーザが撮影方向変更操作を終了したと判定する加速度の閾値である。これらの閾値と加速度を比較して、撮影方向変更操作の開始および終了を検出するようにしてもよい。このとき、撮影方向変更操作の誤検知を防ぐために、事前に撮影方向変更操作時の加速度の時間変化パターンを学習させておいて、検出した加速度の時間変化が学習した時間変化パターンとの類似度が所定値以上の場合に撮影方向変更されたと判定してもよい。同様に、撮像装置により撮像した画像の動きベクトルの変化に応じて撮影方向操作の有無を検出するようにしてもよい。

　また、上述の記載では、撮影方向変更操作後に画角内となる撮影エリアを重要なエリアとして学習する処理を説明した。しかしながら、これに限らず、ズーム変更や外部機器へのユーザ操作による撮影エリアの変更があった場合に、変更操作後の撮影エリアを重要なエリアとして学習する処理をしてもよい。

　＜低消費電力モード解除条件に応じて処理を変更する＞
　図９において本実施形態における撮影モードの基本的な処理シーケンスを説明したが、いかなる時もこのシーケンスにしたがって処理をしていると、被写体を捉えて自動撮影が行われるまでに時間が掛かってしまう。この場合、シャッターチャンスを逸失したり、ユーザの意図と異なる被写体を撮影してしまったりする恐れがある。特に、低消費電力モードが解除される（以下ウェイクアップという）際、どのような条件に基づいて解除されたかによって、最適な処理シーケンスは異なる。ここでは、ウェイクアップ条件とそれに適した処理シーケンスの例を示す。

　（１）タップ検出によるウェイクアップ
　タップ検出によるウェイクアップができると上述した。このような場合は、撮像装置１０１の所有者が撮影の意思を持ってウェイクアップを指示したと考えられる。そのため、周囲を探索して所有者を見つけ、所有者が写るように即座に自動撮影するような処理が好ましい。

　図２７はこの場合での撮影モードの処理を示している。

　ステップＳ２７０１～Ｓ２７０３は、図９で説明した通常時の処理と同じであるため割愛する。

　ステップＳ２７０４では、通常の処理とは異なり、全画角を網羅するようにパン・チルト駆動を行いながら探索を行う。

　ステップＳ２７０５にて、特定の認証人物が画角内にいるかどうかを判定する。この時、事前に所有者に対して所有者自身の顔を認証顔登録させておき、特定の認証人物として所有者自身を探索することが望ましい。所有者が画角内に見つかった場合は、Ｓ２７０６に進む。

　ステップＳ２７０６では、所有者が画角内に収まるようにパン・チルトズーム駆動を行った上で、ステップＳ２７１２の撮影開始動作へと進む。

　ステップＳ２７０７～Ｓ２７１５は、図９のＳ９０５～Ｓ９１３と同様の処理のため割愛する。

　このような処理をすることによって、ユーザの意思に即座に反応した撮影が可能となる。

　（２）音検出によるウェイクアップ
　音検出および音声コマンド認識によるウェイクアップができると上述した。音検出の場合は、音の方向に関心の対象人物がいる可能性が高い。また、音声コマンド認識の場合は、音声コマンドを発した人物が、自身を撮影してほしいという意思を持っていると考えられる。そこで、音声を検知した方向にいる人物を見つけて即座に自動撮影するような処理が好ましい。

　図２８はこの場合での撮影モードの処理を示している。

　ステップＳ２８０１～Ｓ２８０３は、図９で説明した通常時の処理と同じであるため割愛する。

　ステップＳ２８０４では、通常の処理とは異なり、音方向検知した方向を画角に含めるようにパン・チルト駆動を行う。

　ステップＳ２８０５にて、音方向の画角に人物がいるかどうかを判定する。人物がいた場合、その人物が音または音声コマンドの発生源とみなし、その人物の撮影に向けてＳ２８０６へ進める。

　ステップＳ２８０６では、その人物が画角内に収まるようにパン・チルトズーム駆動を行った上で、ステップＳ２８１２の撮影開始動作へと進む。

　ステップＳ２８０７～Ｓ２８１５は、図９のＳ９０５～Ｓ９１３と同様の処理のため割愛する。

　このような処理をすることによって、歓声が上がるなどの関心の高い瞬間の撮影機会を逃さず撮影できる効果が期待できる。また、音声コマンドを発声した人物の意思に即座に反応した撮影が可能となる。

　（３）その他の条件によるウェイクアップ
　その他の条件に基づくウェイクアップ（例えば、図８で説明した時間経過判定）の際は、基本とする図９のシーケンスにしたがって処理を行う。こうすることによって、重要な被写体が要るときに限り自動撮影が行なわれ、消費電力や記憶装置の空き容量の消費を抑えることができる。

　上述の実施形態によれば、下記の機能が可能となる。

　（１）起動
　起動した条件に応じて、起動後の探索、撮影処理を変更する。

　このように、何によって起動したかに応じて、起動後の処理（自動撮影判定、探索処理、スリープ判定処理）を変える。これにより、毎回一律の起動シーケンスを実行していると時間が掛かり、シャッターチャンスの逸失、ユーザの意図と異なる被写体を撮影するという課題を解決できる。
［例１］声で起こされたら声の方向を向いて探索、撮影判定開始
［例２］タップで起こされたら持ち主（認証顔）を探す

　（２）スリープ
　被写体シーン判定手段を有し、シーン判定結果に応じて、自動スリープに入ることを決定する。判定結果に応じてスリープ時間を調整する。撮像装置の内部状態を判定する手段を有し、内部状態判定手段に応じて自動スリープに入る。

　このように、被写体やシーンに応じて、自動スリープに入る。スリープ時間も調整する。また、撮像装置の処理の内部状態に応じて自動スリープに入る。これにより、単純に時間経過や操作無しによるスリープだと、消電効果が低く、また、シャッターチャンス逸失の恐れがあるという課題を解決できる。
［例１］被写体が居なければ消電に移行
［例２］シーンが変化に乏しければ長めにスリープ
［例３］自動撮影、学習、編集、転送モードのいずれにも該当しない場合スリープ
［例４］電池残量

　（３）自動画像転送
　経過時間、撮影済画像の評価値、電池残量、カード容量のうち少なくとも一つの条件に応じて、画像を自動で転送したり、画像転送頻度を自動で決定したりする。

　このように、条件に応じて画像を自動で転送する（所定時間経過ごとに、高評価の画が撮れた場合）。また、条件に応じて画像転送頻度を自動で決定する（電池の残量が少ないときは、画像転送されづらくする、撮影頻度が高く設定されていれば、転送頻度も高くする、記憶媒体の空き容量が少ないときは転送頻度を高くする）。これにより、ユーザ指示に応じて画像転送をする場合、転送処理を待つ時間が発生、また、既定の転送頻度や転送枚数だと、ユーザによっては外部装置の容量を逼迫するという課題を解決できる。

　（４）学習
　経過時間、教師データのたまり度合、現在のシーンや被写体の判別結果、予定時刻、今後の撮影可能性、電源ＯＦＦ時のうち少なくとも一つの条件に応じて、自動で学習モードに入る。

　このように、条件に応じて、自動で学習モードに入る（新しい教師データが所定以上たまった場合、前回の学習が行われてからの時間経過が長い、めぼしい被写体が周囲にいないなど、しばらく自動撮影が行われなさそう）。これにより、学習モードに入る条件を適切に設定しないと、学習処理を待つ時間が発生したり、電力を無駄に消費するという課題を解決できる。

　（５）画像の自動削除
　条件に応じて自動削除を行う。撮影頻度、空き容量に応じて削除目標枚数を設定する。＜ユーザが手動撮影した画像＞、＜ユーザが高評価した画像＞、＜撮像装置が算出した重要度スコアが高い画像＞を削除されづらく設定する。また、＜外部装置に転送済み画像＞、＜一度もユーザの目に触れてない画像＞を削除されやすく設定する。また、取得されたハイライト動画が短い間隔で撮影されていれば、古いファイルを優先的に削除してもよい。また、長い間隔で撮影されていれば、古くてもスコアの高いファイルは削除しないようにしてもよい。また、動画の撮影頻度が多くなるように学習されていれば、通常より多くを自動削除するようにしてもよい。

　これにより、空き容量がなくなると、自動撮影できない。ユーザの手で１枚ずつ削除するのは、煩雑であるという課題を解決できる。

　（６）自動編集
　撮影画像のたまり度合、前回編集時からの経過時間、撮影済み画像の評価値、時間的な節目のうち少なくとも一つの条件に応じて、編集処理を自動実行する。

　これにより、ユーザの指示に応じてストーリーフォト動画を作ると、作成処理を待つ時間が発生し、使い勝手に劣るという課題を解決することができる。

　前述の＜アクセサリ類の構成＞において、図３２を用いて別カメラ３２０１と接続するアタッチメントを説明したが、撮像装置１０１と別カメラ３２０１とを連携して撮影する場合の例を説明する。

　カメラ間で一方のカメラのレリーズタイミングと合わせるように、もう一方のカメラのレリーズを切り同時撮影する方法が既知の技術として知られている。

　本実施形態においては、カメラ間で連動して撮影を行うが、カメラ３２０１がレリーズボタン３２０３を押下する前に、撮像装置１０１がレリーズ押下を予測して、カメラ３２０１が撮影を行う前に、撮影開始する。

　撮像装置１０１は、前記説明した自動撮影判定と同様の方法により、自動撮影を行うが、このとき、カメラ３２０１が撮影するタイミングを予測する学習が行われており、連携撮影を行う場合は、このネットワークを用いて自動撮影判定を行う。

　ユーザがカメラ３２０１を操作して撮影を行う構成における撮像装置１０１の動作を説明する。図３３に撮像装置１０１のフローチャートを示す。

　ここでは、カメラ３２０１が静止画撮影、撮像装置１０１が動画撮影する例を用いて説明する。

　撮影モード処理がスタートすると、まずＳ３３０１でカメラ連携のモードであるかを判定し、連携モードの場合、Ｓ３３０３に進み、連携モードでない場合、Ｓ３３０２に進む。

　連携モードは、カメラ３２０１と撮像装置１０１が有線や無線で接続されているかどうかで判定してもよいし、スマートデバイス３０１で設定するようにしてもよい。

　Ｓ３２０２では、カメラ連携モードではないので、図９で説明した処理を行い、撮影モード処理を終了し、次回演算周期を待つ。Ｓ３３０３ではカメラ３２０１からの情報を読み込む。情報はカメラ３２０１のレリーズスイッチ押下情報や電源ＯＮ状態情報や、画像からの被写体情報などを撮像装置１０１に通知し、Ｓ３３０４に進む。

　Ｓ３３０４では、撮像装置１０１が撮影中であるか否かを判定し、撮影中でないならば、Ｓ３３０５に進み、撮影中であればＳ３３０６に進む。Ｓ３３０５では、カメラ３２０１が撮影開始したか否かを判定し、撮影開始であればＳ３３１０に進み、撮像装置１０１の撮影を開始して、撮影モード処理を終了し、次回演算周期を待つ。Ｓ３３０５でカメラ３２０１が撮影開始していなければ、Ｓ３３０７に進み、自動撮影判定処理を行う。自動撮影判定処理は図１２を用いて説明した方法と同様の方法で実現できる。このとき特徴量入力はカメラ３２０１からの情報と撮像装置１０１からの情報の両方を使って判定してもよいし、何れか一方のみの情報により判定してもよい。

　自動撮影判定処理を終了するとＳ３３０８に進み、自動撮影判定処理にて撮影開始と判定されたか否かを判定する。自動撮影開始判定されれば、Ｓ３３０９に進み撮像装置１０１の自動撮影を開始し、自動撮影開始判定されていなければ、撮影は行わず、撮影モード処理を終了し、次回演算周期を待つ。

　Ｓ３３０４がＳ３３１０やＳ３３０９で開始された後の撮影中であると判定されると、Ｓ３３０６にて、撮影終了判定処理と判定が行われる。そして、撮影終了と判定されるとＳ３３１１に進み撮像装置１０１０の撮影を終了し、撮影終了と判定されていなければそのまま撮影したまま撮影モード処理を終了し、次回演算周期を待つ。

　撮影終了判定は、自動撮影判定処理は図１２を用いて説明した方法と同様の方法で実現できる。このとき特徴量入力はカメラ３２０１からの情報と撮像装置１０１からの情報の両方を使って判定してもよいし、何れか一方のみの情報により判定してもよい。

　本構成では、撮像装置１０１の自動撮影を行う構成としたが、撮像装置１０１は動画を撮りっぱなりにしておいて、重要な時間帯に対してタグを付して最終的な動画ファイルに記録しておいてもよい。

　また、撮影結果を用いて、連携の自動撮影タイミングを学習させてもよい。

　例えば、撮像装置１０１が自動撮影中でないときや、カメラ３２０１が撮影開始されたときは、不正解のデータとして、そのときの図１２の入力となる特徴量を学習データとして保存する。

　また、撮像装置１０１が自動撮影中であるときや、カメラ３２０１が撮影開始されたときは、正解のデータとして、そのときの図１２の入力となる特徴量を学習データとして保存する。

　また、撮像装置１０１が自動撮影中であるときや、所定時間経過してもカメラ３２０１が撮影開始されなかったときは、不正解のデータとして、そのときの図１２の入力となる特徴量を学習データとして保存する。

　また、学習データが所定以上溜まったら、学習し、図１２のニューラルネットワークの重みを変更する。

　なお、カメラ３２０１が静止画撮影、撮像装置１０１が動画撮影する例を用いて説明したが、撮影方法はこれに限定されるものではなく、以下のパターンをスマートデバイス３０１などを用いて手動で選択してもよい。

　また、以下のパターンを撮像装置１０１が自動で選択してもよい。自動で選択する場合、どのパターンで撮影するかも自動で判定する。

　例えば、カメラ３２０１が静止画撮影のとき、撮像装置１０１は動画撮影をする。

　また、例えば、カメラ３２０１が静止画撮影のとき、撮像装置１０１は静止画撮影をする。

　また、カメラ３２０１が動画撮影のとき、撮像装置１０１は静止画撮影をする。

　また、カメラ３２０１が動画撮影のとき、撮像装置１０１は動画撮影をする。

　また、カメラ３２０１と撮像装置１０１の光軸方向の向きや、画角を手動で選択、もしくは自動で選択されてもよい。

　例えば、カメラ３２０１と撮像装置１０１は、同じ光軸方向の向きとする。

　また、例えば、カメラ３２０１と撮像装置１０１は、異なる光軸方向の向きとする。

　また、カメラ３２０１と撮像装置１０１は、同じ画角とする。

　また、カメラ３２０１と撮像装置１０１は、異なる画角とする。

　なお、撮像装置１０１が静止画撮影する場合においても、撮影開始前を事前予測して、自動撮影期間中は、１枚のみでなく、何枚かを自動撮影することとしてよい。

　本実施形態においてはカメラ３２０１のアクセサリーシュー３２０２に撮像装置１０１を接続して使用する例で説明したが、これに限定されるものではない。例えば、カメラ３２０１の別部材（例えば三脚ねじ穴など）に取り付けてもよいし、カメラ３２０１に直接取り付けず使用する（例えばウエアラブルでユーザに身につけておいて無線通信で情報通知）こともできる。

　また、本実施形態においては撮像装置１０１にて、カメラ３２０１が撮影されることを事前予測して撮影する例を説明したが、カメラ３２０１内で撮影されることを事前予測してもよい。この場合、事前予測により撮影判定されたときに、撮像装置１０１に撮影開始指示を出すことで、事前予測によるカメラ連携撮影を行ってもよい。

　また、カメラ３２０１と撮像装置１０１との情報通知は、レリーズタイミングのみ通知される構成をとってもよい。また、カメラ３２０１と撮像装置１０１の両方の検出情報を撮影開始判定に使用する構成をとってもよい。また、撮像装置１０１のみの検出情報を撮影開始判定に使用する構成をとってもよい。

　＜カメラ３２０１を用いた学習＞
　（１）カメラ３２０１の情報を撮像装置１０１に転送
　例えば、ユーザ操作でカメラ３２０１で撮影された画像から、メイン被写体を抽出する。

　そして、被写体情報を撮像装置１０１に通知しセットする。その後、撮像装置１０１は被写体を撮影した枚数から、重要な被写体であるかを判断し、被写体登録して、自動撮影／追尾などを行う。

　（２）レリーズ開始時点の撮像装置１０１における取得情報で被写体登録
　例えば、ユーザ操作でカメラ３２０１が撮影されたタイミングを撮像装置１０１に通知する。そして、撮影タイミングにおける撮像装置１０１の画像から重要被写体を設定する。その後、撮像装置１０１は被写体を撮影した枚数から、重要な被写体であるかを判断し、被写体登録して、自動撮影／追尾などを行う。

　＜撮像装置１０１からカメラ３２０１に情報通知＞
　撮像装置１０１と別カメラ３２０１とを連携して撮影する場合の撮像装置１０１からの情報によりカメラ３２０１をアシストする例を説明する。

　（１）被写体情報通知
　撮像装置１０１で検出した被写体情報（例えば、個人登録された顔、犬猫など所有者の好みと判定された被写体、ユーザの好みの被写体を判定された審美性判定結果）をカメラ３２０１に通知する。そして、カメラ３２０１のライブ画像においてその被写体がどこに位置するかや、画像外においてどんな被写体がいるか（例えば、画面右方向に車がいますとか）を通知し、ユーザの好みの被写体がいるかどうかを通知する。

　（２）レリーズ通知
　撮像装置１０１から、カメラ３２０１に撮影指示を行う構成にしてもよい。

　自動撮影モードの処理で説明した方法により、撮影タイミングを判定し、カメラ３２０１に自動撮影指示を行う。

　また、特定物体がカメラ３２０１の画面内に近づいてくるかを判定し、画面内に入るタイミングで連続撮影や動画撮影を行うような構成をとってもよい。

　本実施形態によれば、ユーザが特別な操作を行うことなく、ユーザの好みの映像を取得することが可能な撮像装置を提供することが可能となる。

　本発明は上記実施の形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために以下の請求項を添付する。

　本願は、２０１７年９月２８日提出の日本国特許出願特願２０１７－１８８９３８と２０１７年１２月２８日提出の日本国特許出願特願２０１７－２５４２３１と２０１８年３月２０日提出の日本国特許出願特願２０１８－０５３０７８を基礎として優先権を主張するものであり、その記載内容の全てをここに援用する。

Claims

　撮影ユニットにより撮影された撮影画像に関するデータを取得する取得ユニットと、
　前記取得ユニットにより取得されたデータに基づいて、前記撮影ユニットの撮影処理を変更する変更ユニットとを有し、
　前記変更ユニットは、前記撮影処理を変更する際、自動で処理された撮影画像における前記取得ユニットにより取得されたデータよりも、ユーザによる指示がなされた撮影画像における前記取得ユニットにより取得されたデータの重みづけを大きくすることを特徴とする撮像装置。
　前記自動で処理された撮影画像とは、自動で撮影された撮影画像、自動で編集された撮影画像、自動で外部機器へ転送された撮影画像、ファイル自動削除で削除されなかった撮影画像の少なくともいずれかであることを特徴とする請求項１に記載の撮像装置。
　前記ユーザによる指示がなされた撮影画像とは、ユーザによる指示により撮影指示された撮影画像、ユーザによる指示によりスコアを付加された撮影画像、当該撮像装置と相互通信可能な外部機器へユーザによる指示により送信指示され取得された撮影画像、当該撮像装置と相互通信可能な外部機器に記憶された撮影画像、ユーザによる指示によりサーバにアップロードされた撮影画像、ユーザによる指示によりパラメータの変更がなされた撮影画像、ユーザにより編集指示された撮影画像、ユーザによる指示により撮影エリアを変更された撮影画像の少なくともいずれかであることを特徴とする請求項１に記載の撮像装置。
　前記撮影処理には、撮影トリガの検出処理が含まれることを特徴とする請求項１に記載の撮像装置。
　前記撮影処理には、撮影方法の判定処理が含まれることを特徴とする請求項１に記載の撮像装置。
　前記撮影方法の判定処理では、静止画の一枚撮影、静止画の連続撮影、動画撮影、パノラマ撮影、タイムラプス撮影のうちいずれかであると判定することを特徴とする請求項５に記載の撮像装置。
　前記撮影トリガは、特定の被写体、特定の構図、特定の音、時間、振動の大きさ、場所の変化、ユーザの身体の変化、当該撮像装置の環境変化、当該撮像装置の状態の検出結果の少なくとも１つに基づいて、検出されることを特徴とする請求項４に記載の撮像装置。
　前記撮影処理には、特定の被写体の探索処理が含まれることを特徴とする請求項１乃至７のいずれか１項に記載の撮像装置。
　当該撮像装置は、撮影レンズと撮像素子を含む筐体を、少なくとも１軸以上の方向で回転駆動できる回転機構を備え、
　前記特定の被写体の探索処理は、回転機構を回転することで行われることを特徴とする請求項８に記載の撮像装置。
　ズームレンズのズーム駆動を制御することで前記特定の被写体の探索処理を行うことを特徴とする請求項８に記載の撮像装置。
　撮影画像の一部を切り出して、前記特定の被写体の探索処理を行うことを特徴とする請求項８に記載の撮像装置。
　前記特定の被写体は、人物の顔であり、
　前記自動で撮影された撮影画像は、探索中の被写体の現れる頻度、人物の表情に応じて撮影された撮影画像であることを特徴とする請求項７乃至１１のいずれか１項に記載の撮像装置。
　前記特定の被写体は、物体であり、
　前記自動で撮影された撮影画像は、物体認識に応じて撮影された撮影画像であることを特徴とする請求項７乃至１１のいずれか１項に記載の撮像装置。
　撮影画像を編集する編集ユニットと、
　撮影画像に関するデータを取得する取得ユニットと、
　前記取得ユニットにより取得されたデータに基づいて、前記編集ユニットの編集処理を変更する変更ユニットとを有し、
　前記変更ユニットは、前記編集処理を変更する際、自動で処理された撮影画像における前記取得ユニットにより取得されたデータよりも、ユーザによる指示がなされた撮影画像における前記取得ユニットにより取得されたデータの重みづけを大きくすることを特徴とする撮像装置。
　撮影画像を保存する記録ユニットと、
　前記記録ユニットに保存された撮影画像を、相互通信可能な外部機器に転送する画像自動転送ユニットと、
　撮影画像に関するデータを取得する取得ユニットと、
　前記取得ユニットにより取得されたデータに基づいて、前記画像自動転送ユニットで送信される画像の選択処理を変更する変更ユニットとを有し、
　前記変更ユニットは、前記選択処理を変更する際、自動で処理された撮影画像における前記取得ユニットにより取得されたデータよりも、ユーザによる指示がなされた撮影画像における前記取得ユニットにより取得されたデータの重みづけを大きくすることを特徴とする撮像装置。
　撮影画像を保存する記録ユニットと、
　前記記録ユニットに保存された撮影画像を自動で削除する削除ユニットと、
　撮影画像に関するデータを取得する取得ユニットと、
　前記取得ユニットにより取得されたデータに基づいて、前記削除ユニットで削除される撮影画像の選択処理を変更する変更ユニットとを有し、
　前記変更ユニットは、前記選択処理を変更する際、自動で処理された撮影画像における前記取得ユニットにより取得されたデータよりも、ユーザによる指示がなされた撮影画像における前記取得ユニットにより取得されたデータの重みづけを大きくすることを特徴とする撮像装置。
　撮影画像を表示する表示ユニットと、
　撮影画像に関するデータを取得する取得ユニットと、
　前記取得ユニットにより取得されたデータに基づいて、前記表示ユニットで表示される撮影画像の表示順序を変更する変更ユニットとを有し、
　前記変更ユニットは、前記表示順序を変更する際、自動で処理された撮影画像における前記取得ユニットにより取得されたデータよりも、ユーザによる指示がなされた撮影画像における前記取得ユニットにより取得されたデータの重みづけを大きくすることを特徴とする撮像装置。
　撮影前に、撮影判定された被写体に対して、撮影することを知らせる報知ユニットと、
　撮影画像に関するデータを取得する取得ユニットと、
　前記取得ユニットにより取得されたデータに基づいて、前記報知ユニットの報知処理を変更する変更ユニットとを有し、
　前記変更ユニットは、前記報知処理を変更する際、自動で処理された撮影画像における前記取得ユニットにより取得されたデータよりも、ユーザによる指示がなされた撮影画像における前記取得ユニットにより取得されたデータの重みづけを大きくすることを特徴とする撮像装置。
　低消費電力モードに遷移する設定ユニットと、
　低消費電力モードからの解除を判定する解除判定ユニットと、
　撮影画像に関するデータを取得する取得ユニットと、
　前記取得ユニットにより取得されたデータに基づいて、前記設定ユニットと解除判定ユニットの少なくとも１つの判定処理を変更する変更ユニットとを有し、
　前記変更ユニットは、前記判定処理を変更する際、自動で処理された撮影画像における前記取得ユニットにより取得されたデータよりも、ユーザによる指示がなされた撮影画像における前記取得ユニットにより取得されたデータの重みづけを大きくすることを特徴とする撮像装置。
　振れを補正する振れ補正ユニットと、
　撮影画像に関するデータを取得する取得ユニットと、
　前記取得ユニットにより取得されたデータに基づいて、前記振れ補正ユニットのブレの補正処理を変更する変更ユニットとを有し、
　前記変更ユニットは、前記振れ補正処理を変更する際、自動で処理された撮影画像における前記取得ユニットにより取得されたデータよりも、ユーザによる指示がなされた撮影画像における前記取得ユニットにより取得されたデータの重みづけを大きくすることを特徴とする撮像装置。
　撮像装置であって、
　撮影ユニットにより撮影された撮影画像に関する第１のデータに基づいて、前記撮像装置の処理を変更する変更ユニットを有し、
　前記変更ユニットは、前記撮像装置の処理を変更する際、自動で処理された撮影画像における前記第１のデータよりも、ユーザによる指示がなされた撮影画像における前記第１のデータの重みづけを大きくすることを特徴とする撮像装置。
　撮像装置の制御方法であって、
　撮影ユニットにより撮影された撮影画像に関する第１のデータに基づいて、前記撮像装置の処理を変更する変更ステップを有し、
　前記変更ステップでは、前記撮像装置の処理を変更する際、自動で処理された撮影画像における前記第１のデータよりも、ユーザによる指示がなされた撮影画像における前記第１のデータの重みづけを大きくすることを特徴とする制御方法。