JP7393245B2 - 撮像装置及びその制御方法、プログラム、記憶媒体 - Google Patents

撮像装置及びその制御方法、プログラム、記憶媒体 Download PDF

Info

Publication number
JP7393245B2
JP7393245B2 JP2020030850A JP2020030850A JP7393245B2 JP 7393245 B2 JP7393245 B2 JP 7393245B2 JP 2020030850 A JP2020030850 A JP 2020030850A JP 2020030850 A JP2020030850 A JP 2020030850A JP 7393245 B2 JP7393245 B2 JP 7393245B2
Authority
JP
Japan
Prior art keywords
imaging
imaging device
unit
image
driving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020030850A
Other languages
English (en)
Other versions
JP2021135368A (ja
Inventor
勝博 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2020030850A priority Critical patent/JP7393245B2/ja
Priority to US17/170,027 priority patent/US11245830B2/en
Publication of JP2021135368A publication Critical patent/JP2021135368A/ja
Application granted granted Critical
Publication of JP7393245B2 publication Critical patent/JP7393245B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/69Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Studio Devices (AREA)
  • Details Of Cameras Including Film Mechanisms (AREA)
  • Accessories Of Cameras (AREA)

Description

本発明は、撮像装置において、音声コマンドを用いて撮影を制御する技術に関するものである。
近年、ユーザが撮影指示を与えることなく、定期的および継続的に撮影を行う自動撮影カメラが開発され実用化が進んでいる。例えば、ストラップ等でユーザの身体に装着された状態で用いられ、ユーザが日常生活で目にする光景を一定時間間隔で映像として記録する、所謂ライフログカメラが知られている。
他には、笑顔や人の顔、犬や猫、急な動きなどを認識してシャッターを切る自動撮影カメラや、PTZ(Pan/Tilt/Zoom)の制御機構を持ち、自在に撮影範囲を切り替えながら自動撮影を行うカメラも存在する。
自動撮影カメラは、通常自動的に撮影を行うが、例えば自撮り写真や集合写真、建物やモニュメントの写真など、ユーザが意図的に撮影を行いたい場合もある。そこで、このような自動カメラにおいても、音声コマンドに対応していて、動画や静止画の撮影を音声で指示できるようなものもある。
上記のように音声コマンドで撮影を指示する機能を実現する技術として、複数の集音部、検出部を用いて音声の音源の方向を検出し、検出した音源の方向に撮像部の撮像方向を向けるよう駆動部を制御して撮影を行う技術が、特許文献1に記載されている。
特開2019-117374号公報
上述の特許文献1に開示された従来技術では、入力された音声を解析して、撮影指示であると認識されれば撮影を実行できる。また、音源の方向を特定して向きを変え、撮影を実行することもできる。
しかしながら、自動撮影カメラは随時PTZの制御、特にパン角を切り替えながら自動的に撮影を行っているため、音声で撮影指示をした際に目的の被写体をフレーム内に収めて撮影することは容易ではない。また、音源の方向を特定できる場合であっても、音声指示をした人とは別の人物や建物などを撮りたい場合には、意図した撮影をすることができない。
本発明は上述した課題に鑑みてなされたものであり、その目的は、撮影の方向を自動的に駆動する手段を有する撮像装置において、音声コマンドで撮影を指示した際に、目的の被写体をフレーム内に収めて撮影できるようにすることである。
本発明に係わる撮像装置は、画像を撮像する撮像手段と、前記撮像手段の向きを変更する駆動を行う駆動手段と、音声を入力する入力手段と、入力された前記音声が撮影を指示する音声である場合に、前記駆動手段を停止させて、前記撮像手段の向きの変更が停止した停止位置で前記撮像手段に撮像を行わせるとともに、前記停止位置から前記撮像手段の向きを前記駆動手段の駆動方向のプラス方向とマイナス方向にそれぞれ所定量移動させて、前記プラス方向に移動させた位置と前記マイナス方向に移動させた位置とにおいて、それぞれ前記撮像手段に撮像を行わせるように制御する制御手段と、を備えることを特徴とする。
本発明によれば、撮影の方向を自動的に駆動する手段を有する撮像装置において、音声コマンドで撮影を指示した際に、目的の被写体をフレーム内に収めて撮影することが可能となる。
本発明の第1の実施形態に係わる遠隔撮影システムの構成を模式的に示す図。 第1の実施形態の遠隔撮影システムの機能構成例を示すブロック図。 撮影指示コマンド検出時の制御例の説明図。 パン角度変更量を決定するルックアップテーブルを示す図。 第1の実施形態における音声コマンドによる撮影処理を説明するフローチャート。 第2の実施形態における音声コマンドによる撮影処理を説明するフローチャート。 第3の実施形態における音声コマンドによる撮影処理を説明するフローチャート。
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
なお、以下の実施形態では、本発明の制御をスマートフォンで実施する場合について説明する。しかし、本発明は撮像装置と通信可能な任意の電子機器に対して適用可能である。このような電子機器には、コンピュータ機器(パーソナルコンピュータ、タブレットコンピュータ、メディアプレーヤ、PDAなど)、携帯電話機、ゲーム機などが含まれる。これらは例示であり、本発明は他の電子機器にも適用可能である。
(第1の実施形態)
図1は、本発明の第1の実施形態に係わる遠隔撮影システムの構成を模式的に示す図である。遠隔撮影システムは、図1(a)に示すように、撮像装置100と、撮像装置100を遠隔操作する外部機器であるスマートフォン110とが相互に通信可能に接続されて構成されている。
撮像装置100は鏡筒101、チルトユニット102、パンユニット103、制御ボックス104を有する。
鏡筒101は、撮像光学系としての撮影レンズ群や撮像素子を有し、制御ボックス104の制御に従って撮影を行い、得られた画像データを制御ボックス104に出力する。撮影レンズ群には、フォーカスレンズや変倍レンズなどの可動レンズと、その駆動回路が含まれる。可動レンズは制御ボックス104によって駆動される。
鏡筒101は、チルトユニット102により回転駆動される。チルトユニット102は、制御ボックス104の指示に従って、鏡筒101を撮像光学系の光軸に直交する水平軸周りに回転駆動する。チルトユニット102により、鏡筒101(光軸)の仰角または俯角が変化する。
チルトユニット102は、パンユニット103に取り付けられている。パンユニット103は、制御ボックス104の指示に従ってパンユニット102を撮像光学系の光軸に直交する垂直軸周りに回転駆動する。パンユニット103がチルトユニット102を回転させることにより、チルトユニット102に取り付けられた鏡筒101(光軸)の方位角が変化する。
図1(b)は、撮影光学系の光軸をZ軸とし、撮像素子と光軸の交点を原点とする直交座標系を示している。チルトユニット102はX軸周り(ピッチ方向)、パンユニット103はY軸周り(ヨー方向)にそれぞれ回転軸を有する。
制御ボックス104は、スマートフォン110もしくは撮像装置100が有する操作部からの指示に応じて、鏡筒101に含まれる可動レンズの駆動、鏡筒101による撮影動作、チルトユニット102およびパンユニット103の動作を制御する。制御ボックス104は、撮像画像のデータや、撮像装置100の情報をスマートフォン110に送信する。
また、制御ボックス104は実装されているマイク(図示しない)から周囲の音を集音し、解析することでコマンドとして認識し、コマンドの内容に基づいて撮像装置100を制御する。
スマートフォン110は、例えば撮像装置100の遠隔操作アプリケーションを実行可能な電子機器の一例である。スマートフォン110と撮像装置100は無線または有線による直接的な通信105や、コンピュータネットワークや電話ネットワークなどを介した通信106により、相互に通信可能である。なお、撮像装置100とスマートフォン110とは、両者がサポートする任意の通信プロトコルを用いて通信することができる。
図2は、遠隔撮影システムの機能構成例を示すブロック図であり、図1と同じ構成については同じ参照符号を付している。
鏡筒101は、レンズユニット201(撮影光学系)および撮像部202を有し、チルトユニット102およびパンユニット103によって光軸の向きを調整することができる。
レンズユニット201が有する変倍レンズやフォーカスレンズなどの可動レンズは、制御ボックス104のレンズ駆動部205によって駆動される。レンズユニット201は、撮像部202が有する撮像素子の撮像面に光学像を形成する。
撮像部202は、例えばCMOSイメージセンサである撮像素子を有し、複数の光電変換素子により、レンズユニット201が形成する光学像をアナログ信号群(アナログ画像信号)に変換する。そして、撮像部202は、アナログ画像信号にA/D変換やノイズ低減処理などを適用し、画像データとして制御ボックス104に出力する。
チルトユニット102は、鏡筒101を図1(b)のピッチ方向に回転させる駆動機構を有する。また、パンユニット103はチルトユニット102を図1(b)のヨー方向に回転させる駆動機構を有する。鏡筒駆動部206から入力される駆動指示によって鏡筒101を回転駆動する。
制御ボックス104は、画像処理部203、画像記録部204、レンズ駆動部205、鏡筒駆動部206、制御部207、構図決定部208、顔検出部209、通信部210、ROM211、システムメモリ212、音声解析部213、マイク(集音部)214を有する。
画像処理部203は、鏡筒101の撮像部202から出力された画像データに対して、歪曲補正処理、ホワイトバランス調整処理、色補間処理、符号化処理などの画像処理を適用し、記録用および表示用の画像データを生成する。表示用の画像データは記録用の画像データの解像度を下げたものであってもよい。また、画像処理部203は記録用の画像データのみを生成してもよい。
記録用の画像データは画像記録部204に出力される。画像記録部204は、画像処理部203から出力されたデジタル画像データをJPEGやMPEGといった仕様に応じた形式のデータファイルに格納して不揮発性メモリなどの記録媒体に記録する。画像処理部203が生成する画像データは顔検出部209および通信部210にも出力される。
顔検出部209は、画像処理部203から入力される画像データに対し、公知の顔検出処理を適用し、人物の顔と思われる領域(顔領域)を検出する。顔検出部209は検出結果(顔領域の数および位置情報)を構図決定部208に出力する。なお、顔領域は撮像装置100が追尾機能や構図を自動決定する機能の対象とする被写体領域の一例である。したがって、顔検出部209は、予め定められた被写体の領域を検出する構成の一例である。
通信部210は、スマートフォン110や他の外部機器と撮像装置100との通信を実現するための通信インタフェースである。通信部210は有線通信および無線通信の1種類以上に対応した構成を有する。通信部210が対応可能な通信規格には例えばUSB、イーサネット(登録商標)、HDMI(登録商標)、無線LAN(IEEE802.11シリーズ)、ブルートゥース(登録商標)、3GPP 3G、4G、5Gなどがあるが、これらに限定されない。
レンズ駆動部205は、制御部207から入力される指示(例えば目標位置と駆動速度)に基づいて、レンズユニット201に含まれるズームレンズや焦点レンズを駆動する。
鏡筒駆動部206は、制御部207から入力される指示(例えば回転方向と回転量)に基づいてチルトユニット102およびパンユニット103を駆動する。
制御部207は、例えばCPUなどのマイクロプロセッサであり、ROM211に記憶されたプログラムをシステムメモリ212に読み込んで実行することにより、撮像装置100の各部の動作を制御し、撮像装置100の機能を実現する。
ROM211は、書き換え可能な不揮発性メモリであり、制御部207が実行するプログラム、登録音声コマンド、撮像装置100の各種の設定値を記憶する。システムメモリ212は、制御部207がプログラムを実行する際に用いるメモリである。
制御部207は、構図決定部208から入力される倍率情報と位置情報、および音声解析部213から入力されるにコマンド情報とに基づいて、レンズ駆動部205および鏡筒駆動部206を制御するための指示または命令(例えば目標位置と駆動速度)を生成する。そして、制御部207は、生成した指示をレンズ駆動部205および鏡筒駆動部206に出力する。
構図決定部208は、顔検出部209から入力される、撮像画像中で検出された顔領域の位置情報に基づいて、構図を決定する。構図決定部208は例えば、顔領域の大きさが予め定められたサイズ以上になるように倍率を決定することができる。また、構図決定部208は例えば、顔領域の位置が画像の中央に位置するように撮影方向を決定することができる。そして、構図決定部208は、決定した倍率および撮影方向を実現するための倍率および目標位置(パン角度およびチルト角度)を求め、制御部207に出力する。なお、ここで説明した構図決定方法は単なる例示であり、他の方法を用いてもよい。
また、構図決定部208は、通信部210を通してスマートフォン110からパン、チルト、またはズーム動作を指示する命令を受信した場合には、命令に基づいた目標位置や目標倍率を決定して制御部207および通信部210に出力する。なお、構図決定部208は、独立したブロックとして図示しているが、制御部207によって実現されてもよい。
音声解析部213は、マイク214により集音した音声データが、音声コマンドであるか否か、並びに、ROM211に記憶されている登録音声コマンドに一致するか否かの判定を行う。そして音声解析部213は、ROM211に記憶されている登録音声コマンドに一致する音声データを検出した場合に、何を指示するコマンドであるかを示すコマンド情報を制御部207に出力する。なお、音声認識そのものは周知技術であるため、ここでの説明は省略する。
マイク214は、撮像装置100の電源がON状態の場合に、入力される音声を集音し、音声データとして音声解析部213に出力する。
次に、スマートフォン110の構成について説明する。通信部254は、撮像装置100や他の機器とスマートフォン110との通信を実現するための通信インタフェースである。通信部254は、撮像装置100が有する通信部210と基本的に同様の構成を有するものであってもよい。ただし、スマートフォン110は通話機能を有するため、通信部254は電話通信網との通信機能を含んでいる。
制御部261は、例えばCPUなどのマイクロプロセッサであり、記憶部252に記憶されたプログラムをシステムメモリ262に読み込んで実行することにより、スマートフォン110の各部の動作を制御し、スマートフォン110の機能を実現する。
記憶部252は、書き換え可能な不揮発性メモリであり、制御部261が実行するプログラム、スマートフォン110の各種の設定値、GUIデータなどを記憶する。後述する遠隔撮影アプリケーションも記憶部252に記憶されている。システムメモリ262は、制御部261がプログラムを実行する際に用いるメモリである。システムメモリ262の一部は、表示部257のビデオメモリとしても用いられる。
電源部260は、スマートフォン110内の構成要素に電源を供給する。表示部257は、例えばタッチディスプレイである。表示部257は、指紋センサやスピーカなど、他の機能を有していてもよい。表示部257には、スマートフォン110のOSやアプリケーションが提供するUI(ユーザインタフェース)や撮像画像などが表示される。
操作部258は、例えばユーザがスマートフォン110に指示を与えるための入力デバイスの総称である。音量調整ボタン、電源ボタンなどが含まれる。なお、表示部257に設けられているタッチパネルも操作部に含まれる。
音声処理部259は、例えばスマートフォン110に内蔵されたマイクから得られる音声信号を処理する。音声処理部259は音声認識機能を有していてもよい。この場合、ユーザは命令やテキストの入力に音声を用いることができる。なお、音声認識機能は通信部254を通じて通信可能な外部装置の機能を用いて実現してもよい。
GPS(Global positioning system)レシーバ255は、GPS衛星から受信した信号に基づく測位処理によりスマートフォン110の位置情報(経度・緯度情報)を取得する。なお、スマートフォン110の位置情報は、WPS(Wi-Fi Positioning System)など、他の方法を用いて取得してもよい。
制御部261は、スマートフォン110の現在の位置情報が予め設定されている地理的範囲に含まれることや、現在位置の所定の変化の検出を、撮像装置100を制御するためのイベント情報として用いることができる。例えば制御部261は、イベント情報を撮像装置100の撮影開始や停止のトリガとして用いることができる。
撮像装置100とスマートフォン110は、通信部210と通信部254を通じて双方向の通信を行う。例えば、撮像装置100は、撮像部202で得られた音声信号および画像信号や、撮像装置100の情報などをスマートフォン110に送信したり、スマートフォン110から各種のコマンドを受信したりする。また、スマートフォン110は、パン、チルト、ズーム、撮影の開始および停止などのコマンドを撮像装置100に送信したり、コマンドの実行結果を受信したりする。
通信部210と通信部254は、異なる通信規格に基づく複数の通信路を同時に、あるいは選択的に用いて通信することができる。例えば通信部210と通信部254は、第1の規格(例えば無線LAN規格)に基づく第1の通信路231と、第2の規格(例えばBLE規格)に基づく第2の通信路232とを用いて通信することができる。例えば、通信の目的に応じて、適切な消費電力、通信可能な距離、および通信速度の複数の規格に基づく通信を行うことにより、消費電力を低減したり、通信の効率化を図ることができる。
例えば、撮像装置100の制御部207は、撮像装置100の起動後、通信部210を通じた通信要求の受信を監視している。この状態で動画を撮影したり静止画を周期的に撮影したりして、得られた画像データを画像記録部204に記録してもよい。
スマートフォン110において遠隔撮影アプリケーションが実行されると、制御部261は、撮像装置100に対して通信要求を送信する。なお、撮像装置100との通信に必要な情報は記憶部252に設定されているものとする。
制御部207は、スマートフォン110からの通信要求を受信すると、通信規格に定められた手順で制御部261との間で情報の交換を行い、通信を確立する。制御部207は、スマートフォン110との通信が確立すると、撮像装置100の情報をスマートフォン110に送信する。撮像装置100の情報には機種や撮像素子のサイズに関する情報、撮像光学系に関する情報が含まれていてもよい。また、撮影光学系の情報には、ズーム倍率1倍に相当する焦点距離、レンズ情報(撮影光学系のズーム倍率、チルトユニットの回転角、パンユニットの回転角)、撮影光学系の調整可能範囲(例えば倍率および回転角の最小値ならびに最大値)が含まれていてもよい。
また、制御部207は、スマートフォン110への撮像画像の送信を開始する。スマートフォン110に送信する撮像画像は、画像処理部203が生成する表示用の画像データであってもよい。画像処理部203が表示用の画像データを生成しない場合には、制御部207が記録用の画像データから表示用の画像データを生成してもよい。なお、ここでは撮像装置100は所定のフレームレートを有する動画を撮影するものとするが、スマートフォン110からの指示に応じて静止画を撮影してもよい。
制御部261は、通信が確立した撮像装置100から、撮像装置100の情報を受信すると、システムメモリ262に記憶する。また、制御部261は、撮像装置100から撮像画像の受信を開始すると、遠隔撮影アプリケーションが生成するGUI画面を表示部257に表示する。
図3は、撮像装置100が「撮影」を指示する音声コマンドを検出した際の制御例を示す図である。
図3(a)は、ユーザが音声コマンド指示によって撮影したい被写体300を撮像装置100が画角の中心に捉えている状況を示している。ここで扇形302は撮像装置100の画角範囲を、実線301は画角中心をそれぞれ示す。
ここで、撮像装置100は、撮影する被写体を探すためにパン角度を自動的に変更制御する。本実施形態においては、最大角速度50degree/sec(以下deg/s)で変更制御可能としている。また、ユーザは音声コマンドによって撮影指示をすることができる。撮像装置100は撮影指示を検出すると、パン角度変更動作を停止して撮影を行う。撮像装置100がパン角度を変更中にユーザが音声コマンドで撮影指示をする場合には、音声を発するタイミングおよび撮像装置100によって音声コマンドが検出されるタイミングによってユーザが意図した位置とは異なる位置で停止して撮影されることが考えられる。
図3(b)は、図3(a)の位置での撮像装置100が左回りに50deg/sでパン角度を変更制御していた場合に、被写体300の中心が撮像装置100の画角中心301となる位置で止める意図でユーザが発した撮影指示音声の検出が1秒遅延した場合に停止した状態を示す。
この状態での撮像装置100の画角中心304は、本来撮影したかった図3(a)の位置での画角中心301に対して、左回りに50°進んだ位置となる。その結果、この位置で撮影を行った場合、被写体300を画角内に収めた画像を撮影することができないことを示している。
図3(c)は、図3(b)の状態から撮像装置100が右回りに30°パン角度を変更して停止した状態を示す。この状態での撮像装置100の画角中心305は、図3(b)の位置での画角中心304に対して右回りに30°の位置となっていて、画角範囲を示す扇形302は被写体300を含んでいる。
図3(d)は、図3(c)の状態から撮像装置100が左回りに60°パン角度を変更して停止した状態を示す。この状態での撮像装置100の画角中心306は図3(c)の位置での画角中心305に対して左回りに60°の位置となっていて、図3(b)の位置での画角中心304からは左回りに30°の位置となっている。
この例では、ユーザが撮影を意図した位置に対して撮像装置100のパン位置が1秒分進んで止まった場合について記載したため、図3(d)の位置では扇形302は被写体300を収められていない。しかし、実際には、ユーザが撮像装置100のパン動作を考慮して、撮影を意図した位置に対して事前に撮影指示を行うことで、パン位置が手前で停止することも考えられる。その際に、1秒程度手前で停止した場合には図3(d)の位置で被写体300を画角に収めることができる。
つまり、ユーザが撮影したいと意図した鏡筒101の位置に対して、ユーザが撮影指示の音声を発するタイミングにより、鏡筒101が行き過ぎた位置で止まったり、手前の位置で止まったりすることがある。その場合には、鏡筒101の停止目標位置に対してズレた量の大小により、被写体300を撮像装置100の画角内に収められない場合が発生する。そのため、本実施形態では、鏡筒101の停止位置に対して、鏡筒101の駆動方向のプラス方向とマイナス方向(左右方向)にそれぞれ所定角度ずつ鏡筒101の向きをシフトさせて(所定量移動させて)、それぞれの位置で撮影を行わせる。これにより、ユーザの目的の被写体を撮影画角内に収めることが可能となる。
なお、本実施形態では、左右に変更する(シフトさせる)パン角度を固定値の30°とする例を示したが、変更するパン角度は、音声コマンド受信時のパン角度の変更速度(deg/s)、ズーム倍率やその他の条件に応じて決定してもよい。なぜならば、音声コマンド受信時のパン角度の変更速度が早ければ、音声コマンドのタイミングのズレにより、鏡筒101の目標位置に対して行き過ぎてしまったり、手前で止まったりするズレ量が大きくなるからである。その場合には、鏡筒101の向きをシフトさせる量も大きくすることにより、目標の被写体を画角内に収められるようにする。また、同様に、音声コマンド受信時のズーム倍率が大きいと、画角が狭くなるので、鏡筒101の停止位置がズレた場合に、被写体が画角から外れやすくなる。そのため、この場合も、鏡筒101の向きをシフトさせる量を大きくして、目標の被写体を画角内に収められるようにする。
一例として、図4に音声コマンド受信時のパン角度の変更速度とズーム倍率に応じて決定するパン角度変更量(鏡筒101をシフトさせる角度)のルックアップテーブルを示す。この例では、目的の被写体をより的確にフレームに収められるよう、音声コマンド受信時のパン角度の変更速度が速いほど、ズーム倍率が高いほどパン角度変更量を大きくしている。
また、音声コマンド受信時にズームをワイド端(広角端)に戻したり、特定のズーム倍率に変更してからパン角度の変更および静止画撮影を行うようにしてもよい。
図5は、第1の実施形態における音声コマンドによる撮影処理を説明するフローチャートである。この図を用いて、音声コマンド入力時に撮像装置100が行うパン角度変更および静止画撮影を制御する処理について以下に説明する。
ステップS501では、制御部207は、撮像装置100に音声入力があった際、音声解析部213に、入力された音声データの解析を行わせる。
ステップS502では、制御部207は、ステップS501での解析の結果、撮影を指示するコマンドが検出されたか否かを判定する。制御部207は、撮影を指示するコマンドが検出された場合は、処理をステップS503に進め、検出されないと判断した場合は、このフローの処理を終了する。
ステップS503では、制御部207は、鏡筒駆動部206にパン駆動停止指示を行ってパン駆動を停止させる。
ステップS504では、制御部207は、鏡筒101に静止画を撮影させる。
ステップS505では、制御部207は、撮影した画像について、画像処理部203を用いて画像処理を行い、処理した画像を画像記録部204に保存する。
ステップS506では、制御部207は、右回りにパン角度を一定量変更する指示を鏡筒駆動部206に出力して、パン角度を変更する。
ステップS507では、制御部207は、右回りのパン角度変更量が30°に達したか否かを判定する。制御部207は、パン角度変更量が30°に達していないと判断した場合は、処理をステップS506に戻し、パン角度変更量が30°に達するまで、ステップS506とS507を繰り返す。制御部207は、パン角度変更量が30°に達したと判断すると、処理をステップS508に進める。
ステップS508では、制御部207は、鏡筒101に静止画撮影を行わせる。
ステップS509では、制御部207は、撮影した画像を画像記録部204へ保存する。
ステップS510では、制御部207は、左回りにパン角度を一定量変更する指示を鏡筒駆動部206に出力して、パン角度を変更する。
ステップS511では、制御部207は、左回りのパン角度変更量が60°に達したか否かを判定する。制御部207は、パン角度変更量が60°に達していないと判断した場合は、処理をステップS510に戻し、パン角度変更量が60°に達するまで、ステップS510とS511を繰り返す。制御部207は、パン角度変更量が60°に達したと判断すると、処理をステップS512に進める。
ステップS512では、制御部207は、鏡筒101に静止画撮影を行わせる。
ステップS513では、制御部207は、撮影した画像を画像記録部204へ保存する。
なお、本実施形態においては、パン角度は制限なく360°自由に変更可能であることを前提として記載したが、パン駆動範囲に制限がある場合についても同様に処理可能である。具体的にはS507、S511において回転可能な制限位置に達したか否かを併せて確認し、制限位置に達していた場合にも、それぞれS508、S512の静止画撮影処理に進めることで対処することができる。
また、本実施形態においては、撮影を指示するコマンドが検出された際に停止した位置から左右30°にパン角度を変更した位置でそれぞれ撮影を行う例を示した。これはこの範囲の中に目的の被写体が含まれることを意図しているからである。撮影を指示するコマンドが検出された後しばらくは、被写体探索のためのパン駆動範囲を上述の左右30°の範囲に制限して自動撮影を行うことも、目的の被写体を撮影するために有効である。
以上説明したように、本実施形態によれば、撮影の向きを自動的に変更することが可能な撮像装置において、ユーザが音声コマンドで撮影指示をした際に、目的の被写体をフレーム内に収めて撮影することが可能となる。
なお、本実施形態においては音声コマンドとして撮影指示によってパン駆動を停止して撮影を実行する例について説明したが、停止指示と撮影指示のコマンドが分かれている場合の処理についても同様である。
(第2の実施形態)
この第2の実施形態におけるシステム構成は、第1の実施形態と同じであるため、構成についての説明は省略し、第1の実施形態と異なる部分について以下に説明する。
図6は、第2の実施形態における音声コマンドによる撮影処理を説明するフローチャートである。この図を用いて、音声コマンド入力時に撮像装置100が行うパン角度変更および静止画撮影を制御する処理について以下に説明する。
ここで、本フローチャートは、被写体検出状態を確認する処理(ステップS601、S603)および、検出した被写体に構図を調整する処理(ステップS602、S604)が追加される以外は、図5で説明した第1の実施形態のフローチャートと同じである。そのため、ステップS601、S602、S603、S604以外の処理には、第1の実施形態と同じステップ番号を付して説明を省略する。
ステップS506において、制御部207が右回りにパン角度を一定量変更する指示を鏡筒駆動部206に出力してパン角度を変更した後、ステップS601では、制御部207は、その位置において被写体の検出状態を確認する。制御部207は、被写体が検出されないと判断した場合には、処理をステップS507に進め、被写体が検出されたと判断した場合には、処理をステップS602へ進める。ステップS602では、制御部207は、鏡筒駆動部206に鏡筒101の駆動を指示して、検出された被写体に合わせて構図を調整する。ステップS507とS508の処理は、第1の実施形態で説明した通りである。
また、同様に、ステップS510において、制御部207が左回りにパン角度を一定量変更する指示を鏡筒駆動部206に出力してパン角度を変更した後、ステップS603では、制御部207は、その位置において被写体の検出状態を確認する。制御部207は、被写体が検出されないと判断した場合には、処理をステップS511に進め、被写体が検出されたと判断した場合には、処理をステップS604へ進める。ステップS604では、制御部207は、鏡筒駆動部206に鏡筒101の駆動を指示して、検出された被写体に合わせて構図を調整する。ステップS511とS512の処理は、第1の実施形態で説明した通りである。
なお、ステップS602、S604からステップS508、S512の静止画撮影処理に進む場合には、被写体が検出されているため、ズームの変更や構図の変更(日の丸構図、三分割構図など)を行ってもよい。
以上説明したように、本実施形態によれば、撮影の向きを自動的に変更することが可能な撮像装置において、ユーザが音声コマンドで撮影指示をした際に、目的の被写体をフレーム内に収めて撮影することが可能となる。
(第3の実施形態)
この第3の実施形態におけるシステム構成は、第1の実施形態と同じであるため、構成についての説明は省略し、第1の実施形態と異なる部分について以下に説明する。
図7は、第3の実施形態における音声コマンドによる撮影処理を説明するフローチャートである。この図を用いて、音声コマンド入力時に撮像装置100が行うパン角度変更および静止画撮影を制御する処理について以下に説明する。
ここで本実施形態のフローチャートは、第1の実施形態でのパン駆動停止処理(ステップS503)が、パン位置を初期位置に変更する処理(ステップS701)に置き代わる以外は、図5で説明した第1の実施形態のフローチャートと同じである。そのため、ステップS701以外の処理には、第1の実施形態と同じステップ番号をつけて説明を省略する。
ステップS502で、制御部207が「撮影」を指示するコマンドが検出されたと判断した場合に、ステップS701では、制御部207は、鏡筒駆動部206にパン位置を初期位置に変更する指示を行い、パン位置を初期位置に変更する。その後のステップS504以下の処理は、第1の実施形態で説明した通りである。
以上説明したように、本実施形態によれば、撮影の向きを自動的に変更することが可能な撮像装置において、ユーザがあらかじめ初期位置を把握して目的の被写体に初期位置をおおよそ正対させた状態で音声コマンド撮影指示をした際に、所定の初期位置にパン位置を変更することで、目的の被写体をフレーム内に収めて撮影することができる。
(他の実施形態)
また本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現できる。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現できる。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
100:撮像装置、101:鏡筒、102:チルトユニット、103:パンユニット、104:制御ボックス、201:レンズユニット、202:撮像部、203:画像処理部、204:画像記録部、205:レンズ駆動部、206:鏡筒回転駆動部、207:制御部、208:構図決定部、209:顔検出部、213:音声解析部、214:マイク

Claims (12)

  1. 画像を撮像する撮像手段と、
    前記撮像手段の向きを変更する駆動を行う駆動手段と、
    音声を入力する入力手段と、
    入力された前記音声が撮影を指示する音声である場合に、前記駆動手段を停止させて、前記撮像手段の向きの変更が停止した停止位置で前記撮像手段に撮像を行わせるとともに、前記停止位置から前記撮像手段の向きを前記駆動手段の駆動方向のプラス方向とマイナス方向にそれぞれ所定量移動させて、前記プラス方向に移動させた位置と前記マイナス方向に移動させた位置とにおいて、それぞれ前記撮像手段に撮像を行わせるように制御する制御手段と、
    を備えることを特徴とする撮像装置。
  2. 前記駆動手段は、前記撮像手段の向きを左右方向に変更することを特徴とする請求項1に記載の撮像装置。
  3. 入力された前記音声を解析する解析手段をさらに備えることを特徴とする請求項1に記載の撮像装置。
  4. 前記解析手段は、入力された前記音声を解析して、該音声が撮影を指示する音声であるか否かを判定することを特徴とする請求項3に記載の撮像装置。
  5. 被写体を検出する検出手段と、前記撮像手段の撮像の構図を調整する調整手段とをさらに備え、前記制御手段は、前記撮像手段を前記プラス方向に移動させた位置あるいは前記マイナス方向に移動させた位置に移動させる場合に、前記撮像手段を移動させながら前記検出手段により被写体を検出させ、被写体が検出された場合に、検出された被写体に合わせて、前記調整手段により撮像の構図を調整させることを特徴とする請求項1乃至4のいずれか1項に記載の撮像装置。
  6. 前記検出手段は、前記撮像手段により撮像した画像から被写体を検出することを特徴とする請求項5に記載の撮像装置。
  7. 前記制御手段は、前記撮像手段が前記停止位置で停止した後の所定の時間の間は、前記検出手段により被写体を探索する範囲を、前記プラス方向に移動させた位置と前記マイナス方向に移動させた位置の間に制限することを特徴とする請求項5または6に記載の撮像装置。
  8. 前記撮像手段は、ズームの倍率を変更するズーム手段を有し、前記制御手段は、前記検出手段により被写体が検出された場合に、前記ズーム手段にズームの倍率を変更させることを特徴とする請求項5乃至7のいずれか1項に記載の撮像装置。
  9. 前記制御手段は、入力された前記音声が撮影を指示する音声である場合に、前記駆動手段を所定の初期位置で停止させ、前記初期位置で前記撮像手段に撮像を行わせることを特徴とする請求項1乃至4のいずれか1項に記載の撮像装置。
  10. 画像を撮像する撮像手段を備える撮像装置を制御する方法であって、
    前記撮像手段の向きを変更する駆動を行う駆動工程と、
    音声を入力する入力工程と、
    入力された前記音声が撮影を指示する音声である場合に、前記駆動工程を停止させて、前記撮像手段の向きの変更が停止した停止位置で前記撮像手段に撮像を行わせるとともに、前記停止位置から前記撮像手段の向きを前記駆動工程の駆動方向のプラス方向とマイナス方向にそれぞれ所定量移動させて、前記プラス方向に移動させた位置と前記マイナス方向に移動させた位置とにおいて、それぞれ前記撮像手段に撮像を行わせるように制御する制御工程と、
    を有することを特徴とする撮像装置の制御方法。
  11. コンピュータを、請求項1乃至9のいずれか1項に記載の撮像装置の各手段として機能させるためのプログラム。
  12. コンピュータを、請求項1乃至9のいずれか1項に記載の撮像装置の各手段として機能させるためのプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
JP2020030850A 2020-02-26 2020-02-26 撮像装置及びその制御方法、プログラム、記憶媒体 Active JP7393245B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020030850A JP7393245B2 (ja) 2020-02-26 2020-02-26 撮像装置及びその制御方法、プログラム、記憶媒体
US17/170,027 US11245830B2 (en) 2020-02-26 2021-02-08 Image capture apparatus and control method for same, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020030850A JP7393245B2 (ja) 2020-02-26 2020-02-26 撮像装置及びその制御方法、プログラム、記憶媒体

Publications (2)

Publication Number Publication Date
JP2021135368A JP2021135368A (ja) 2021-09-13
JP7393245B2 true JP7393245B2 (ja) 2023-12-06

Family

ID=77366634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020030850A Active JP7393245B2 (ja) 2020-02-26 2020-02-26 撮像装置及びその制御方法、プログラム、記憶媒体

Country Status (2)

Country Link
US (1) US11245830B2 (ja)
JP (1) JP7393245B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7212175B2 (ja) 2019-10-29 2023-01-24 富士フイルム株式会社 撮像支援装置、撮像支援システム、撮像システム、撮像支援方法、及びプログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002016909A (ja) 2000-06-28 2002-01-18 Tokin Corp パノラマ画像撮影用カメラの遠隔制御方法およびその制御システム
JP2002158916A (ja) 2000-11-20 2002-05-31 Matsushita Electric Ind Co Ltd 画像サーバー及び画像サーバーシステム
JP2008118475A (ja) 2006-11-06 2008-05-22 Canon Inc クレードル装置及びその制御方法、並びにプログラム及び記憶媒体
JP2016178534A (ja) 2015-03-20 2016-10-06 キヤノン株式会社 画像処理装置およびその方法、並びに、画像処理システム
JP2017216599A (ja) 2016-05-31 2017-12-07 キヤノン株式会社 撮像装置及びその制御方法
JP2019032405A (ja) 2017-08-07 2019-02-28 キヤノン株式会社 情報処理装置、撮影システム、撮影システムの制御方法、及びプログラム
JP2019117374A (ja) 2017-12-26 2019-07-18 キヤノン株式会社 撮像装置及びその制御方法及びプログラム
JP2019106694A5 (ja) 2018-03-20 2020-01-23

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8467672B2 (en) * 2005-10-17 2013-06-18 Jeffrey C. Konicek Voice recognition and gaze-tracking for a camera
JP5106142B2 (ja) * 2008-01-17 2012-12-26 三洋電機株式会社 電子カメラ
JP5921245B2 (ja) * 2012-02-14 2016-05-24 キヤノン株式会社 撮像装置及びその制御方法
JP6766086B2 (ja) 2017-09-28 2020-10-07 キヤノン株式会社 撮像装置およびその制御方法
JP2019117375A (ja) 2017-12-26 2019-07-18 キヤノン株式会社 撮像装置及びその制御方法及びプログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002016909A (ja) 2000-06-28 2002-01-18 Tokin Corp パノラマ画像撮影用カメラの遠隔制御方法およびその制御システム
JP2002158916A (ja) 2000-11-20 2002-05-31 Matsushita Electric Ind Co Ltd 画像サーバー及び画像サーバーシステム
JP2008118475A (ja) 2006-11-06 2008-05-22 Canon Inc クレードル装置及びその制御方法、並びにプログラム及び記憶媒体
JP2016178534A (ja) 2015-03-20 2016-10-06 キヤノン株式会社 画像処理装置およびその方法、並びに、画像処理システム
JP2017216599A (ja) 2016-05-31 2017-12-07 キヤノン株式会社 撮像装置及びその制御方法
JP2019032405A (ja) 2017-08-07 2019-02-28 キヤノン株式会社 情報処理装置、撮影システム、撮影システムの制御方法、及びプログラム
JP2019117374A (ja) 2017-12-26 2019-07-18 キヤノン株式会社 撮像装置及びその制御方法及びプログラム
JP2019106694A5 (ja) 2018-03-20 2020-01-23
JP2019117375A5 (ja) 2018-11-02 2021-12-09

Also Published As

Publication number Publication date
JP2021135368A (ja) 2021-09-13
US20210266450A1 (en) 2021-08-26
US11245830B2 (en) 2022-02-08

Similar Documents

Publication Publication Date Title
JP5967473B2 (ja) 撮像装置及び撮像システム
US8976270B2 (en) Imaging device and imaging device control method capable of taking pictures rapidly with an intuitive operation
CN106716989B (zh) 摄像装置、摄像方法及程序
US9584713B2 (en) Image capturing apparatus capable of specifying an object in image data based on object detection, motion detection and/or object recognition, communication apparatus communicating with image capturing apparatus, and control method therefor
US9094597B2 (en) Imaging apparatus and imaging system
JP6192940B2 (ja) 撮影機器及び連携撮影方法
JP5991514B2 (ja) 撮像装置及び撮像システム
KR20130069123A (ko) 촬상장치, 촬상 구도 제공 방법 및 컴퓨터 판독가능 기록매체
WO2011013563A1 (ja) 制御装置、撮像システム、制御方法、プログラム
CN111246080B (zh) 控制设备、控制方法、摄像设备以及存储介质
KR20150119793A (ko) 촬상 장치, 카메라 유닛, 표시 유닛, 촬영 방법, 표시 방법 및 기록 매체
WO2020052440A1 (zh) 用于摄影的设备控制方法及装置
TW202011218A (zh) 用於攝影的設備控制系統及方法
KR20160002330A (ko) 카메라 제어 장치, 카메라 제어 방법, 및 기록 매체
JP7393245B2 (ja) 撮像装置及びその制御方法、プログラム、記憶媒体
JP6950793B2 (ja) 電子機器およびプログラム
JP2020022052A (ja) 情報処理装置及びその制御方法
KR101814714B1 (ko) 스마트폰 카메라 원격 제어 방법 및 시스템
JP6374535B2 (ja) 操作装置、追尾システム、操作方法、及びプログラム
JP7356293B2 (ja) 電子機器およびその制御方法
JP2021100238A (ja) 画像処理装置、撮像装置および画像処理方法
JP2021111960A (ja) 撮像装置、撮像装置の制御方法、プログラム
JP2016082356A (ja) 電子機器およびプログラム
JP2016092467A (ja) 撮像装置、その制御方法とプログラム
CN113014796B (zh) 图像处理设备、摄像设备、图像处理方法和存储介质

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230221

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231025

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231027

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231124

R151 Written notification of patent or utility model registration

Ref document number: 7393245

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151