JP7307565B2 - 撮像装置、制御方法、およびプログラム - Google Patents

撮像装置、制御方法、およびプログラム Download PDF

Info

Publication number
JP7307565B2
JP7307565B2 JP2019051509A JP2019051509A JP7307565B2 JP 7307565 B2 JP7307565 B2 JP 7307565B2 JP 2019051509 A JP2019051509 A JP 2019051509A JP 2019051509 A JP2019051509 A JP 2019051509A JP 7307565 B2 JP7307565 B2 JP 7307565B2
Authority
JP
Japan
Prior art keywords
setting
setting content
voice
display area
imaging device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019051509A
Other languages
English (en)
Other versions
JP2020155887A5 (ja
JP2020155887A (ja
Inventor
太郎 松野
信行 堀江
文裕 梶村
真宏 会見
峻 川田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019051509A priority Critical patent/JP7307565B2/ja
Priority to US16/821,278 priority patent/US11729486B2/en
Publication of JP2020155887A publication Critical patent/JP2020155887A/ja
Publication of JP2020155887A5 publication Critical patent/JP2020155887A5/ja
Application granted granted Critical
Publication of JP7307565B2 publication Critical patent/JP7307565B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Description

本発明は、音声認識機能を備える撮像装置に関する。
特許文献1には、ユーザがシャッターボタンを半押ししている最中に、音声認識のトリガーとなる音声を撮像装置に記録させ、そのトリガーを利用して音声認識を行い、撮影を実行する撮像装置が記載されている。
特開2012-185343公報
特許文献1では、音声認識を実行するためのトリガーが登録された音声であり、ユーザは所定の音声を発声した後に、実際に認識させたい音声を発声する必要があるため、スムーズな音声認識ができず、利便性を損ねている。
本発明は、上記課題に鑑みてなされ、その目的は、音声認識機能をより簡単に利用できる技術を実現することである。
上記課題を解決し、目的を達成するために、本発明の撮像装置は、被写体を視認可能なファインダと、前記ファインダに対する接眼状態を検出可能な検出手段と、前記接眼状態が検出された場合に前記音声認識機能により入力された音声を認識し、認識された音声に基づいて前記撮像装置の設定を行う制御手段と、前記ファインダに情報を表示する表示手段と、を有し、前記制御手段は、前記接眼状態が検出された場合に前記音声認識機能を有効にし、前記撮像装置の設定を前記音声認識機能により認識された音声に応じた設定に変更し、前記表示手段は、前記音声認識機能を用いないで設定された第1の設定内容を表示する第1の表示領域と、前記音声認識機能により認識された音声により設定された第2の設定内容を表示する第2の表示領域とを有する
本発明によれば、ユーザが音声認識機能をより簡単に利用できるようになる。
実施形態1の装置構成を示すブロック図。 実施形態1の撮影時の処理を示すフローチャート。 実施形態1のファインダの表示例を示す図。 実施形態2の装置構成を示すブロック図。 実施形態2の撮影時の処理を示すフローチャート。 実施形態2のファインダの表示例を示す図。 実施形態2の画像再生時の処理を示すフローチャート。
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでするものでない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
[実施形態1]以下、図1を参照して、実施形態1について説明する。
<装置構成>まず、図1を参照して、実施形態1の撮像装置100の構成について説明する。
なお、本実施形態では、静止画や動画を撮影可能なデジタルカメラなどの撮像装置について述べるが、これに限られず、カメラ機能付きのタブレットデバイスやパーソナルコンピュータなどの情報処理装置、監視カメラ、医療用カメラなどであってもよい。
撮像装置100は、操作部101、制御部102、ファインダ制御部103、メモリ104、レンズ部105、撮像部106、集音部107、音声認識部108、ファインダ部109、接眼検出部110、を備える。
操作部101は、ユーザからの各種操作を受け付ける各種スイッチ、ボタン、ダイヤル、レバー、タッチパネルなどの操作部材からなる。操作部101は、ユーザ操作を制御部102に送信する。操作部101は、不図示の電源スイッチやシャッターボタン、カメラの各種設定を行うための設定ダイヤルや4方向ボタンなどを含む。操作部101は、ユーザ操作を制御部102に送信する。ユーザは、操作部101を操作することによって、撮像装置100の操作や撮像装置100に関する各種設定を行える。
制御部102は、撮像装置100の全体を統括して制御するCPUやMPU、ROM、RAMなどを備え、ROMに格納されたプログラムを実行することで、後述するフローチャートの各処理を実現する。RAMは、制御部102の動作用の定数、変数、ROMから読み出したプログラムなどを展開するワークメモリとしても使用される。ROMには、撮像時に音声入力により変更された設定内容や手動による設定内容などの情報が記憶される。また、制御部102は、ファインダ部109の表示制御を行うファインダ制御部103の機能も備える。
ファインダ制御部103は、ファインダ部109の表示画面に、撮像装置100の設定情報や動作状態などを表示する。また、ファインダ制御部103は、制御部102により画像処理が施された画像データをファインダ部109に表示することもできる。本実施形態では、ファインダ制御部103は、制御部102に含まれる機能ブロックの1つであるが、これに限定されず、例えば、制御部102と通信するプロセッサチップとして別体としてもよい。
メモリ104は、RAMチップなどで構成され、制御部102により画像処理が施された画像データなど様々なデータを記憶する。
レンズ部105は、少なくとも1枚の光学レンズを含むレンズ群と、レンズ群を駆動するための駆動部を備え、被写体像光を撮像部106の撮像面に結像させる。
撮像部106は、絞り機能を備えるシャッター、レンズ部105により結像された被写体像光を電気信号に変換するCCDやCMOS素子等で構成される撮像素子、撮像素子から出力されるアナログ画像信号をデジタル信号に変換するA/D変換器を有する。撮像部106は、制御部102の制御により、撮像部106に含まれるレンズにより結像された被写体像光を、撮像素子により電気信号に変換し、ノイズ低減処理などを行って、デジタル信号からなる撮像データを出力する。
制御部102は、撮像部106から出力される撮像データに対して各種の画像処理を行って画像データを生成し、不図示のメモリカードやハードディスクなどの記録媒体に記録する。また、制御部102は、画像データを用いて所定の演算処理を行い、得られた演算結果に基づきレンズ部105や撮像部106の絞り/シャッターを制御することで、AF(オートフォーカス)処理やAE(自動露出)処理を行う。
集音部107は、撮像装置100の周辺の音声を入力するマイクであり、撮像装置100の周辺の音声を収集して、音声信号として音声認識部108に送信する。
音声認識部108は、集音部107から入力された音声信号を認識可能であり、様々な音声認識アルゴリズムが実行可能となるライブラリ、通信機能、演算機能を有する。音声認識部108は、音声認識アルゴリズムを用いて集音部107から送信される音声信号の中から、ユーザの意図する設定や指示を認識し、認識結果を制御部102へ送信する。
ファインダ部109は、ユーザが接眼して覗き込むことにより、被写体が視認可能である。
接眼検出部110は、ユーザの眼がファインダ部109に所定の距離まで接近した状態または接触した状態(以下、接眼状態)を検出可能である。ファインダ部109は、ユーザの接眼状態を検出すると、検出結果を制御部102に送信する。
なお、撮像装置100の各構成要素には、不図示の電源から電力が供給され、各構成要素は供給される電力によって動作する。
<撮影時の処理>次に、図2を参照して、実施形態1の撮影時の処理を説明する。
なお、図2の処理は、制御部102がROMに記憶されたプログラムを実行することで実現される。後述する図5や図7でも同様である。
以下では、制御部102に接続されている各構成要素は、特に明記していない場合は、制御部102からの制御信号を受けて動作するものとする。
S200では、ユーザが撮像装置100の電源をオンし撮像装置100の動作モードを撮影モードに設定する、あるいは、前回の電源オフ時の動作モードの設定が撮影モードの状態で撮像装置100の電源がオンされると、制御部102は撮像装置100の動作モードを撮影モードに設定し、撮影処理を開始する。ユーザは撮像装置100を被写体に向け、撮像部106が被写体像を撮像し、撮像した画像をファインダ部109に表示する。この場合、ユーザは操作部101により撮像装置100の設定を完了し、図3(a)に示すファインダ部109の手動設定表示領域302には、撮像装置100の設定情報が表示される。図3(a)の詳細は後述する。
S201では、制御部102は、接眼検出部110によりユーザの接眼状態を検出する。制御部102は、接眼検出部110から検出結果を受信し、ユーザの接眼状態が検出されたと判定した場合は処理をS202に進め、検出していないと判定した場合は処理をS210に進める。
S202では、制御部102は、ユーザの接眼状態が検出されているので音声認識機能を有効に設定する。音声認識機能が有効に設定されると、集音部107が起動し、ユーザが発声した音声など、撮像装置100の周囲の音声が入力可能な状態となる。また、音声認識部108は、集音部107から送信された音声信号について、有効な音声か否かを音声認識アルゴリズムによって認識する。なお、上述した音声認識部108の音声認識アルゴリズムの代わりとして、機械学習された学習済みモデルを用いて処理してもよい。その場合には、例えば、その音声認識部への入力データと出力データとの組合せを学習データとして複数個準備し、それらの学習データを使った機械学習によって知識を獲得し、獲得した知識に基づいて入力データに対する出力データを結果として出力する学習済みモデルを生成する。学習済みモデルは、例えばニューラルネットワークモデルで構成可能である。そして、その学習済みモデルは、上記音声認識部と同等の処理をするためのプログラムとして、CPUあるいはGPUなどと協働で動作することにより、上記処理を行う。なお、上記学習済みモデルは、必要に応じて一定の処理後に更新してもよい。
S203では、制御部102は、音声認識部108が、集音部107から入力された音声信号を有効な音声であると認識したか否かを判定する。制御部102は、音声認識部108により有効な音声であると認識された場合は処理をS204に進め、有効な音声ではないと認識された場合は処理をS206に進める。有効な音声とは、音声認識部108による音声認識結果が、撮像装置100の動作や設定に結びつくような音声のことを意味する。判定方法は様々なアルゴリズムが存在するが、有効な音声が入力されたか否かを判定できる方法であれば、特定の方法に限定されず、あらゆる方法を採用できる。
S204では、制御部102は、集音部107から入力された音声信号が有効な音声であると認識されているので、音声認識部108から音声認識結果を受信する。
S205では、制御部102は、音声認識部108から受信した音声認識結果に基づき、撮像装置100の設定を行う。
S206では、制御部102は、ファインダ制御部103により、制御部102が設定した撮像装置100の設定内容を、図3(b)に示すファインダ部109の音声設定表示領域310に表示する。図3(b)の詳細は後述するが、ファインダ部109の音声設定表示領域310に、ユーザにより音声入力された設定内容を表示することにより、ユーザは音声認識された設定を容易に確認することができる。
S207では、制御部102は、ユーザから撮影指示が入力されたか否かを判定し、撮影指示が入力されたと判定した場合は処理をS208に進め、撮影指示が入力されていないと判定した場合は処理をS201に戻す。撮影指示は、ユーザが操作部101の、例えばシャッターボタンを操作することで制御部102へ送信される。
S208では、制御部102は、ユーザの撮影指示に従い、撮像装置100の各構成要素を制御して撮影処理を実行する。撮影処理の詳細は省略するが、概ね以下のような処理を行う。
ユーザからの撮影指示を受け付けると、撮像部106は、レンズ部105から入射した被写体像光を電気信号に変換したアナログ信号をデジタル信号に変換し、撮像データとして、制御部102へ送信する。制御部102は、撮像部106から受信した撮像データをメモリ104に一時的に記憶し、順次画像処理を施すことで最終的な画像データを生成して不図示のメモリカードやハードディスクなどの記録媒体に記録する。撮像から記録までの一連の処理が完了すると、制御部102は処理をS209に進め、撮影処理を終了する。
S210では、制御部102は、接眼検出部110によりユーザの接眼状態が検出されていない非接眼状態のままで所定の時間が経過したか否かを判定する。制御部102は、非接眼状態のままで所定の時間が経過したと判定した場合は処理をS211に進め、所定の時間が経過していないと判定した場合は処理をS207に進める。
S211では、制御部102は、ファインダ部109の音声設定表示領域310に設定内容を表示しているか否かを判定する。制御部102は、ファインダ部109の音声設定表示領域310に設定内容を表示していると判定した場合は処理をS212に進め、表示していないと判定した場合は処理をS207に戻す。
S212では、制御部102は、音声設定表示領域310に表示されている設定内容を無効にし、手動設定表示領域302に表示されている設定内容を有効にする。これにより、制御部102は、手動設定表示領域302に表示されている設定内容に従って、撮像装置100を制御する。
S213では、制御部102は、ファインダ制御部103によりファインダ部109の音声設定表示領域310に表示されていた設定内容を非表示にし、処理をS207に進める。非表示にする理由は、音声入力された設定内容は、あくまで一時的な設定であり、恒久的には手動による設定内容がユーザの意思に沿った設定であると考えられるからである。
上述したS210からS213の処理を実行することで、撮像装置100の設定を、音声入力による一時的な設定内容から、手動による設定内容に簡単に戻すことができる。
<ファインダの表示例>次に、図3を参照して、実施形態1のファインダ部109の表示例を説明する。
図3(a)は、図2のS200における撮影開始時におけるファインダ部109の表示例を示している。
ファインダ部109は、被写体表示領域301、手動設定表示領域302および音声設定表示領域310を含む。
被写体表示領域301は、撮像部106により撮像され、制御部102により生成された画像データを表示する領域である。ユーザは、被写体表示領域301に表示される画像を見て被写体の状態や構図などを確認できる。
手動設定表示領域302は、ユーザが操作部101に含まれる操作部材などを用いて手動で設定可能な項目(アイテム)が表示される領域である。各設定項目には、各種設定内容その他の撮影に関する設定値や絵柄(アイコン)などの情報が表示される。なお、本実施形態では、手動設定表示領域302に表示される項目としてユーザが手動で設定した項目を例示しているが、音声認識機能を用いないで設定された項目であればよく、例えば、撮像装置100のデフォルトの設定内容、オートモードにおいて撮像装置100が自動で生成した設定内容などでもよい。図3(a)の手動設定表示領域302には、ユーザが手動で設定した項目が例示されている。
アイテム3021はユーザが手動で設定したフォーカスモードを表示する。アイテム3022はユーザが手動で設定した測光モードを表示する。アイテム3023はユーザが手動で設定したフラッシュのオン/オフの設定を表示する。アイテム3024はユーザが手動で設定したシャッタースピードを表示する。アイテム3025はユーザが手動で設定した絞り値を表示する。アイテム3026はユーザが手動で設定した露出補正値を表示する。アイテム3027はユーザが手動で設定したISO感度を表示する。アイテム3028は現在の撮影可能枚数を表示する。アイテム3029は現在の電池残量を表示する。
本実施形態では9項目を例示しているが、音声入力された設定内容は少なくとも1項目でもよい。
被写体303は、ユーザが撮影しようとする撮影対象である。
次に、図2のS201からS206において、ユーザがファインダ部109に接眼した状態で音声を入力して撮像装置100の設定が一時的に変更されると、ファインダ部109の表示は、図3(a)から図3(b)に遷移する。
図3(b)は、図2のS206におけるファインダ部109の表示例を示し、図3(a)と同様の表示については同一の符号を付して説明を省略する。
音声設定表示領域310は、図2のS201からS206において音声入力された設定項目と設定内容が表示される領域である。図3(b)の音声設定表示領域310には、ユーザにより音声入力された設定内容が例示されている。
アイテム3111は音声入力により設定(変更)されたフォーカスモードを表示する。アイテム3112は音声入力により設定(変更)された露出補正値を表示する。アイテム3113は音声入力により設定(変更)されたISO感度を表示する。アイテム3114は音声入力により設定(変更)された測光モードを表示する。アイテム3115は音声入力により設定(変更)されたシャッタースピードを表示する。
図3(b)に示すように、手動設定表示領域302と音声設定表示領域310に同じカテゴリの設定が表示されている場合、そのカテゴリの設定に関しては、手動設定表示領域302の設定は無効とされ、音声設定表示領域310の設定が有効とされる。例えば、手動で設定されたフォーカスモード(アイテム3021)は無効となり、音声入力による設定されたフォーカスモード(アイテム3111)が有効となる。このようにする理由は、音声入力された直後の撮影においては、音声入力により変更された設定を優先することが、ユーザの意思に沿っていると考えられるからである。
また、図3(b)の例では、音声設定表示領域310に表示されていない設定内容については、手動設定表示領域302に表示されている設定内容が有効となる。例えば、手動で設定されたストロボ設定(アイテム3023)および絞り値(アイテム3025)は有効となる。
図3(b)に示すように音声設定表示領域310に音声入力された設定内容が表示された状態で、S207およびS208においてユーザが撮影を実行することにより、ユーザは音声入力した設定内容で撮影を実行することができる。
また、音声設定表示領域310に音声入力した設定内容が表示されている場合に、ユーザがファインダ部109への接眼をやめ、所定の時間が経過した場合は、S210~S213の処理となる。この場合、ファインダ部109の表示は、図3(b)から図3(a)に戻る。これは、音声入力により変更された設定内容は、あくまで一時的なものであり、恒久的には手動による設定内容がユーザの意思に沿った設定内容であると考えられるからである。
このような制御を行うことにより、撮像装置100の設定を、音声入力した一時的な設定内容から、手動による設定内容に簡単に戻すことができる。
本実施形態の撮像装置100は、ファインダ部109への接眼状態を検出し、接眼状態の場合は音声認識機能を有効にすることで、撮影時の設定変更のためにブラインドタッチを必要とする機会が減少し、ユーザがストレスなく撮影可能となる。
なお、撮像装置100は、ファインダ部109とは別に不図示の液晶パネルなどを備えていてもよい。そして、ユーザがファインダ部109に接眼していない非接眼状態においては、図3と同様の表示を不図示の液晶パネルに表示するようにしてもよい。
また、被写体表示領域301、手動設定表示領域302および音声設定表示領域310は、図3に示す配置に限らない。例えば、手動設定表示領域302と音声設定表示領域310が、ファインダ部109において左右や上下に分かれて配置されるレイアウトなどであってもよい。
また、手動設定表示領域302および音声設定表示領域310は、被写体表示領域301に対して重なっていても重なっていなくてもよい。例えば、図3(b)では、被写体表示領域301に対して、音声設定表示領域310は重なっているが、手動設定表示領域302は重なっていない。
さらに、手動設定表示領域302または音声設定表示領域310において、被写体表示領域301と重なっている領域は、被写体表示領域301の画像が視認可能に透過されていてもよい。あるいは、表示されている設定をユーザが視認できればよいので、重なった領域を完全に透過させてもよい。
[実施形態2]以下、図4から図7を参照して、実施形態2について説明する。
まず、図4を参照して、実施形態2の撮像装置400の構成について説明する。
撮像装置400は、操作部401、制御部402、表示部403、記録部404を備える。また、撮像装置400は、実施形態1の撮像装置100と同様の構成要素として、ファインダ制御部103、メモリ104、レンズ部105、撮像部106、集音部107、音声認識部108、ファインダ部109、接眼検出部110、を備える。
以下では、実施形態1の撮像装置100の同様の構成要素には同一の符号を付して説明を省略し、異なる構成を中心に説明する。
操作部401は、実施形態1の操作部101と同等の機能に加え、ユーザ操作により物理的な位置を選択することで撮像装置400の設定を行う設定ダイヤル4011を備える。設定ダイヤル4011は、撮像装置00の設定を切り替えるための回転式の操作部材であり、ユーザは設定ダイヤル4011を回転させて所望の設定位置を選択することで、フォーカスモードなどを変更することができる。
制御部402は、実施形態1の制御部102と同等の機能に加え、撮像部106で撮像され、画像処理が施された画像データを記録部404に記録する。制御部402は、撮影時の設定や、それらの設定内容が手動設定されたものなのか、音声入力されたものなのか、などを示すメタデータを、画像データに付加して記録する。また、制御部402は、記録部404に記録されている画像データを読み出し、表示部403に表示する画像再生処理を行う。
表示部403は、液晶パネルや有機ELパネルなどで構成され、記録部404に記録されている画像データを再生し表示する。ユーザは、表示部403に表示された画像一覧から操作部401を介して所望の画像を選択することにより、選択された画像が表示部403に表示される。また、表示部403は、ユーザに報知する機能も備える。
記録部404は、不図示のメモリカードやハードディスクなどの記録媒体であり、制御部402で生成された画像データを記録する。
<撮影時の動作>次に、図5を参照して、実施形態2の撮影時の処理を説明する。
以下では、実施形態1の図2と同等の処理には、図2と同様のステップ番号を付して説明を省略し、異なる処理を中心に説明する。また、図5の処理において、実施形態1の操作部101および制御部102は、本実施形態では操作部401および制御部402と読み替えるものとする。
また、制御部402に接続されている各構成要素は、特に明記していない場合は、制御部402からの制御信号を受けて動作するものとする。
S200~S206は、図2と同様の処理である。
S501では、制御部402は、手動設定表示領域302に表示されている設定内容を、音声設定表示領域310に表示されている設定内容で上書きするユーザ指示を受け付けたか否かを判定する。制御部402は、指示が入力されたと判定した場合は処理をS502に進め、指示が入力されていないと判定した場合は処理をS207に進める。
ユーザは、操作部401を介して所定の操作を行うことにより、手動設定表示領域302に表示されている設定内容を、音声設定表示領域310に表示されている設定内容に置き換えることができる。所定の操作は、決められた語句(「設定上書き」など)を発声(音声入力)する、操作部401の所定のボタンを長押しあるいは二度押しするなど、設定内容の上書きを実行するための操作あればどのような操作であってもよい。このような設定内容を上書きする操作を受け付け可能としたことで、簡単な操作で、音声入力した一時的な設定内容を、撮像装置00の恒久的な設定内容とすることができる。
S502では、制御部402は、音声設定表示領域310に表示されている設定内容が、設定ダイヤル4011によって選択されている設定内容と競合または相反(以下、相反)しているか否かを判定する。制御部402は、相反していないと判定した場合は処理をS503に進め、相反していると判定した場合は処理をS511に進める。例えば、設定ダイヤル4011で設定されたフォーカスモード(アイテム3021)が「AF(オートフォーカスモード)」であるとする。この場合、図3(b)に示すように、音声入力により設定されたフォーカスモード(アイテム3111)が「MF(マニュアルフォーカスモード)」であった場合、相反していると判定される。
S503では、制御部402は、設定ダイヤル4011で設定されている設定内容と、音声入力された設定内容が相反していないので、手動設定表示領域302に表示されている設定内容を、音声設定表示領域310に表示されている設定内容で上書きして表示する。
S504では、制御部402は、音声設定表示領域310の設定内容を非表示にする。S503およびS504の処理が終了した時点で、ファインダ部109の表示は、図3(b)から図6(a)に遷移する。
図6(a)は、図5のS504におけるファインダ部109の表示例を示し、図3と同様の表示については同一の符号を付して説明を省略する。
アイテム601は手動設定されたフォーカスモードが音声入力で設定されたフォーカスモードで上書きされた設定内容を表示する。
アイテム602は手動設定された測光モードが音声入力で設定された測光モードで上書きされた設定内容を表示する。
アイテム603は手動設定されたシャッタースピードが音声入力で設定されたシャッタースピードで上書きされた設定内容を表示する。
アイテム604は手動設定された露出補正値が音声入力で設定された露出補正値で上書きされた設定内容を表示する。
アイテム605は手動設定されたISO感度が音声入力で設定されたISO感度で上書きされた設定内容を表示する。
このような制御を行うことにより、手動で設定した撮像装置100の設定内容を、音声入力した設定内容に簡単に変更することができる。
S511では、制御部402は、設定ダイヤル4011によって選択されている設定内容と、音声入力された設定内容が相反しており、音声入力された設定内容をそのまま反映することができないので、音声設定表示領域310の表示を継続する。
S512では、制御部402は、設定ダイヤル4011によって選択されている設定内容と相反していない設定内容については音声入力された設定内容をそのまま反映してもよいので、音声設定表示領域310に表示されている設定内容を、手動設定表示領域302に表示する。
S513では、制御部402は、音声設定表示領域310に表示されていた設定内容のうち、S512において手動設定表示領域302に表示された設定内容に反映したものを非表示とする。
S511~S513の処理が終了した時点で、ファインダ部109の表示は、図3(b)から図6(b)に遷移する。
図6(b)は、図5のS513におけるファインダ部109の表示例を示し、図6(a)と同様の表示については同一の符号を付して説明を省略する。
アイテム611は音声入力により設定されたフォーカスモードを表示する。
アイテム612は設定ダイヤル4011によって選択されているフォーカスモードを表示する。
ここで、音声入力により設定されたフォーカスモード(アイテム611)は、設定ダイヤル4011によって選択されているフォーカスモード(アイテム612)と相反し、手動設定表示領域302に上書きできなかったため、音声設定表示領域310の表示が残っている。
これにより、ユーザは、音声入力された設定内容のうち、手動による設定内容と相反して、撮像装置400の設定を変更できなかった設定内容を容易に把握できる。
S207~S208は、図2と同様の処理である。
S505では、制御部402は、S208で得られた画像データを記録部404に記録する。この場合、制御部402は、画像データに対して、様々なメタデータを付加することができる。制御部402は、画像データの撮影時の設定が、手動設定表示領域302に表示されている設定内容か、音声設定表示領域310に表示されている設定内容か、を示すような情報を、メタデータ中に付加して記録する。
S209は、図2と同様の処理である。
このように制御することにより、ユーザが画像を再生する際に、音声入力された設定内容で撮影されたか否かを容易に把握することが可能となる。
<画像再生時の処理>次に、図7を参照して、撮像装置400の画像再生時の処理について説明する。
S700では、制御部402は、操作部401がユーザによる画像再生指示を受け付け、画像再生処理を開始する。
S701では、制御部402は、記録部40から画像データおよび画像データに付加されたメタデータを読み出す。
S702では、制御部402は、記録部40から読み出した画像データを、表示部403に表示する。
S703では、制御部402は、記録部40から読み出した画像データのメタデータに、図5のS505において記録された、音声設定表示領域310に表示されていた設定内容を示すデータがあるか否かを判定する。制御部402は、音声設定表示領域310に表示されていた設定内容を示すデータがあると判定した場合は処理をS704に進め、ないと判定した場合は処理をS710に進める。
S704では、制御部402は、S703で読み出した音声設定表示領域310に表示されていた設定内容を、現在の撮像装置400の設定として有効化するか否かをユーザが選択できる選択肢を表示部403に表示する。
S705では、制御部402は、S704において表示された選択肢からユーザが[有効化する]を選択したか否かを判定する。制御部402は、[有効化する」が選択されたと判定した場合は処理をS706に進め、[有効化しない]が選択されたと判定した場合は処理をS710に進める。
S706では、制御部402は、有効化する設定内容が、設定ダイヤル4011により設定された設定内容と相反しているか否かを判定し、相反している場合は処理をS707に進め、相反していない場合は処理をS708に進める。
S707では、S706で設定内容が相反していないので、制御部402は、メタデータに記録された音声入力された設定内容を有効化し、撮像装置400の現在の設定として反映する。この場合は、設定が相反していないため、ユーザの意図通り、撮像装置400の現在の設定内容を、音声入力された設定内容に置き換えることができる。
S708では、S706で設定内容が相反しているため、制御部402は、メタデータに記録されている音声入力された設定内容のうち、画像再生時に設定ダイヤル4011で設定された設定内容と相反していない設定のみを有効化する。この場合は、設定内容が相反しているため、ユーザの意図に反して、撮像装置400の現在の設定の中に、音声入力された設定内容を反映できなかったものが存在する。
S709では、制御部402は、メタデータに記録されている音声入力された設定内容のうち、画像再生時に設定ダイヤル4011で設定された設定内容と相反している設定内容は有効化できなかったことを表示部403に表示し、ユーザに報知する。このようにすることで、ユーザは、撮像装置400の現在の設定として反映できなかった音声入力した設定内容が何であるかを確認することができる。
S710では、制御部402は、画像再生処理を終了する。
ユーザは、音声入力された一時的な設定内容で撮影した画像を再生して、音声入力した設定内容が良かったかどうかを確認でき、よかった場合には撮像装置400の現在の設定として簡単に反映することができる。
ところで、図7のS704での選択肢の表示や、S709での報知は表示部403を通じた表示に限らず、例えば、不図示のスピーカによる音声であってもよい。
以上のように、本実施形態によれば、撮影時にユーザが接眼している状態で、撮像装置400の音声認識機能が有効となるので、音声入力による撮影や設定が可能となり、撮影時の設定変更のためにブラインドタッチを必要とする機会が減少し、ユーザがストレスなく撮影可能となる。
また、音声入力された設定内容と、手動による設定内容とを、ユーザが接眼しているファインダに明示的に分けて表示することにより、撮像装置400の現在の設定がどちらであるかをユーザが容易に把握することができる。また、ユーザが望む場合は、音声入力された設定内容を、撮像装置400の現在の設定として簡単に反映させることができる。
また、画像データのメタデータに、音声入力された設定内容と、手動による設定内容とを明示的に分けて記録することにより、音声入力された設定内容で撮影した画像データの再生時において、ユーザは音声入力した設定内容を撮像装置400の現在の設定として簡単に反映させることができる。
また、実施形態1と同様に、ファインダ部109の表示内容、図6は一例であり、これらの表示に限定されるものではない。
[他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
100…撮像装置、101…操作部、102…制御部、103…ファインダ制御部、106…撮像部、108…音声認識部、109…ファインダ部、110…接眼検出部

Claims (10)

  1. 音声認識機能を有する撮像装置であって、
    被写体を視認可能なファインダと、
    前記ファインダに対する接眼状態を検出可能な検出手段と、
    前記接眼状態が検出された場合に前記音声認識機能により入力された音声を認識し、認識された音声に基づいて前記撮像装置の設定を行う制御手段と、
    前記ファインダに情報を表示する表示手段と、を有し、
    前記制御手段は、前記接眼状態が検出された場合に前記音声認識機能を有効にし、前記撮像装置の設定を前記音声認識機能により認識された音声に応じた設定に変更し、
    前記表示手段は、前記音声認識機能を用いないで設定された第1の設定内容を表示する第1の表示領域と、前記音声認識機能により認識された音声により設定された第2の設定内容を表示する第2の表示領域とを有することを特徴とする撮像装置。
  2. 前記制御手段は、前記第2の表示領域に第2の設定内容が表示されている状態において前記検出手段が接眼状態を検出しなくなってから所定の時間が経過した場合は、前記第2の設定内容を無効にして前記第2の設定内容を非表示にし、前記第1の設定内容を有効にすることを特徴とする請求項に記載の撮像装置。
  3. 前記制御手段は、前記第2の表示領域に第2の設定内容が表示されている状態において所定の指示を受け付けた場合は、前記第1の表示領域に表示されている第1の設定内容を、前記第2の表示領域に表示されている第2の設定内容に置き換え、前記第2の表示領域の第2の設定内容を非表示にすることを特徴とする請求項またはに記載の撮像装置。
  4. ユーザ操作により物理的な位置を選択することで前記撮像装置の設定を行う設定手段をさらに有し、
    前記制御手段は、前記第2の表示領域に表示されている第2の設定内容と、前記設定手段により設定された第1の設定内容とが相反している場合、前記相反している第1の設定内容を前記第2の設定内容に置き換えないで、前記第2の表示領域の第2の設定内容の表示を継続することを特徴とする請求項に記載の撮像装置。
  5. 撮像手段と、
    前記撮像手段により撮像された画像データを記録する記録手段と、をさらに有し、
    前記制御手段は、前記撮像装置が前記第2の設定内容で前記撮像手段により画像の撮像を行った場合は、撮像された画像データに前記第2の設定内容を付加して前記記録手段に記録することを特徴とする請求項に記載の撮像装置。
  6. 前記記録手段に記録されている画像データを再生する再生手段をさらに有し、
    前記制御手段は、前記再生手段により前記記録手段から読み出した画像データに付加されている第2の設定内容を参照し、
    前記画像データに付加された第2の設定内容を、前記撮像装置の現在の設定として有効にするか否かを判定することを特徴とする請求項5に記載の撮像装置。
  7. 前記制御手段は、前記画像データに付加された第2の設定内容を、前記撮像装置の現在の設定として有効にすると判定した場合に、前記第2の設定内容のうち、前記設定手段により設定された第1の設定内容と相反していない設定を有効にし、
    前記設定手段により設定された第1の設定内容と相反する前記第2の設定内容の表示を継続し、前記設定手段により設定された第1の設定内容と相反する前記第2の設定内容を報知することを特徴とする請求項に記載の撮像装置。
  8. 前記第1の設定内容は、ユーザ操作により手動で設定された設定内容を含むことを特徴とする請求項からのいずれか1項に記載の撮像装置。
  9. 音声認識手段と、被写体を視認可能なファインダと、前記ファインダに対する接眼状態を検出可能な検出手段と、を有する撮像装置の制御方法であって、
    前記接眼状態が検出された場合に前記音声認識手段により入力された音声を認識するステップと、
    認識された音声に基づいて前記撮像装置の設定を行うステップと、
    前記ファインダに情報を表示するステップと、を有し、
    前記設定を行うステップでは、前記接眼状態が検出された場合に前記音声認識手段を有効にし、前記撮像装置の設定を前記音声認識手段により認識された音声に応じた設定に変更し、
    前記表示するステップでは、前記音声認識手段を用いないで設定された第1の設定内容を第1の表示領域に表示し、前記音声認識手段により認識された音声により設定された第2の設定内容を第2の表示領域に表示することを特徴とする制御方法。
  10. コンピュータを、請求項1からのいずれか1項に記載された撮像装置として機能させるためのプログラム。
JP2019051509A 2019-03-19 2019-03-19 撮像装置、制御方法、およびプログラム Active JP7307565B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019051509A JP7307565B2 (ja) 2019-03-19 2019-03-19 撮像装置、制御方法、およびプログラム
US16/821,278 US11729486B2 (en) 2019-03-19 2020-03-17 Image capture apparatus and control method of the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019051509A JP7307565B2 (ja) 2019-03-19 2019-03-19 撮像装置、制御方法、およびプログラム

Publications (3)

Publication Number Publication Date
JP2020155887A JP2020155887A (ja) 2020-09-24
JP2020155887A5 JP2020155887A5 (ja) 2022-03-28
JP7307565B2 true JP7307565B2 (ja) 2023-07-12

Family

ID=72515070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019051509A Active JP7307565B2 (ja) 2019-03-19 2019-03-19 撮像装置、制御方法、およびプログラム

Country Status (2)

Country Link
US (1) US11729486B2 (ja)
JP (1) JP7307565B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000221582A (ja) 1999-02-02 2000-08-11 Olympus Optical Co Ltd カメラ
JP2013058996A (ja) 2011-09-09 2013-03-28 Olympus Imaging Corp 撮影装置および撮影方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5570151A (en) * 1993-12-27 1996-10-29 Nikon Corporation Camera which operates a shutter according to a photographer's wink and the vibration level
GB2405948B (en) * 2003-09-12 2006-06-28 Canon Res Ct Europ Ltd Voice activated device
US7697827B2 (en) * 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
JP2012185343A (ja) 2011-03-07 2012-09-27 Nikon Corp 撮影装置
US9423870B2 (en) * 2012-05-08 2016-08-23 Google Inc. Input determination method
US9774776B2 (en) * 2013-09-12 2017-09-26 Hitachi Maxell, Ltd. Video recording device and camera function control program
US10948983B2 (en) * 2018-03-21 2021-03-16 Samsung Electronics Co., Ltd. System and method for utilizing gaze tracking and focal point tracking

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000221582A (ja) 1999-02-02 2000-08-11 Olympus Optical Co Ltd カメラ
JP2013058996A (ja) 2011-09-09 2013-03-28 Olympus Imaging Corp 撮影装置および撮影方法

Also Published As

Publication number Publication date
US20200304696A1 (en) 2020-09-24
US11729486B2 (en) 2023-08-15
JP2020155887A (ja) 2020-09-24

Similar Documents

Publication Publication Date Title
JP4904243B2 (ja) 撮像装置及び撮像制御方法
JP5854848B2 (ja) 撮像装置、撮像装置の制御方法、プログラム、記憶媒体
JP5169139B2 (ja) カメラ、および画像記録プログラム
JP2008206018A (ja) 撮像装置およびプログラム
JP2007006033A (ja) 対象決定装置、撮像装置および監視装置
JP2018129765A (ja) 撮像装置及びその制御方法
JP2011061703A (ja) 撮像装置及び撮像装置の制御方法
JP7433860B2 (ja) 電子機器及び電子機器の制御方法
JP4895205B2 (ja) 画像処理装置及びそのプログラム
JP2010178259A (ja) デジタルカメラ
JP7307565B2 (ja) 撮像装置、制御方法、およびプログラム
JP7293039B2 (ja) 撮像装置およびその制御方法
JP7433788B2 (ja) 制御装置、撮像装置、制御方法、プログラム
KR102345767B1 (ko) 촬상 제어장치, 제어방법 및 기억매체
JP5293769B2 (ja) 撮像装置及びそのプログラム
JP2021175133A (ja) 焦点調節装置、撮像装置、焦点調節方法、及びプログラム
JP2021018315A (ja) 制御装置、撮像装置、制御方法、プログラム
JP2009077325A (ja) カメラ装置及びカメラ制御プログラム
JP6009056B2 (ja) 撮像装置、撮像装置の制御方法、電子機器、電子機器の制御方法、プログラム、記憶媒体
JP2013007851A (ja) 撮像装置
JP6436764B2 (ja) 表示制御装置及びその制御方法
US11588981B2 (en) Control apparatus, control method, and storage medium
JP4915264B2 (ja) 撮像装置及びそのプログラム
JP6128929B2 (ja) 撮像装置及びその制御方法並びにプログラム
WO2021140746A1 (ja) 撮像装置、情報処理方法、プログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220317

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230522

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230630

R151 Written notification of patent or utility model registration

Ref document number: 7307565

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151