JP2021089368A - 電子機器、電子機器の制御方法及びそのプログラム - Google Patents

電子機器、電子機器の制御方法及びそのプログラム Download PDF

Info

Publication number
JP2021089368A
JP2021089368A JP2019219652A JP2019219652A JP2021089368A JP 2021089368 A JP2021089368 A JP 2021089368A JP 2019219652 A JP2019219652 A JP 2019219652A JP 2019219652 A JP2019219652 A JP 2019219652A JP 2021089368 A JP2021089368 A JP 2021089368A
Authority
JP
Japan
Prior art keywords
voice
electronic device
authentication
recognition
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019219652A
Other languages
English (en)
Inventor
西谷 仁志
Hitoshi Nishitani
仁志 西谷
義宏 小林
Yoshihiro Kobayashi
義宏 小林
智和 森
Tomokazu Mori
智和 森
明高 吉澤
Akitaka Yoshizawa
明高 吉澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019219652A priority Critical patent/JP2021089368A/ja
Publication of JP2021089368A publication Critical patent/JP2021089368A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音声操作可能な電子機器の操作の信頼性を向上させるとともに、操作を円滑にする。【解決手段】撮像装置10は接眼センサ26が接眼を検知したか否かを判定する。接眼が検知された場合、音声入力部27の感度がLow(低)に設定され、音声入力部27から入力された音声データに対して音声認識が行われる。一方で接眼が検知されていない場合、音声入力部27の感度がHigh(高)に設定され、音声入力部27から入力された音声データに対して個人認証が行われる。そして個人認証が成功した場合に、音声データに対して音声認識が行われる。そして上記の各音声認識の結果として得られた命令内容に基づいて、撮像装置10が動作する。【選択図】図2

Description

本発明は、電子機器、電子機器の制御方法及びそのプログラムに関する。
近年、音声認識技術の進歩に伴い、マイク等から音声を入力して音声操作を行う機能を備えた電子機器が普及している。特許文献1には、電子機器のマイクとユーザの顔との間の距離を検出し、その距離が近ければマイクの感度を下げてユーザの音声のみを入力させることが記載されている。
特開2002−111801号公報
しかしながら、特許文献1に記載の技術では、電子機器とユーザの顔との間の距離が遠い場合、ユーザの音声ではない音声に対して音声認識される可能性が高まり、誤操作のおそれがある。そこで、マイクから入力された音声を個人認証し、ユーザの音声であると認証された場合に限り音声認識することが考えられる。一方で音声が入力されるたびに個人認証を行うとなると処理に時間がかかり、操作に遅れが生じてしまうという問題がある。
本発明は、このような問題点を解決するためになされたものであって、音声操作可能な電子機器の操作の信頼性を向上させるとともに、操作を円滑にすることを目的とする。
本発明の電子機器は、音声入力部に入力された音声に対して音声認識可能な電子機器であって、ユーザとの距離を検出する距離センサの検出結果に応じて、音声に対して個人認証を行う認証手段と、前記認証手段による個人認証が成功した場合に、音声に対して音声認識を行う認識手段と、を備えることを特徴とする特徴とする。
本発明によれば、音声操作可能な電子機器の操作の信頼性を向上させるとともに、操作を円滑にすることができる。
第1の実施形態に係る撮像装置の構成を示す図である。 第1の実施形態に係る音声操作処理を示すフローチャートである。 第2の実施形態に係る音声操作処理を示すフローチャートである。
以下、添付図面を参照して、本発明の好適な実施形態について説明する。
<第1の実施形態>
図1(a)は、第1の実施形態に係る撮像装置10の構成を示す図である。第1の実施形態において、撮像装置10は、デジタルカメラであり、撮影光学系100とカメラ本体200とを有している。撮像装置10は、電子機器の一例である。
撮影光学系100は、絞り11と、手振れ補正レンズ群12と、フォーカスレンズ群13とを備えており、図示しない駆動部を用いて光学像をカメラ本体200へ導くようになっている。カメラ本体200は、撮影光学系100の光学像を光電変換する撮像素子21と、露光時間を調整するメカシャッター22と、撮像素子21で撮像された撮影画像等を表示する背面液晶23や小型液晶24を備えている。小型液晶24はファインダー部の内部に設けられており、ファインダー光学系25を介して表示される画像が観察される。なお、電子シャッター機能を備えた撮像素子21であれば、メカシャッター22は不要である。また、電子シャッターに露光時間を調整する機能が搭載されている場合には、メカシャッター22は全開したままである。
撮影時には、図示されていないシャッターボタンを一段目まで浅く押す、いわゆる「半押し」することで、自動合焦と自動露出機構によるシャッター速度、絞り値等の撮影条件の設定が行われる。更に、シャッターボタンを半押しから二段目まで深く押す、いわゆる「全押し」することでメカシャッター22又は撮像素子21の電子シャッター機能が動作して撮像が行われる。なお、撮像装置10によって撮像される撮像画像は、静止画像に限られず、動画像であっても構わない。
図1(b)は、第1の実施形態に係る撮像装置10の構成を示すブロック図である。カメラ本体200は、上述の構成に加えて、接眼センサ26と、音声入力部27と、電気回路20とを備えている。図1(b)において制御信号線は省略されており、各要素間の情報の流れのみを矢印で示している。
接眼センサ26は、ファインダー部の近傍に設けられており、ファインダー部とユーザの顔との間の距離を検出可能である。接眼センサ26は、検出された距離が所定の閾値未満である場合、「接眼有り」を検出する。一方で、検出された距離が所定の閾値以上である場合、「接眼有り」は検出されない。接眼センサ26は検出結果をCPU30へ出力する。接眼センサ26は距離センサの一例である。音声入力部27は、マイクであり、ユーザから入力された音声を音声データに変換してCPU30へ出力する。音声入力部27は、CPU30の制御下で感度を少なくとも2段階(High(高)/Low(低))に設定可能である。
電気回路20には、CPU30、画像処理部31、メモリ32が実装されている。
CPU30は、撮像装置10の全体を制御する。CPU30がメモリ32に格納されるプログラムを実行することにより、撮像装置10の各構成手段を制御して、後述する各フローチャートに示す処理が実現される。また、CPU30は、撮影光学系100の各構成部を駆動する駆動部を制御する。更に、CPU30は、図示しない操作ボタンやタッチパネル等の操作部からの操作指示に従って撮像装置10の動作制御を行うとともに、音声入力部27からの音声データに対して音声認識を行って得られた命令内容に従って撮像装置10の動作制御を行う。
画像処理部31は、撮像素子21で光電変換された画像信号をデジタルデータに変換して図示されない外部メモリへ保存する。
メモリ32は、ROMやRAM等によって構成されており、撮像装置10を制御するためのプログラム、音声認識に用いられる命令内容が登録されたデータテーブルの他、各種のデータを記憶する。またメモリ32には、撮像装置10を使用するユーザの1又は複数の音声データが認証用音声データとして登録されている。認証用音声データは後述する個人認証に用いられる。なお認証用音声データが複数登録されている場合には、一部を有効にするか、全部を有効にするかを選択設定することが可能であり、有効とされた認証用音声データが個人認証に用いられる。
図2は、第1の実施形態に係る撮像装置10を音声操作する音声操作処理を示すフローチャートである。図示されない電源スイッチが操作され電源がONに切り替わると音声操作処理が開始される。なお、図2のフローチャートの各処理は、CPU30がメモリ32に格納されたプログラムを実行することにより実現される。
ステップS201では、CPU30が、接眼センサ26の検出結果を用いて接眼を検知したか否かを判定する。CPU30が接眼を検知した(接眼状態である)と判定した場合、処理はステップS202に進む。CPU30が接眼を検知していない(非接眼状態である)と判定した場合、処理はステップS204に進む。
ステップS202では、CPU30が、音声入力部27の感度を「Low」に設定する。ユーザの顔と撮像装置10との距離が近いため、感度を下げることによりユーザの音声を高い音圧で入力することが可能になる。
ステップS203では、CPU30が、音声入力部27に音声が入力されたか否かを判定する。CPU30が音声が入力されたと判定した場合、処理はステップS208に進む。これにより、接眼状態で音声が入力された場合、直ちに音声操作が行われる。ユーザと撮像装置との距離が近いため、ユーザ以外の音声が入力される可能性が低いためである。CPU30が音声が入力されていないと判定した場合、処理はステップS201に戻る。
ステップS204では、CPU30が、音声入力部27の感度を「High」に設定する。ユーザの顔と撮像装置10との距離が遠いため、感度を上げることによりユーザの音声を十分な音圧で入力することが可能になる。
ステップS205では、CPU30が、音声入力部27に音声が入力されたか否かを判定する。CPU30が音声が入力されたと判定した場合、処理はステップS206に進む。CPU30が音声が入力されていないと判定した場合、処理はステップS201に戻る。
ステップS206では、CPU30が、ステップS205で入力された音声データに対して個人認証を行う。具体的には、メモリ32に登録されている認証用音声データを読み出して、ステップS205の音声データと認証用音声データの声紋等を比較する。
ステップS207では、CPU30が、ステップS205で入力された音声データが認証用音声データと一致しているか否かを判定する。なお、一致している場合には類似している場合も含む。CPU30が一致していると判定した場合、ステップS208に進む。CPU30が一致していないと判定した場合、ステップS201に戻る。これにより、非接眼状態で音声が入力された場合、登録された個人と一致した場合に限って音声操作が行われる。ユーザと撮像装置との距離が遠いため、ユーザ以外の音声が入力される可能性が高いためである。
ステップS208では、CPU30が、ステップS203又はステップS205で入力された音声データに対して音声認識を行う。具体的には、音声データを解析して文字列として認識する。
ステップS209では、CPU30が、ステップS208の音声認識の結果に基づいて、命令内容を解析する。具体的には、メモリ32からデータテーブルを読み出して、このデータテーブルに登録される操作ワードと命令内容との対応関係を用いて、音声データの文字列から命令内容を特定する。
ステップS210では、CPU30が、解析された命令内容で動作を行う。そして一連の処理が終了する。
以上のような、第1の実施形態の撮像装置10によれば、撮像装置10とユーザの顔との距離が遠いと判断される場合、入力された音声データに対して個人認証が行われる。この場合ユーザの音声以外の音声も入力される可能性が高いため、個人認証に成功した音声データに限って音声認識が行われる。従って、音声操作の信頼性を向上させることができる。一方で、撮像装置10とユーザの顔との距離が近いと判断される場合、入力された音声データに対して音声認識が行われる。この場合個人認証が行われない。従って、ユーザが音声を発してから音声操作が実行されるまでの時間を可及的に短縮することができる。
<第2の実施形態>
以下、図3を参照して、第2の実施形態に係る撮像装置10について説明する。第2の実施形態の撮像装置10による音声操作処理は、前述の第1の実施形態の撮像装置10による音声操作処理に加えて、所定の条件を満たす場合、音声認識を行った音声データに対して個人認証を行う。この点で、前述の第1の実施形態の音声操作処理とは異なる。第2の実施形態のハードウエア構成は、第1の実施形態に係る撮像装置10と同様である。従って、第1の実施形態と同様の部分については同じ符号を用いてその説明を省略する。
図3は、第2の実施形態に係る撮像装置10を音声操作する音声操作処理を示すフローチャートである。ステップS301〜S309は、図2のステップS201〜S209と同様であるため説明を割愛する。図示されない電源スイッチが操作され電源がONに切り替わると音声操作処理が開始される。なお、図3のフローチャートの各処理は、CPU30がメモリ32に格納されたプログラムを実行することにより実現される。
ステップS310では、CPU30が、所定の条件を満たすか否かを判定する。具体的には、ステップS209と同様のステップS309で解析された命令内容が所定の命令内容であるか否かを判定する。ここで所定の命令内容とは、撮像装置10にとって、重要性が高く、やり直しができない、又は困難な命令内容である。以下、所定の命令内容を「重要命令内容」という。「重要命令内容」は例えば「撮影データの消去」、「記録メモリの初期化」、「撮影設定の初期化」、「操作ボタン等のカスタマイズ情報の消去」、「動画撮影の中断」、「長時間露光撮影の中断」である。「重要命令内容」は上記のような命令内容に限られるものではなく、撮像装置10に予め設定されていてもよく、ユーザによって自由に設定されてもよい。CPU30が命令内容が「重要命令内容」であると判定した場合、処理はステップS311に進む。CPU30が命令内容が「重要命令内容」ではないと判定した場合、処理はステップS314へ進む。
ステップS311では、CPU30が、音声データに対して既に個人認証が行われているか否かを判定する。CPU30が個人認証が行われていると判定した場合、ステップS314に進む。CPU30が個人認証が行われていないと判定した場合、ステップS312に進む。
ステップS312及びS313の処理はステップS206及びS207の処理と同様である。ステップS313において、CPU30が音声データが認証用音声データと一致していると判定した場合、ステップS314に進む。CPU30が音声データが認証用音声データと一致していないと判定した場合、ステップS301に戻る。
ステップS314では、CPU30が、ステップS309で解析された命令内容で動作を行う。そして一連の処理が終了する。
なお、所定の条件を音声認識の結果として得られた命令内容が「重要命令内容」であることとしたが、所定の条件としてはこの限りではない。例えば、所定の条件が音声認識に用いられた音声の周辺音の音量が所定の閾値以上であることであってもよい。具体的には、上述のステップS310の処理に代えて、CPU30が、ステップS208と同様のステップS308で音声認識された音声内容の音声の音圧とその音声の周辺音の音圧とを比較し、周辺音の音圧の方が小さいか否かを判定する。CPU30が周辺音の方が小さいと判定した場合、処理はステップS314に進む。CPU30が周辺音の方が大きいと判定した場合、処理はステップS311に進む。周辺音が大きい場合誤認識の可能性が高まる。そのため個人認証を行うことで誤操作を抑制することが可能となる。
以上のような、第2の実施形態の撮像装置10によれば、個人認証を必要な場合に限って行うことが可能になる。従って、第1の実施形態の撮像装置10による効果に加えて、操作の信頼性を更に向上させるとことができる。
以上、本発明を実施形態と共に説明したが、上記実施形態は本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
例えば上述の各実施形態では、撮像装置10の例を説明したが、本発明は電子機器全般に適用することができる。電子機器全般に適用する場合、上述の各実施形態の接眼センサ26の機能を電子機器のユーザの体の一部が近接しやすい位置に設けられた距離センサが担うことで、上述の各実施形態の効果と同様の効果を得ることができる。ユーザの体の一部が近接しやすい位置の例としては、通話可能な電子機器であればマイクの近傍位置である。また、上述の各実施形態では音声入力部27の感度を2段階で設定可能としたが、多段階で設定可能としてもよい。この場合、接眼センサ26によって検出されたファインダー部とユーザの顔との間の距離に応じて音声入力部27の感度が多段階で変更されるようになっていてもよい。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
10:撮像装置、26:接眼センサ、27:音声入力部、30:CPU、32、メモリ

Claims (10)

  1. 音声入力部に入力された音声に対して音声認識可能な電子機器であって、
    ユーザとの距離を検出する距離センサの検出結果に応じて、音声に対して個人認証を行う認証手段と、
    前記認証手段による個人認証が成功した場合に、音声に対して音声認識を行う認識手段と、を備えることを特徴とする特徴とする電子機器。
  2. 前記距離センサによって検出された距離が所定の閾値未満の場合には、前記認証手段が音声に対して前記個人認証を行わずに、前記認識手段が音声に対して前記音声認識を行い、前記距離センサによって検出された距離が所定の閾値以上の場合には、前記認証手段が音声に対して前記個人認証を行うことを特徴とする請求項1に記載の電子機器。
  3. 前記認証手段は、前記距離センサの検出結果に応じて、音声入力部の感度を変更することを特徴とする請求項1又は2に記載の電子機器。
  4. 前記認識手段による前記音声認識が行われた後で、所定の条件を満たす場合、前記認証手段が音声に対して前記個人認証を行うことを特徴とする請求項1乃至3何れか1項に記載の電子機器。
  5. 前記所定の条件が、前記音声認識の結果として得られた命令内容が所定の内容であることを特徴とする請求項4に記載の電子機器。
  6. 前記所定の条件が、前記音声認識に用いられた音声の周辺音の音量が所定の閾値以上であることを特徴とする請求項4又は5に記載の電子機器。
  7. 前記電子機器が撮像装置であることを特徴とする請求項1乃至6何れか1項に記載の電子機器。
  8. 前記距離センサが、前記撮像装置のファインダー部に接眼したことを検知する接眼センサであることを特徴とする請求項7に記載の電子機器。
  9. 音声入力部に入力された音声に対して音声認識可能な電子機器の制御方法であって、
    ユーザとの距離を検出する距離センサの検出結果に応じて、音声に対して個人認証を行う認証ステップと、
    前記認証ステップによる個人認証が成功した場合に、音声に対して音声認識を行う認識ステップと、を含むことを特徴とする特徴とする電子機器の制御方法。
  10. 請求項1乃至8何れか1項に記載の電子機器の各手段としてコンピュータを機能させるためのプログラム。
JP2019219652A 2019-12-04 2019-12-04 電子機器、電子機器の制御方法及びそのプログラム Pending JP2021089368A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019219652A JP2021089368A (ja) 2019-12-04 2019-12-04 電子機器、電子機器の制御方法及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019219652A JP2021089368A (ja) 2019-12-04 2019-12-04 電子機器、電子機器の制御方法及びそのプログラム

Publications (1)

Publication Number Publication Date
JP2021089368A true JP2021089368A (ja) 2021-06-10

Family

ID=76220167

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019219652A Pending JP2021089368A (ja) 2019-12-04 2019-12-04 電子機器、電子機器の制御方法及びそのプログラム

Country Status (1)

Country Link
JP (1) JP2021089368A (ja)

Similar Documents

Publication Publication Date Title
US9706100B2 (en) Imaging apparatus, method for setting voice command, and storage medium
US8259214B2 (en) Image pickup apparatus and auto-focus detection method
KR101710626B1 (ko) 디지털 촬영 장치 및 이의 제어 방법
JP2007081772A (ja) 画像処理装置および方法、並びにプログラム
KR20110054311A (ko) 영상 처리 방법 및 장치
JP2013070164A (ja) 撮像装置及び撮像方法
KR20100027700A (ko) 촬영 방법 및 장치
JP6137965B2 (ja) 電子機器、電子機器の制御方法、及び電子機器の制御プログラム
JP2013125196A (ja) 表示制御装置及び表示制御装置の制御方法
KR101788740B1 (ko) 피사체 검출 방법 및 장치와, 디지털 촬영 장치
US9069235B2 (en) Digital photographing apparatus and method for controlling thereof
JP2015026102A (ja) 電子機器
KR102068749B1 (ko) 촬영 장치 및 이의 제어 방법
EP2658281A1 (en) Audio control device and image capture device
JP2021089368A (ja) 電子機器、電子機器の制御方法及びそのプログラム
EP2690859B1 (en) Digital photographing apparatus and method of controlling same
US20100118155A1 (en) Digital image processing apparatus
JP2005333582A (ja) カメラ
US9756238B2 (en) Image capturing apparatus for performing authentication of a photographer and organizing image data for each photographer and control method thereof
JP2021087026A (ja) 撮像装置、撮像装置の制御方法及びそのプログラム
KR101589494B1 (ko) 촬영설정을 가이드 하는 디지털 촬영장치 및 그 제어 방법
WO2023181862A1 (ja) 情報処理装置、情報処理方法、記憶媒体
JP2013007851A (ja) 撮像装置
JP2018113527A (ja) 撮像装置
JP2005318084A (ja) 撮影装置