JP2004301895A - 電子機器、および音声操作方法 - Google Patents

電子機器、および音声操作方法 Download PDF

Info

Publication number
JP2004301895A
JP2004301895A JP2003091563A JP2003091563A JP2004301895A JP 2004301895 A JP2004301895 A JP 2004301895A JP 2003091563 A JP2003091563 A JP 2003091563A JP 2003091563 A JP2003091563 A JP 2003091563A JP 2004301895 A JP2004301895 A JP 2004301895A
Authority
JP
Japan
Prior art keywords
operation command
voice
recognition
accuracy
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003091563A
Other languages
English (en)
Inventor
Hisanobu Tsubaki
尚宜 椿
Hiroshi Tanaka
宏志 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP2003091563A priority Critical patent/JP2004301895A/ja
Publication of JP2004301895A publication Critical patent/JP2004301895A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】音声による操作命令を、確実且つ簡便に入力することができる電子機器、および音声操作方法を提供する。
【解決手段】音声認識処理回路43は、マイクロホン15に入力された音声の音声認識を行い、最も認識精度の高い1個の認識結果と、その認識精度とをCPU35に送信する。CPU35は、送信された認識結果が操作命令であるか否かを判別し、認識結果が操作命令であると判別した場合は、その認識精度により認識結果を分類する。CPU35は、音声認識の精度が高い場合(A)には、操作命令に応じた処理を実行させる制御信号を出力し、精度が低い場合(C)には、制御信号を出力せずに処理を終了し、精度が中間の場合(B)には、ユーザーに操作命令の再入力を促す。
【選択図】 図4

Description

【0001】
【発明の属する技術分野】
本発明は、音声による操作命令に応じた処理を実行する電子機器、および音声操作方法に関する。
【0002】
【従来の技術】
電子機器、例えばデジタルカメラには、ユーザーのニーズに応じた様々な機能が搭載されている。しかしながら、この多機能化に伴って、各種機能を設定するための操作が複雑化し、ユーザーの意志に反映した処理を即座に実行することができないという問題が生じていた。
【0003】
上記問題を解決するために、操作命令を音声により入力可能とし、入力された操作命令を音声認識して、操作命令に応じた処理を実行する撮像装置が提案されている(特許文献1参照)。この撮像装置では、操作命令を音声認識する際に、操作命令の種類によって認識精度の閾値を変化させることで、無意識に発せられる音声や周囲の雑音による誤動作を防止している。
【0004】
【特許文献1】
特開2000−69348号公報
【0005】
【発明が解決しようとする課題】
ところで、音声認識技術においては、文字の並びが似た言葉を精度良く識別することができず、誤認識する可能性が高い。また、周囲の雑音による影響も無視することができない。このため、特許文献1に記載される撮像装置では、周囲の雑音が大きい場合に、認識精度の閾値が高く設定された操作命令を音声認識することが極めて難しくなり、反って使い勝手を悪くするおそれがある。
【0006】
本発明は、音声による操作命令を、確実且つ簡便に入力することができる電子機器、および音声操作方法を提供することを目的とする。
【0007】
【課題を解決するための手段】
上記目的を達成するために、本発明の電子機器は、音声による操作命令が入力される音声入力手段と、入力された操作命令を音声認識する音声認識手段と、前記音声認識の精度が高い場合には、前記操作命令に応じた処理を実行させる制御信号を出力し、精度が低い場合には、前記制御信号を出力せず、精度が中間の場合には、前記操作命令の再入力を促す制御手段とを備えたことを特徴とする。
【0008】
また、本発明の電子機器は、音声による操作命令が入力される音声入力手段と、入力された操作命令を音声認識する音声認識手段と、前記音声認識の精度が高く、且つ前記操作命令の候補となる認識結果が1つである場合には、前記操作命令に応じた処理を実行させる制御信号を出力し、精度が低い場合には、前記制御信号を出力せず、精度が中間で、且つ前記操作命令の候補となる認識結果が1つである場合には、前記操作命令の再入力を促し、精度が高く、または中間で、且つ前記操作命令の候補となる認識結果が複数である場合には、前記候補を呈示して、呈示された候補の中から前記操作命令を音声により選択させる制御手段とを備えたことを特徴とする。なお、前記制御手段は、前記候補を呈示する際に、各々の候補を識別可能にする識別符号を前記候補に付加することが好ましい。
【0009】
本発明の音声操作方法は、音声による操作命令を入力するステップと、入力された操作命令を音声認識するステップと、前記音声認識の精度が高い場合には、前記操作命令に応じた処理を実行し、精度が低い場合には、前記処理を実行せず、精度が中間の場合には、前記操作命令の再入力を促すステップとを備えたことを特徴とする。
【0010】
また、本発明の音声操作方法は、音声による操作命令を入力するステップと、入力された操作命令を音声認識するステップと、前記音声認識の精度が高く、且つ前記操作命令の候補となる認識結果が1つである場合には、前記操作命令に応じた処理を実行し、精度が低い場合には、前記処理を実行せず、精度が中間で、且つ前記操作命令の候補となる認識結果が1つである場合には、前記操作命令の再入力を促し、精度が高く、または中間で、且つ前記操作命令の候補となる認識結果が複数である場合には、前記候補を呈示して、呈示された候補の中から前記操作命令を音声により選択させるステップとを備えたことを特徴とする。なお、前記候補を呈示する際に、各々の候補を識別可能にする識別符号を前記候補に付加することが好ましい。
【0011】
【発明の実施の形態】
図1および図2において、デジタルカメラ2には、撮像レンズ10が組み込まれたレンズ鏡胴11、光学ファインダを構成するファインダ対物窓12とファインダ接眼窓13、ストロボ発光部14、およびマイクロホン15が設けられている。側面および上面には、グリップ部16、モードダイヤル17、およびレリーズボタン18が設けられ、他方の側面には、メモリカード19が着脱自在に装填されるメモリカードスロット20が設けられている。
【0012】
デジタルカメラ2の背面には、液晶表示器(LCD)21と、操作部22とが設けられている。LCD21は、撮影した画像や、いわゆるスルー画像を表示する。操作部22は、電源のオン/オフ切替えを行う電源ボタン、撮像レンズ10のズームレンズをワイド側、テレ側に変倍するズーム操作ボタン、LCD21に表示されるメニュー画面内でカーソルを移動させるカーソル操作板などから構成される。
【0013】
デジタルカメラ2では、静止画撮影を行う静止画撮影モード、撮影した画像をLCD21に表示する再生モード、および各種設定を行うセットアップモードが選択可能となっている。これらのモードの切り替えは、モードダイヤル17を回動操作させることで行われる。
【0014】
デジタルカメラ2は、マイクロホン15を介して、カメラの操作命令を音声で受け付ける音声操作機能を備えている。表1に示すように、この音声操作機能で扱われる操作命令には、ストロボ発光の有無、画質モード、記録画素数、撮影モードの選択、画像の再生、削除、撮影の指示などがある。なお、表1に示す操作命令は一例であり、デジタルカメラ2の仕様に応じて適宜変更・追加可能である。
【0015】
【表1】
Figure 2004301895
【0016】
マイクロホン15には、常時周囲の音声が入力されており、予め設定された所定レベル以上の音声が入力されたときに後述する音声認識が行われ、入力された音声が表1に示す操作命令であるか否かが判別される。
【0017】
デジタルカメラ2の電気的構成を示す図3において、撮像レンズ10の背後には、撮像レンズ10から入射する被写体光を撮像信号に変換するCCD30が配置されている。CCD30で変換された撮像信号は、相関二重サンプリング回路(図示せず)に入力され、CCD30の各セルの蓄積電荷量に正確に対応したR、G、Bの画像データとして出力される。相関二重サンプリング回路から出力された画像データは、増幅器(図示せず)で増幅され、A/D変換器31でデジタルデータに変換される。
【0018】
A/D変換器31から出力された画像データは、画像信号処理回路32に送信される。画像信号処理回路32は、階調変換、ホワイトバランス補正、γ補正処理などの各種画像処理を画像データに施す。一方、マイクロホン15から入力された音声は、A/D変換器33でデジタルデータに変換され、音声信号処理回路34に送信される。音声信号処理回路34は、ノイズ除去などの各種処理を音声データに施す。
【0019】
CPU35は、システムバス36を介して各部に接続し、デジタルカメラ2全体の動作を統括制御する。システムバス36には、圧縮伸長処理回路37、YC処理回路38、SDRAM39、外部I/F40、カードI/F41、LCDドライバ42、および音声認識処理回路43が接続されている。
【0020】
画像信号処理回路32で各種処理を施された画像データは、YC処理回路38により輝度信号Yと色差信号Cr、Cbとに変換される。圧縮伸長処理回路37は、この変換された画像データに対して、所定の圧縮形式(例えばJPEG形式)で画像圧縮を施す。
【0021】
圧縮伸長処理回路37により圧縮された画像データは、外部I/F40を介してパーソナルコンピュータなどの外部機器に送信される。または、カードI/F41を介してメモリカード19に保存される。あるいは、LCDドライバ42によりコンポジット信号に変換され、LCD21に表示される。
【0022】
CPU35には、前述のレリーズボタン18、操作部22の他に、EEPROM44、測光・測距回路45が接続されている。EEPROM44には、各種制御用のプログラムや設定情報などが記録されている。CPU35は、これらの情報をEEPROM44から作業用メモリであるSDRAM39に読み出して、各種処理を実行する。
【0023】
測光・測距回路45は、被写体の輝度および撮像レンズ10との距離を検出し、CPU35に検出結果を送信する。CPU35は、この検出結果に基づいて、適正な露光量および焦点距離となるように、撮像レンズ10の各種パラメータを調整する。測光・測距回路45は、CPU35からフィードバックされる調整信号を元に、撮像レンズ10、およびストロボ装置46を制御するストロボ制御回路47を駆動させる。
【0024】
音声認識処理回路43には、認識辞書格納部48が接続されている。この音声認識処理回路43は、認識辞書格納部48に格納された認識辞書を用いて、マイクロホン15から入力された一定レベル以上の音声を音声認識し、最も認識精度の高い1個の認識結果と、その認識精度とをCPU35に送信する。なお、認識辞書格納部48に格納される認識辞書としては、不特定多数のユーザーを対象とした一般用の辞書でもよいし、個人用にカスタマイズされた辞書であってもよい。
【0025】
CPU35は、送信された認識結果が表1に示す操作命令であるか否かを判別し、認識結果が操作命令でないと判別した場合は、入力された音声を通常の音声と判断して、以後の処理を実行しない。一方、認識結果が操作命令であると判別した場合は、その認識精度が80%以上の場合はカテゴリA、60〜80%の場合はカテゴリB、60%未満の場合はカテゴリCに認識結果を分類する。なお、各カテゴリに分類するための認識精度の閾値は、上記の60%、80%に限定されず、認識する操作命令の種類などに応じて適宜変更可能である。
【0026】
CPU35は、認識結果がカテゴリAに属する場合、その操作命令に応じた処理を実行させる制御信号を出力する。認識結果がカテゴリBに属する場合、ユーザーに操作命令の再入力を促す。認識結果がカテゴリCに属する場合、制御信号を出力しない。なお、ユーザーに操作命令の再入力を促す方法としては、LCD21にメッセージを表示してもよいし、あるいは警告音を発してユーザーに報知してもよく、これらを複合して用いてもよい。
【0027】
次に、図4のフローチャートを参照して、上記構成による作用について説明する。まず、マイクロホン15に入力される音声のレベルを検出し、一定レベル以下である場合は、通常の音声であると判断して処理を終了する。一方、入力された音声が一定レベル以上であった場合、音声認識処理回路43で入力された音声の音声認識を行い、最も認識精度の高い1個の認識結果と、その認識精度とをCPU35に送信する。
【0028】
送信された認識結果が表1に示す操作命令であるか否かをCPU35で判別し、認識結果が操作命令でないと判別した場合は、通常の音声と判断して処理を終了する。一方、認識結果が操作命令であると判別した場合は、その認識精度により3つのカテゴリA〜Cに認識結果を分類する。
【0029】
認識結果がカテゴリAに属する場合には、その操作命令に応じた処理を実行させる制御信号をCPU35から出力する。認識結果がカテゴリBに属する場合には、ユーザーに操作命令の再入力を促す。所定時間経過後、ユーザーにより再入力がされなかった場合は処理を終了する。所定時間内に再入力がされた場合は処理をリターンして、音声認識処理回路43で再入力された音声の音声認識を行う。認識結果がカテゴリCに属する場合には、CPU35から制御信号を出力せず、処理を終了する。
【0030】
上記実施形態では、音声認識処理回路43が、最も認識精度の高い1個の認識結果と、その認識精度とを出力する場合を述べたが、最も認識精度の高い1個の認識結果、あるいは認識精度が近似した操作命令の候補となる複数の認識結果と、その認識精度とを出力する音声認識処理回路43を用いてもよい。この場合は、図5および図6のフローチャートに示すような処理を行う。まず、前述した処理と同様の処理を行って認識結果を分類する。
【0031】
認識結果の分類後、認識結果がカテゴリAに属し、且つ操作命令の候補となる認識結果が1個である場合には、その操作命令に応じた処理を実行させる制御信号をCPU35から出力する。認識結果がカテゴリBに属し、且つ操作命令の候補となる認識結果が1個である場合には、ユーザーに操作命令の再入力を促す。
所定時間経過後、ユーザーにより再入力がされなかった場合は処理を終了する。
所定時間内に再入力がされた場合は処理をリターンして、音声認識処理回路43で再入力された音声の音声認識を行う。認識結果がカテゴリCに属する場合には、CPU35から制御信号を出力せず、処理を終了する。
【0032】
認識結果がカテゴリA、またはBに属し、且つ操作命令の候補となる認識結果が複数である場合には、LCD21に候補を呈示し、呈示された候補の中から、実行すべき操作命令をユーザーに音声により選択させる。このような構成であると、例えば「3メガモード」、「4メガモード」など、文字の並びが似た言葉で誤認識する可能性が高い操作命令を入力した場合に、確実に認識させることができる。
【0033】
なお、LCD21に候補を呈示する際には、候補自体を呈示するのではなく、例えば「A 3メガモード」、「B 4メガモード」のように、各々の候補を識別可能にする識別符号を付加することが好ましい。この場合、各候補の識別を明確にするために、ユーザーに「A」、「B」と音声入力させる。あるいは、ユーザーに「A 3メガモード」、「B 4メガモード」と音声入力させ、その前半部分の認識結果を利用する。
【0034】
上記実施形態では、電子機器としてデジタルカメラを例に挙げて説明したが、本発明はこれに限定されず、音声操作機能を有する他の電子機器、例えば車載用ナビゲーション装置などにも適用可能である。
【0035】
【発明の効果】
以上のように、本発明の電子機器、および音声操作方法によれば、音声により入力された操作命令を音声認識し、音声認識の精度が高い場合には、操作命令に応じた処理を実行し、精度が低い場合には、処理を実行せず、精度が中間の場合には、操作命令の再入力を促すので、操作命令の誤認識による誤動作を防止することができる。また、周囲の雑音により高い認識精度を得ることが困難な状況においても、操作命令を入力することが可能である。
【0036】
さらに、本発明の電子機器、および音声操作方法は、音声により入力された操作命令を音声認識し、音声認識の精度が高く、且つ操作命令の候補となる認識結果が1つである場合には、操作命令に応じた処理を実行し、精度が低い場合には、処理を実行せず、精度が中間で、且つ操作命令の候補となる認識結果が1つである場合には、操作命令の再入力を促し、精度が高く、または中間で、且つ操作命令の候補となる認識結果が複数である場合には、候補を呈示して、呈示された候補の中から操作命令を音声により選択させるので、文字の並びが似た言葉で誤認識する可能性が高い操作命令がある場合でも、明確に識別させることができる。
【図面の簡単な説明】
【図1】デジタルカメラの正面概観斜視図である。
【図2】デジタルカメラの背面概観斜視図である。
【図3】デジタルカメラの電気的構成を示すブロック図である。
【図4】音声操作の処理手順を示すフローチャートである。
【図5】音声操作の処理手順の別の実施形態を示すフローチャートである。
【図6】音声操作の処理手順の別の実施形態を示すフローチャートである。
【符号の説明】
2 デジタルカメラ
10 撮像レンズ
15 マイクロホン
18 レリーズボタン
19 メモリカード
21 液晶表示器(LCD)
30 CCD
35 CPU
43 音声認識処理回路
48 認識辞書格納部

Claims (6)

  1. 音声による操作命令が入力される音声入力手段と、入力された操作命令を音声認識する音声認識手段と、
    前記音声認識の精度が高い場合には、前記操作命令に応じた処理を実行させる制御信号を出力し、
    精度が低い場合には、前記制御信号を出力せず、
    精度が中間の場合には、前記操作命令の再入力を促す制御手段とを備えたことを特徴とする電子機器。
  2. 音声による操作命令が入力される音声入力手段と、入力された操作命令を音声認識する音声認識手段と、
    前記音声認識の精度が高く、且つ前記操作命令の候補となる認識結果が1つである場合には、前記操作命令に応じた処理を実行させる制御信号を出力し、
    精度が低い場合には、前記制御信号を出力せず、
    精度が中間で、且つ前記操作命令の候補となる認識結果が1つである場合には、前記操作命令の再入力を促し、
    精度が高く、または中間で、且つ前記操作命令の候補となる認識結果が複数である場合には、前記候補を呈示して、呈示された候補の中から前記操作命令を音声により選択させる制御手段とを備えたことを特徴とする電子機器。
  3. 前記制御手段は、前記候補を呈示する際に、各々の候補を識別可能にする識別符号を前記候補に付加することを特徴とする請求項2に記載の電子機器。
  4. 音声による操作命令を入力するステップと、入力された操作命令を音声認識するステップと、
    前記音声認識の精度が高い場合には、前記操作命令に応じた処理を実行し、
    精度が低い場合には、前記処理を実行せず、
    精度が中間の場合には、前記操作命令の再入力を促すステップとを備えたことを特徴とする音声操作方法。
  5. 音声による操作命令を入力するステップと、入力された操作命令を音声認識するステップと、
    前記音声認識の精度が高く、且つ前記操作命令の候補となる認識結果が1つである場合には、前記操作命令に応じた処理を実行し、
    精度が低い場合には、前記処理を実行せず、
    精度が中間で、且つ前記操作命令の候補となる認識結果が1つである場合には、前記操作命令の再入力を促し、
    精度が高く、または中間で、且つ前記操作命令の候補となる認識結果が複数である場合には、前記候補を呈示して、呈示された候補の中から前記操作命令を音声により選択させるステップとを備えたことを特徴とする音声操作方法。
  6. 前記候補を呈示する際に、各々の候補を識別可能にする識別符号を前記候補に付加することを特徴とする請求項5に記載の音声操作方法。
JP2003091563A 2003-03-28 2003-03-28 電子機器、および音声操作方法 Pending JP2004301895A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003091563A JP2004301895A (ja) 2003-03-28 2003-03-28 電子機器、および音声操作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003091563A JP2004301895A (ja) 2003-03-28 2003-03-28 電子機器、および音声操作方法

Publications (1)

Publication Number Publication Date
JP2004301895A true JP2004301895A (ja) 2004-10-28

Family

ID=33404906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003091563A Pending JP2004301895A (ja) 2003-03-28 2003-03-28 電子機器、および音声操作方法

Country Status (1)

Country Link
JP (1) JP2004301895A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015026102A (ja) * 2013-07-24 2015-02-05 シャープ株式会社 電子機器
JP2021052250A (ja) * 2019-09-23 2021-04-01 日本精機株式会社 遠隔操作装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015026102A (ja) * 2013-07-24 2015-02-05 シャープ株式会社 電子機器
JP2021052250A (ja) * 2019-09-23 2021-04-01 日本精機株式会社 遠隔操作装置

Similar Documents

Publication Publication Date Title
US8384794B2 (en) Image sensing device and camera
US8427430B2 (en) Apparatus for and method of controlling digital image processing apparatus
US8582891B2 (en) Method and apparatus for guiding user with suitable composition, and digital photographing apparatus
JP2009089174A (ja) デジタルカメラおよびその撮影方法
KR101710626B1 (ko) 디지털 촬영 장치 및 이의 제어 방법
KR100770637B1 (ko) 디지털 카메라
JP2005348181A (ja) 撮影装置及びその制御方法並びに制御用プログラム
JP2008109344A (ja) 特定被写体像の検出方法およびデジタルカメラ
JP2015026102A (ja) 電子機器
US8208042B2 (en) Method of controlling digital photographing apparatus, digital photographing apparatus, and medium having recorded thereon a program for executing the method
US8478004B2 (en) Method of controlling digital image processing apparatus for performing moving picture photographing mode, and digital image processing apparatus using the method
US7949189B2 (en) Imaging apparatus and recording medium
JP2004301895A (ja) 電子機器、および音声操作方法
US11588981B2 (en) Control apparatus, control method, and storage medium
JP5023932B2 (ja) 撮像装置、シナリオによる画像撮影方法、およびプログラム
US20100123797A1 (en) Imager for composing characters on an image
JP2021087026A (ja) 撮像装置、撮像装置の制御方法及びそのプログラム
JP4295540B2 (ja) 音声記録方法および装置、デジタルカメラ、並びに画像再生方法および装置
JP4872564B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP2012129659A (ja) 撮像装置、動作制御方法及びプログラム
KR20110083095A (ko) 멀티미디어 컨텐츠와 연동된 이미지를 생성하고 재생할 수 있는 디지털 영상 처리 장치 및 그 제어 방법
JP2009124350A (ja) 撮像装置及びその制御方法及びプログラム
JP2006253761A (ja) 撮像装置およびプログラム
JP2004208276A (ja) 撮像装置
JP2021089368A (ja) 電子機器、電子機器の制御方法及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050224

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070612

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080924