JP2015026102A - 電子機器 - Google Patents

電子機器 Download PDF

Info

Publication number
JP2015026102A
JP2015026102A JP2013153440A JP2013153440A JP2015026102A JP 2015026102 A JP2015026102 A JP 2015026102A JP 2013153440 A JP2013153440 A JP 2013153440A JP 2013153440 A JP2013153440 A JP 2013153440A JP 2015026102 A JP2015026102 A JP 2015026102A
Authority
JP
Japan
Prior art keywords
digital camera
electronic device
information
determination unit
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013153440A
Other languages
English (en)
Inventor
裕紀 田中
Hironori Tanaka
裕紀 田中
海二 鍋谷
Kaiji Nabetani
海二 鍋谷
竹内 雅人
Masahito Takeuchi
雅人 竹内
和章 嶋岡
Kazuaki Shimaoka
和章 嶋岡
倫由 占部
Tomoyoshi Urabe
倫由 占部
菜美 飯山
Nami Iiyama
菜美 飯山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2013153440A priority Critical patent/JP2015026102A/ja
Publication of JP2015026102A publication Critical patent/JP2015026102A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】音声認識が失敗した場合に、認識可能な情報を表示することが可能なデジタルカメラ100を提供する。【解決手段】デジタルカメラ100は、複数の動作モードを有する。デジタルカメラ100は、モニタと、音を集音するマイクと、集音した音を音声認識する認識部220と、集音する時の動作モードが複数の動作モードの内のいずれであるかを決定する決定部210と、決定した動作モードにおいて認識可能な、デジタルカメラ100の有する機能を識別する情報をモニタに表示する表示制御部270と、認識部により出力される認識結果が情報を示すか否かを判断する第1の判断部230と、第1の判断部により認識結果が情報を示さないと判断された場合に、表示制御部による表示処理を実行する表示実行部260とを備える。【選択図】図2

Description

この発明は、音声を認識する電子機器に関し、特に、認識した音声に応じて機能を実行する電子機器に関する。
近年、音声認識機能を有する電子機器が普及している。当該電子機器は、認識した音声に応じて当該電子機器の機能を実行する。しかしながら、集められた音にノイズ等が含まれると、音声認識が失敗することがある。音声認識が失敗した場合に備えて様々な技術が開発されている。
たとえば、特開2003−241790号公報(特許文献1)は、「ユーザが発声する音声コマンドの認識率を向上することができる音声コマンド処理システム」を開示している([要約]参照)。当該音声コマンド処理システムは、ユーザにより発声された音声コマンドが予め登録されたグラマと一致しない場合には音声コマンドを文章として認識させる。認識された文章は、予め登録されたグラマとマッチングさせて類似度を算出する。類似度が第1のしきい値より高い場合、コマンドを実行し、第1のしきい値以下で、第2のしきい値より高い場合、コマンドをユーザ提示し、実行するコマンドを選択させる。さらに第2のしきい値以下の場合にはコマンドの実行は行わない。
また、特開2005−121526号公報(特許文献2)は、「発話者によって入力された発話内容が車内で処理可能か否かを判断し、処理不可能な場合は車外の情報サービスセンターから情報の提供を受けることができる音声対話装置」を開示している([要約]参照)。
さらに、特開2004−239963号公報(特許文献3)は、「音声による命令の入力を行う場合、ユーザの発声状態によって、音声認識ができない場合があるが、ユーザにとっては、認識できなかった理由がわからずユーザが困惑する場合があった。よって、ユーザが、自己の発声した音声の発話状態を認識できるナビゲーション装置」を開示している([要約]参照)。
さらに、特開2006−146182号公報(特許文献4)は、「過度のフラストレーションを引き起こしたり、音声認識の効率を犠牲にしたりすることなく、音声コマンドの明瞭化と誤認識エラーの解明とを制御するツール」を開示している([要約]参照)。
特開2003−241790号公報 特開2005−121526号公報 特開2004−239963号公報 特開2006−146182号公報
ところで、特許公報1が開示している音声コマンド処理システムは、類似度の高い候補が無い場合に、つまり音声認識に失敗した場合に、コマンドを1つも表示しない。このため、ユーザは、音声認識が失敗した時にどのような対応を取ればよいのか分からない。
この開示は上述のような問題点を解決するためになされたものであって、その目的は、音声認識が失敗した場合に、機能を識別するための認識可能な情報を表示することが可能な電子機器を提供することである。
一実施の形態に従うと、電子機器は、複数の動作モードを有する。当該電子機器は、モニタと、マイクと、マイクにより集められた音を音声認識して認識結果を出力するための認識手段と、マイクが音を集めた時の動作モードが複数の動作モードの内のいずれであるかを決定するための決定手段と、決定された動作モードにおいて認識可能な、電子機器の有する機能を識別するための情報をモニタに表示するための表示制御手段と、認識結果が情報を示すか否かを判断するための第1の判断手段と、第1の判断手段により認識結果が情報を示さないと判断された場合に、表示制御手段に情報を表示させるための実行手段とを備える。
ある局面において、音声認識が失敗した場合に、機能を識別するための認識可能な情報を表示することが可能な電子機器を提供することができる。
この発明の上記および他の目的、特徴、局面および利点は、添付の図面と関連して理解されるこの発明に関する次の詳細な説明から明らかとなるであろう。
第1の実施の形態に従うデジタルカメラの概要を示す図である。 第1の実施の形態に従うデジタルカメラの機能構成を示すブロック図である。 第1の実施の形態に従うデジタルカメラのハードウェア構成を示すブロック図である。 単語リストのデータ構造を示す図である。 第1の実施の形態に従うデジタルカメラが実行する処理の一部を表わすフローチャートである。
以下、図面を参照しつつ、本実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。したがって、これらについての詳細な説明は繰り返さない。
なお、以下では、電子機器の一例として撮像装置として機能するデジタルカメラ100の詳細について説明するが、電子機器は、デジタルカメラに限定されるものではない。たとえば、電子機器は、タブレット端末、携帯電話機、スマートフォン、その他音声認識機能を備えた携帯機器等も含み得る。なお、以下で説明される実施の形態は、選択的に組み合わされてもよい。
[第1の実施の形態]
<概要>
図1は、第1の実施の形態に従うデジタルカメラ100の概要を示す図である。図1を参照して、デジタルカメラ100の概要について説明する。
図1を参照して、デジタルカメラ100は、モニタ120と、マイク140とを備える。デジタルカメラ100は、複数の動作モードを有する。たとえば、デジタルカメラ100は、動作モードとして、撮影が可能であることを示す撮影モードを含む。以下、デジタルカメラ100の動作モードが撮影モードである場合について説明する。
図1において、ユーザ101が撮影を行なっている場合のデジタルカメラ100の状態を示す状態(A)と、デジタルカメラ100が音声認識に失敗した場合のデジタルカメラ100の状態を示す状態(B)とが示される。
状態(A)において、ユーザ101は、人物121および人物123の撮影を行なっており、デジタルカメラ100に向かって「撮影」と発声したとする。マイク140は、ユーザ101の発話を集音する。デジタルカメラ100は、マイク140により集められた音の音声認識を行なう。デジタルカメラ100は、ユーザ101の発した「撮影」という言葉を認識できない場合、状態(A)から状態(B)に遷移する。
状態(B)において、デジタルカメラ100は、「撮影モード」においてデジタルカメラ100が認識可能な情報(以下、「認識可能情報」とも称する。)をモニタ120に表示する。認識可能情報の詳細については後述する。モニタ120にはオブジェクト125が表示される。たとえば、「撮影モード」において起動可能な機能として、オブジェクト125には「シャッター」、「ズームイン」、「ズームアウト」、および「ライトオン」が表示される。
このように、デジタルカメラ100は、音声認識が失敗した場合に、現在の動作モードにおいてデジタルカメラ100が認識可能な情報をモニタ120に表示する。これにより、デジタルカメラ100の現在の動作モードにおいて音声認識可能な情報を容易に理解することが可能になる。また、デジタルカメラ100の現在の動作モードにおいて起動可能な機能を容易に理解することが可能になる。
なお、デジタルカメラ100は、音声認識が成功した場合には、認識した音声に応じて当該デジタルカメラ100の機能を実行する。たとえば、デジタルカメラ100は、ユーザ101が「シャッター」と発した場合には撮影を実行する。
<認識可能情報>
以下、認識可能情報について説明する。認識可能情報は、デジタルカメラ100の各動作モードにおいてデジタルカメラ100が認識可能な情報である。また、認識可能情報は、デジタルカメラ100の有する機能を識別するための情報である。典型的には、認識可能情報は、文字データおよび文字列データの内の少なくとも一方を含む。文字列データは、単語、文章等を含む。
なお、以下の説明では、認識可能情報の一例である単語を挙げてデジタルカメラ100を説明するが、認識可能情報は、単語に限定されない。たとえば、認識可能情報は、上述したように、文章、または、その他、文字データまたは文字列データであってもよい。
<機能構成>
図2は、第1の実施の形態に従うデジタルカメラ100の機能構成を示すブロック図である。図2を参照して、デジタルカメラ100の機能構成の一例について説明する。
デジタルカメラ100は、決定部210と、認識部220と、第1の判断部230と、起動部240と、第2の判断部250と、実行部260と、表示制御部270とを備える。また、デジタルカメラ100は、複数の動作モードを有する。たとえば、デジタルカメラ100は、動作モードとして、撮影が可能な「撮影モード」、画像または動画を閲覧可能な「閲覧モード」、および、デジタルカメラ100の設定を行なうことが可能な「設定モード」等を有する。これらの動作モードは、ユーザにより変更できるように設計される。
決定部210は、マイク140が音を集めた時の動作モードが、当該デジタルカメラ100の有する複数の動作モードの内のいずれであるかを決定する。決定部210が動作モードを決定する時は、マイク140が音を集めた時に限定されない。たとえば、決定部210は、音声認識時における動作モードをデジタルカメラ100の動作モードとして決定してもよい。決定部210は、決定した動作モードを表示制御部270に出力する。
認識部220は、マイク140により集められた音を音声認識することにより認識結果を出力する。典型的には、認識部220は、集められた音を文字データまたは文字列データに変換して出力する。また、認識部220は、集められた音をテキストデータに変換して出力してもよい。認識部220は、認識結果を第1の判断部230に出力する。
たとえば、認識部220は、大量の音声データを機械学習することで予め得られたモデルデータと、マイク140により集められた音から抽出した特徴量とをパターンマッチングすることにより音声認識を行なってもよい。
第1の判断部230は、認識部220により出力された認識結果が認識可能情報を示すか否かを判断する。典型的には、第1の判断部230は、認識結果に認識可能な単語が含まれているか否かを判断する。第1の判断部230は、認識結果に認識可能な単語が含まれている場合に音声認識が成功したと判断する。また、第1の判断部230は、認識結果に認識可能な単語が含まれてなくても、認識結果と認識可能な単語とが予め定められた文字数以上一致した場合に音声認識が成功したと判断してもよい。第1の判断部230は、認識結果に認識可能な単語が含まれていない場合に音声認識が失敗したと判断する。第1の判断部230は、判断結果を起動部240および実行部260に出力する。
起動部240は、第1の判断部230により認識結果が認識可能な情報を示すと判断された場合に(認識成功)、当該情報により識別される機能を起動する。
第2の判断部250は、マイク140により集められた音が発話によるものであるか否かを判断する。典型的には、第2の判断部250は、集められた音の音量が予め定められた音量を越えた場合に、当該音が発話によるものであると判断する。また、第2の判断部250は、デジタルカメラ100に対する操作が予め定められた時間以上受付けられていない場合に、当該音が発話によるものであると判断する。第2の判断部250は、判断結果を実行部260に出力する。
実行部260は、第1の判断部230により音声認識が失敗したと判断された場合に、表示制御部270に認識可能情報を表示させる。また、実行部260は、第2の判断部250により集められた音が発話によるものであると判断された場合に表示制御部270に表示処理を表示させてもよい。典型的には、実行部260は、表示制御部270に表示命令を出力することにより認識可能情報を表示させる。
表示制御部270は、決定部210により決定した動作モードにおいてデジタルカメラ100が認識可能な、デジタルカメラ100の有する機能を識別するための情報をモニタ120に表示する。典型的には、表示制御部270は、実行部260が出力する表示命令を受付けると認識可能情報をモニタ120に表示する。
<ハードウェア構成>
図3は、第1の実施の形態に従うデジタルカメラ100のハードウェア構成を示すブロック図である。図3を参照して、デジタルカメラ100のハードウェア構成の一例について説明する。
デジタルカメラ100は、モニタ120と、マイク140と、CPU301と、ROM(Read Only Memory)302と、RAM(Random Access Memory)303と、カメラ304と、タッチセンサ305と、メモリカードインターフェイス(I/F)306と、ネットワークインターフェイス(I/F)307と、補助記憶装置310とを備える。補助記憶装置310は、単語リスト320を格納する。単語リスト320は、動作モード321と、単語323と、コマンド325とを含む。動作モード321と、単語323と、コマンド325とは、互いに関連付けられる。単語リスト320の詳細については後述する。
モニタ120は、デジタルカメラ100の動作モードに応じて、デジタルカメラ100が認識可能な単語を表示する。モニタ120は、タッチセンサ305と組み合わされてタッチパネルとして構成されてもよい。たとえば、ユーザは、タッチパネルを操作して、モニタ120に表示された認識可能な単語のいずれかを選択する。デジタルカメラ100は、選択された単語に関連付けられた機能を実行するように構成されてもよい。
マイク140は、音を集音する。マイク140は、集められた音を電気信号に変換する。マイク140は、電気信号を認識部220に出力する。
ROM302は、オペレーティングシステム(OS:Operating System)、デジタルカメラ100において起動時に実行される初期プログラム(ブートプログラム)などを格納する。
CPU301は、ROM302や補助記憶装置310などに格納された、オペレーティングシステムやデジタルカメラ100の制御プログラムなどの各種プログラムを実行することで、デジタルカメラ100の動作を制御する。
RAM303は、CPU301でプログラムを実行するためのワーキングメモリとして機能し、プログラムの実行に必要な各種データを一次的に格納する。
カメラ304は、たとえば、CCD(Charge Coupled Device)方式、CMOS(Complementary Metal Oxide Semiconductor)センサなどの撮像センサ、撮像レンズ、レンズを駆動するためのレンズ駆動部、シャッターなどを含む。カメラ304は、レンズを介して取り込んだ被写体の像を受光面(撮像面)で光電変換する撮像センサによって撮像画像を生成する。なお、カメラ304は、ズーム倍率を変更するためのズーム機能および焦点距離を調整するためのフォーカス機能などを有してもよい。
メモリカードI/F306は、SD(Secure Digital)カードやCF(Compact Flash(登録商標))カードなどのメモリカード(不揮発性記憶媒体)330との間で、データの読み書きを行なう。
ネットワークI/F307は、各種の通信媒体を介して、他の通信機器とデータの送受信を行なう。たとえば、他の通信機器は、デジタルカメラ、パソコン、サーバ装置、その他通信機能を有する電子機器である。
<単語リスト>
図4は、単語リスト320のデータ構造を示す図である。図4を参照して、単語リスト320のデータ構造について説明する。
図4を参照して、単語リスト320は、動作モード321と、単語323と、コマンド325との対応関係を規定したデータである。典型的には、単語リスト320は、補助記憶装置310に格納される。なお、単語リスト320は、必ずしも補助記憶装置310に格納される必要はない。たとえば、単語リスト320は、デジタルカメラ100と通信可能なサーバ装置に格納されてもよい。単語リスト320は、ユーザが編集できるように構成されてもよい。
図4に示されるように、たとえば、動作モード321は、撮影モード410と、閲覧モード420とを有する。撮影モード410は、単語「シャッター」、単語「ズームイン」、単語「ズームアウト」、および、単語「ライトオン」を含む。これらの単語は、互いに関連付けられる。単語「シャッター」と「第1のコマンド」とは互いに関連付けられる。単語「ズームイン」と「第2のコマンド」とは互いに関連付けられる。単語「ズームアウト」と「第3のコマンド」とは互いに関連付けられる。単語「ライトオン」と「第4のコマンド」とは互いに関連付けられる。
閲覧モード420は、単語「前の画像」、単語「後の画像」、単語「編集」、および、単語「共有」を含む。これらの単語は、互いに関連付けられる。単語「前の画像」と「第5のコマンド」とは互いに関連付けられる。単語「後の画像」と「第6のコマンド」とは互いに関連付けられる。単語「編集」と「第7のコマンド」とは互いに関連付けられる。単語「共有」と「第8のコマンド」とは互いに関連付けられる。以下では、デジタルカメラ100が単語リスト320をどのように用いるかについて説明する。
(音声認識の失敗時)
デジタルカメラ100の動作モードが「撮影モード」であり、ユーザが「撮影」と発声した場合について説明する。
認識部220は、マイク140により集められた音を音声認識する。認識部220は、ユーザの音声を文字列データ「さつえい」に変換して、変換によって得られたデータを第1の判断部230に出力する。第1の判断部230は、単語リスト320を参照して、認識結果「さつえい」が、現在の動作モードの「撮影モード」に関連付けられた単語を示すか否かを判断する。第1の判断部230は、認識結果「さつえい」が撮影モード410に関連付けられた単語(シャッター、ズームイン、ズームアウト、およびライトオン)に含まれないので、音声認識が失敗したと判断する。
音声認識が失敗した場合、実行部260は、「撮影モード」において認識可能な単語を表示するように表示制御部270に命令を出す。表示制御部270は、「撮影モード」において認識可能な単語である、「シャッター」、「ズームイン」、「ズームアウト」、および「ライトオン」をモニタ120に表示させる。これにより、ユーザは、次回から「シャッター」と発声すればよいことを容易に理解できる。
(音声認識の成功時)
デジタルカメラ100の動作モードが「撮影モード」であり、ユーザが「シャッター」と発声した場合について説明する。認識部220は、マイク140により集められた音を音声認識する。認識部220は、ユーザの音声を文字列データ「シャッター」に変換して、当該文字列データを第1の判断部230に出力する。第1の判断部230は、認識結果「シャッター」が、現在の動作モードの「撮影モード」に関連付けられた単語を示すか否かを判断する。第1の判断部230は、認識結果「シャッター」が撮影モード410に関連付けられた単語(シャッター、ズームイン、ズームアウト、およびライトオン)に含まれているので、音声認識が成功したと判断する。
音声認識が成功した場合、起動部240は、単語「シャッター」に関連付けられた「第1のコマンド」を起動する。たとえば、CPU301は、「第1のコマンド」によりカメラ304に撮影を実行させる撮影コマンドを起動する。
<制御構造>
図5は、第1の実施の形態に従うデジタルカメラ100が実行する処理の一部を表わすフローチャートである。図5の処理は、CPU301がプログラムを実行することにより実現される。他の局面において、処理の一部又は全部が、回路素子その他のハードウェアによって実行されてもよい。
図5を参照して、ステップS501において、CPU301は、デジタルカメラ100を起動する。
ステップS510において、CPU301は、デジタルカメラ100が音声認識中であるか否かを判断する。CPU301は、デジタルカメラ100が音声認識中であると判断した場合には(ステップS510においてYES)、制御をステップS520に切り替える。CPU301は、音声認識中でないと判断した場合には(ステップS510においてNO)、制御をステップS530に切り替える。
ステップS520において、CPU301は、第1の判断部230として、音声認識が成功したか否かを判断する。より具体的には、CPU301は、認識部220による認識結果が認識可能な単語を示す場合に音声認識が成功したと判断する。また、CPU301は、認識部220による認識結果が認識可能な単語を示さない場合に、音声認識が失敗したと判断する。
CPU301は、音声認識が成功したと判断した場合には(ステップS520においてYES)、制御をステップS521に切り替える。CPU301は、音声認識が失敗したと判断した場合には(ステップS520においてNO)、制御をステップS532に切り替える。
ステップS521において、CPU301は、起動部240として、認識結果に含まれる認識可能な単語に関連付けられたコマンドを起動する。
ステップS530において、CPU301は、第2の判断部250として、マイク140により集められた音が発話によるものであるか否かを判断する。CPU301は、当該音が発話によるものであると判断した場合には(ステップS530においてYES)、制御をステップS532に切り替える。CPU301は、当該音が発話によるものでないと判断した場合には(ステップS530においてNO)、制御をステップS510に切り替える。
ステップS532において、CPU301は、認識可能な単語を取得する。より具体的には、CPU301は、決定部210として、デジタルカメラ100の動作モードがいずれであるかを決定する。CPU301は、単語リスト320を参照して、当該決定した動作モードに関連付けられた単語を取得する。
ステップS534において、CPU301は、実行部260として、認識可能な単語を表示させる命令を表示制御部270に出力する。
ステップS536において、CPU301は、表示制御部270として、モニタ120に認識可能な単語を表示させる。
ステップS540において、CPU301は、ユーザが表示の消去を選択したか否かを判断する。CPU301は、ユーザが表示の消去を選択したと判断した場合には(ステップS540においてYES)、制御をステップS542に切り替える。CPU301は、ユーザが表示の消去を選択していないと判断した場合には(ステップS540においてNO)、制御をステップS536に切り替える。
ステップS542において、CPU301は、モニタ120の表示を消去する。
<利点>
以上のようにして、本実施の形態のデジタルカメラ100は、音声認識に失敗した場合に、デジタルカメラ100の現在の動作モードにおいて認識可能な情報を表示できる。これにより、ユーザは、次回からどのような情報を発声すればよいのかを一見して理解できる。
また、ユーザは、デジタルカメラ100の有する機能を識別するための情報を確認できるので、現在の動作モードにおいてどのような機能が実行できるのかを一見して理解できる。
[第2の実施の形態]
<概要>
以下、第2の実施の形態に従うデジタルカメラについて説明する。本実施の形態に従うデジタルカメラ100Aは、当該デジタルカメラ100Aの動作モードに応じて起動可能な機能を実行するためのデジタルカメラの各部品をモニタ120により指し示す機能をさらに有する点が第1の実施の形態に従うデジタルカメラ100と異なる。その他の点については、第1の実施の形態に従うデジタルカメラ100と同様であるので説明を繰り返さない。
デジタルカメラ100Aは、音声認識が失敗した場合に、認識可能情報をモニタ120に表示するのに加えて、当該認識可能情報に関連する機能を実行するためのデジタルカメラ100Aの各部品をモニタ120により指し示す。たとえば、認識可能情報に「シャッター」という単語が含まれている場合、デジタルカメラ100Aは、単語「シャッター」に関連する部品であるシャッターボタン(図示しない)を指し示す。デジタルカメラ100Aは、モニタ120に表示される矢印等で当該シャッターボタンを指し示す。
<利点>
以上のようにして、デジタルカメラ100Aの現在の動作モードにおいて起動可能な機能を実行するためには、どのようにデジタルカメラ100Aを操作すれればよいのかを容易に理解することが可能になる。
[第3の実施の形態]
<概要>
以下、第3の実施の形態に従うデジタルカメラについて説明する。本実施の形態に従うデジタルカメラ100Bは、当該デジタルカメラ100Bの動作モードに応じて起動可能な機能を実行するための各部品が点灯する点が第1の実施の形態に従うデジタルカメラ100と異なる。その他の点については、第1の実施の形態に従うデジタルカメラ100と同様であるので説明を繰り返さない。
デジタルカメラ100Bは、音声認識が失敗した場合に、認識可能情報をモニタ120に表示するのに加えて、当該認識可能情報に関連する機能を実行するための各部品が点灯する。たとえば、認識可能情報に「シャッター」という単語が含まれている場合、デジタルカメラ100Bは、単語「シャッター」に関連する部品であるシャッターボタン(図示しない)を点灯させる。
<利点>
以上のようにして、デジタルカメラ100Bの現在の動作モードにおいて起動可能な機能を実行するためには、どのようにデジタルカメラ100Bを操作すれればよいのかを容易に理解することが可能になる。
[第4の実施の形態]
<概要>
以下、第4の実施の形態に従うデジタルカメラについて説明する。本実施の形態に従うデジタルカメラ100Cは、第1の実施の形態に従うデジタルカメラ100の機能のうちの少なくとも1つがいわゆるクラウドサービスによって提供される点がデジタルカメラ100と異なる。その他の点については、第1の実施の形態に従うデジタルカメラ100と同様であるので説明を繰り返さない。
デジタルカメラ100Cは、決定部210、認識部220、第1の判断部230、起動部240、第2の判断部250、実行部260、および表示制御部270のうちの少なくとも1つがいわゆるクラウドサービスによって提供される。この場合、少なくとも1つのサーバ装置がこれらの機能を実行する。
たとえば、デジタルカメラ100Cは、マイク140によって出力される音声信号をサーバ装置(クラウド側)に送信する。サーバ装置(クラウド側)は、送信された音声信号に基づいて本実施の形態に従うデジタルカメラ100の処理を行なう。さらに、サーバ装置(クラウド側)がすべての処理を行なう必要はなく、デジタルカメラ100とサーバ装置とが協働して、本実施の形態に従う処理を実現するように構成されてもよい。また、デジタルカメラ100Cは、単語リスト320がサーバ装置に格納されるように構成されてもよい。
<利点>
以上のようにして、デジタルカメラ100Cは、最低限の機能およびデータを有すればよいのでメモリ容量を削減することが可能になる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
100,100A,100B,100C デジタルカメラ、101 ユーザ、120 モニタ、121,123 人物、125 オブジェクト、140 マイク、210 決定部、220 認識部、230 第1の判断部、240 起動部、250 第2の判断部、260 実行部、270 表示制御部、301 CPU、302 ROM、303 RAM、304 カメラ、305 タッチセンサ、306 メモリカードI/F、307 ネットワークI/F、310 補助記憶装置、320 単語リスト、321 動作モード、323 単語、325 コマンド、330 メモリカード、410 撮影モード、420 閲覧モード。

Claims (5)

  1. 複数の動作モードを有する電子機器であって、
    モニタと、
    マイクと、
    前記マイクにより集められた音を音声認識して認識結果を出力するための認識手段と、
    前記マイクが前記音を集めた時の動作モードが前記複数の動作モードの内のいずれであるかを決定するための決定手段と、
    前記決定された動作モードにおいて認識可能な、前記電子機器の有する機能を識別するための情報を前記モニタに表示するための表示制御手段と、
    前記認識結果が前記情報を示すか否かを判断するための第1の判断手段と、
    前記第1の判断手段により前記認識結果が前記情報を示さないと判断された場合に、前記表示制御手段に前記情報を表示させるための実行手段とを備える、電子機器。
  2. 前記電子機器は、さらに、
    前記マイクにより集められた音が発話によるものであるか否かを判断するための第2の判断手段を備え、
    前記実行手段は、前記第2の判断手段により前記音が発話によるものであると判断された場合に、前記表示制御手段に前記情報をさらに表示させる、請求項1に記載の電子機器。
  3. 前記第2の判断手段は、前記マイクにより集音された前記音の音量が予め定められた音量を越えた場合に、前記音が発話によるものであると判断する、請求項2に記載の電子機器。
  4. 前記電子機器は、前記電子機器に対する操作を受付けるための受付手段をさらに備え、
    前記第2の判断手段は、前記受付手段によって前記電子機器に対する操作が受け付けられない時間が予め定められた時間を越えた場合に、前記音が発話によるものであると判断する、請求項2または3に記載の電子機器。
  5. 前記電子機器は、さらに、
    前記第1の判断手段により前記認識結果が前記情報を示すと判断された場合に、当該情報により識別される機能を起動するための起動手段を備える、請求項1〜4のいずれか1項に記載の電子機器。
JP2013153440A 2013-07-24 2013-07-24 電子機器 Pending JP2015026102A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013153440A JP2015026102A (ja) 2013-07-24 2013-07-24 電子機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013153440A JP2015026102A (ja) 2013-07-24 2013-07-24 電子機器

Publications (1)

Publication Number Publication Date
JP2015026102A true JP2015026102A (ja) 2015-02-05

Family

ID=52490747

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013153440A Pending JP2015026102A (ja) 2013-07-24 2013-07-24 電子機器

Country Status (1)

Country Link
JP (1) JP2015026102A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020134745A (ja) * 2019-02-21 2020-08-31 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2021002770A (ja) * 2019-06-21 2021-01-07 キヤノン株式会社 撮像装置およびその制御方法、プログラム
JP2021029011A (ja) * 2019-08-09 2021-02-25 キヤノン株式会社 撮像制御装置、撮像制御装置の制御方法、プログラム、記憶媒体
JP2022508176A (ja) * 2018-11-23 2022-01-19 華為技術有限公司 音声制御方法及び電子装置
WO2022254670A1 (ja) * 2021-06-03 2022-12-08 日産自動車株式会社 表示制御装置及び表示制御方法
WO2023286775A1 (ja) * 2021-07-13 2023-01-19 株式会社ニコン 音声認識装置、音声認識方法、音声認識プログラム、撮像装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003084794A (ja) * 2001-09-07 2003-03-19 Olympus Optical Co Ltd 音声制御システム
JP2004301895A (ja) * 2003-03-28 2004-10-28 Fuji Photo Film Co Ltd 電子機器、および音声操作方法
JP2013019958A (ja) * 2011-07-07 2013-01-31 Denso Corp 音声認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003084794A (ja) * 2001-09-07 2003-03-19 Olympus Optical Co Ltd 音声制御システム
JP2004301895A (ja) * 2003-03-28 2004-10-28 Fuji Photo Film Co Ltd 電子機器、および音声操作方法
JP2013019958A (ja) * 2011-07-07 2013-01-31 Denso Corp 音声認識装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022508176A (ja) * 2018-11-23 2022-01-19 華為技術有限公司 音声制御方法及び電子装置
US11450322B2 (en) 2018-11-23 2022-09-20 Huawei Technologies Co., Ltd. Speech control method and electronic device
JP7142783B2 (ja) 2018-11-23 2022-09-27 華為技術有限公司 音声制御方法及び電子装置
JP2020134745A (ja) * 2019-02-21 2020-08-31 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7334420B2 (ja) 2019-02-21 2023-08-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021002770A (ja) * 2019-06-21 2021-01-07 キヤノン株式会社 撮像装置およびその制御方法、プログラム
JP7365793B2 (ja) 2019-06-21 2023-10-20 キヤノン株式会社 撮像装置およびその制御方法、プログラム
JP2021029011A (ja) * 2019-08-09 2021-02-25 キヤノン株式会社 撮像制御装置、撮像制御装置の制御方法、プログラム、記憶媒体
JP7286469B2 (ja) 2019-08-09 2023-06-05 キヤノン株式会社 撮像制御装置、撮像制御装置の制御方法、プログラム、記憶媒体
WO2022254670A1 (ja) * 2021-06-03 2022-12-08 日産自動車株式会社 表示制御装置及び表示制御方法
WO2023286775A1 (ja) * 2021-07-13 2023-01-19 株式会社ニコン 音声認識装置、音声認識方法、音声認識プログラム、撮像装置

Similar Documents

Publication Publication Date Title
US11696021B2 (en) Video recording device and camera function control program
US9031847B2 (en) Voice-controlled camera operations
US9706100B2 (en) Imaging apparatus, method for setting voice command, and storage medium
JP2015026102A (ja) 電子機器
US10083710B2 (en) Voice control system, voice control method, and computer readable medium
EP2215843B1 (en) System and method for generating a photograph with variable image quality
KR102657519B1 (ko) 음성을 기반으로 그래픽 데이터를 제공하는 전자 장치 및 그의 동작 방법
JP2013502662A (ja) オブジェクト情報の提供方法及びそれを適用した撮影装置
KR20190010733A (ko) 정보 처리 장치 및 정보 처리 방법
KR20190051594A (ko) 복수의 카메라들을 이용하여 영상을 촬영하는 전자 장치와 이의 동작 방법
JP7116088B2 (ja) 音声情報処理方法、装置、プログラム及び記録媒体
CN112236767A (zh) 用于通过输入单元向应用提供与图像相关的信息的电子装置和方法
WO2021208531A1 (zh) 一种语音处理方法、装置和电子设备
CN113727021A (zh) 拍摄方法、装置及电子设备
CN104662889A (zh) 用于在便携式终端中进行拍摄的方法和设备
CN113364975B (zh) 一种图像的融合方法及电子设备
US11570349B2 (en) Image pickup apparatus that controls operations based on voice, control method, and storage medium
JP7494000B2 (ja) 作業者端末、作業支援システム
JP6544209B2 (ja) 情報処理装置、会議システム、情報処理方法およびプログラム
US12022187B2 (en) Image capturing apparatus including plurality of sound input units, control method, and recording medium
CN116030817B (zh) 语音唤醒方法、设备及存储介质
JP2018136710A (ja) 音声取引システムおよび連携制御装置
JP2015061268A (ja) 携帯通信端末
JP2004301895A (ja) 電子機器、および音声操作方法
JP2021089368A (ja) 電子機器、電子機器の制御方法及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170131

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170725