JP7055722B2

JP7055722B2 - 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム

Info

Publication number: JP7055722B2
Application number: JP2018158309A
Authority: JP
Inventors: 茂輝田辺; 泰弘上野; 英樹森田; 功益池; 浩太郎山内; 学佐久間; 健史島田
Original assignee: Kyocera Corp
Current assignee: Kyocera Corp
Priority date: 2018-08-27
Filing date: 2018-08-27
Publication date: 2022-04-18
Anticipated expiration: 2038-08-27
Also published as: US20200066272A1; US11227595B2; JP2020034988A

Description

本開示は、音声認識機能を有する電子機器に関し、特に、音声出力機能および表示機能を有する電子機器に関する。

従来、電子機器に入力音声を認識させる技術が知られている。例えば特許文献１には、携帯端末装置の機能の呼び出し機能の実行を定義した音声コマンドを登録する音声コマンド登録部１２６Ａと、押下中にマイクロフォンからの音声を音声コマンドとして入力するための音声コマンド入力ボタン１２１と、音声コマンド入力ボタンの押下中にマイクロフォンに入力した音声を音声認識処理し認識結果を音声コマンドとして音声コマンド登録部に登録させる音声コマンド登録処理部１４１Ｃと、音声コマンド入力ボタンの押下中にマイクロフォンから音声コマンドを入力し音声コマンド入力ボタンの押下解除後に入力した音声コマンドを音声認識処理し認識結果が登録されている音声コマンドと一致し受理された場合には受理した音声コマンドに対応する機能を呼び出し機能の操作を実行する音声コマンド処理部１４１Ｂとを備えた携帯端末装置が開示されている。

特開２００６－２２１２７０号公報

音声認識技術の利便性の向上が望まれている。

１つの態様に係る電子機器は、音声を入力するマイクと、前記マイクに入力された前記音声を認識するプロセッサとを備える。前記プロセッサは、前記マイクに入力された前記音声に基づき音声コマンドを認識したときに、前記電子機器が所定状態であるか否かを判定する。前記プロセッサは、前記電子機器が前記所定状態であると判定した場合、前記音声コマンドに応じた第１処理を実行する。前記プロセッサは、前記電子機器が前記所定状態でないと判定した場合、前記音声コマンドに応じた第２処理を実行する。

１つの態様に係る制御方法は、音声を入力するマイクを備える電子機器の制御方法であって、前記マイクに入力された前記音声に基づき音声コマンドを認識したときに、前記電子機器が所定状態であるか否かを判定し、前記電子機器が前記所定状態であると判定した場合、前記音声コマンドに応じた第１処理を実行し、前記電子機器が前記所定状態でないと判定した場合、前記音声コマンドに応じた第２処理を実行する。

１つの態様に係る制御プログラムは、音声を入力するマイクを備える電子機器で用いられるプログラムであって、前記マイクに入力された前記音声に基づき音声コマンドが認識されたときに、前記電子機器が所定状態であるか否かを判定させ、前記電子機器が前記所定状態であると判定された場合、前記音声コマンドに応じた第１処理を実行させ、前記電子機器が前記所定状態でないと判定された場合、前記音声コマンドに応じた第２処理を実行させる。

本開示の一実施形態に電子機器によれば、音声認識技術の利便性が向上する。

一実施形態に係る電子機器の外観図である。一実施形態に係る電子機器のブロック図である。一実施形態に係る電子機器の動作の一例を示す図である。一実施形態に係る電子機器の動作の一例を示す図である。一実施形態に係る電子機器の動作の一例を示す図である。一実施形態に係る電子機器の動作の一例を示す図である。一実施形態に係る電子機器の動作の一例を示す図である。一実施形態に係る電子機器の動作の一例を示す図である。一実施形態に係る電子機器が行う制御の一例を示すフローチャートである。一実施形態に係る電子機器が行う制御の一例を示すフローチャートである。一実施形態に係る電子機器が行う制御の一例を示すフローチャートである。

以下、本開示の実施形態について、図面を参照して説明する。以下の説明において、同様の構成要素について同一の符号を付すことがある。さらに、重複する説明は省略することがある。

ただし、図面は模式的なものであり、各寸法の比率などは現実のものとは異なる場合があることに留意すべきである。したがって、具体的な寸法などは以下の説明を参酌して判断すべきである。また、図面相互間においても互いの寸法の関係又は比率が異なる部分が含まれている場合があることは勿論である。

本開示において、例えば構成Ａ、構成Ｂについて「ＡまたはＢ」という表現が使用される場合、当該表現は、「ＡおよびＢの少なくとも一方」の意味を有し得ることに注意されたい。また、本開示において使用される「～得る」「～できる」「～てもよい」「～でもよい」「～てよい」「～でよい」という表現は、強制的な意味（「有していなくてはならない」など）ではなく、許容的な意味（「有している可能性がある」など）を有することに注意されたい。また、本開示において使用される「～を含む」という表現は、「～を含むが、これ（またはこれら）に限定されない」という意味を有することに注意されたい。また、本開示において使用される「～を含んでもよい」「～を含んでよい」という表現は、「～を含んでもよいが、含まなくてもよい」という意味を有することに注意されたい。また、本開示において、物理的な構成について、「構成する」「構成される」といった表現が使用される場合、当該表現は、「～を含む」に近似する意味を有することに注意されたい。また、本開示において、機能部、回路または電子機器１自体などに関し、特定の機能の実行について「構成する」「構成される」といった表現が使用される場合、当該表現は、「特定の機能を実行できるが、当該特定の機能が実行されるかどうかは条件に左右され、当該特定の機能を実行しない場合もあり得る」といった広範な意味を有することに注意されたい。

図１を参照して、一実施形態に係る電子機器１の外観について説明する。図１は、一実施形態に係る電子機器１の外観図である。

電子機器１は、いわゆるスマートフォンのような機器を含む。しかしながら、本開示の実施形態に係る電子機器１はスマートフォンに限定されない。電子機器１は、少なくとも音声出力機能を備える各種機器を含む。電子機器１は、例えばフィーチャーフォン、タブレット、ノートパソコン、スマートスピーカ、スマートディスプレイ、およびカーナビゲーションシステムなどを含む。電子機器１は、その他の携帯可能な各種端末を含む。

電子機器１は、マイク１１と、スピーカ１２と、タッチパネル１３とを含む。タッチパネル１３は、ディスプレイ１３aと、タッチセンサ１３ｂとを含む。図１において、電子機器１の長手方向を上下方向と定義し、電子機器１の短手方向を左右方向と定義する。

マイク１１は、周囲の音声を集音する。マイク１１は、電子機器１の表面に露出してもよい。マイク１１は、電子機器１の表面に露出しなくてもよい。マイク１１は電子機器１に複数設けられてもよい。

スピーカ１２は、音声を出力する。スピーカ１２は、電子機器１の表面に露出してもよい。スピーカ１２は、電子機器１の表面に露出しなくてもよい。スピーカ１２は電子機器１に複数設けられてもよい。

タッチパネル１３は、ディスプレイ１３aおよびタッチセンサ１３ｂを含む。タッチセンサ１３ｂはディスプレイ１３aと一体であってもよい。タッチセンサ１３ｂはディスプレイ１３aと別体であってもよい。タッチセンサ１３ｂとディスプレイ１３aとが一体となっているタッチパネル１３は、例えば、インセル型のタッチパネル、およびオンセル型のタッチパネルを含む。

ディスプレイ１３aは、文字、写真、記号、図形等の画像を表示する。ディスプレイ１３aは、液晶ディスプレイ（ＬＣＤ：ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）、有機ＥＬディスプレイＯＥＬＤ：ＯｒｇａｎｉｃＥｌｅｃｔｒｏ－ＬｕｍｉｎｅｓｃｅｎｃｅＤｉｓｐｌａｙ）、および無機ＥＬディスプレイ（ＩＥＬＤ：ＩｎｏｒｇａｎｉｃＥｌｅｃｔｒｏ－ＬｕｍｉｎｅｓｃｅｎｃｅＤｉｓｐｌａｙ）などを含む。

タッチセンサ１３ｂは、ユーザの指、またはスタイラスなどの接触または近接を検出する。タッチセンサ１３ｂは、電子機器１への入力を受け付ける入力手段のうちの１つとして利用される。接触または近接を検出する方式は、静電容量方式、抵抗膜方式、表面弾性波方式、赤外線方式、または荷重検出方式などの任意の方式でよい。タッチセンサ１３ｂは、入射した光の少なくとも一部を透過させる。

タッチセンサ１３ｂは、平面視において少なくとも一部がディスプレイ１３aと重なるように位置する。他の実施形態において、タッチセンサ１３ｂは、ディスプレイ１３aと並んで位置してもよいし、離れて位置してもよい。

図２を参照して、一実施形態に係る電子機器１の機能について説明する。図２は、一実施形態に係る電子機器１のブロック図である。

電子機器１は、マイク１１と、スピーカ１２と、ディスプレイ１３aと、タッチセンサ１３ｂと、測位センサ１６と、状態センサ１５と、通信インタフェース１４と、ストレージ１７と、プロセッサ１８とを含む。

マイク１１は、周囲の音声を集音する。マイク１１は、電気信号をＡ／Ｄ変換し、変換後のデジタルの音声信号をプロセッサ１８へ電子機器１に出力させてもよい。マイク１１は、入力を受け付けた音声に対応する電気信号をプロセッサ１８に入力する。マイク１１は、外部のマイクと有線または無線で通信可能な音声入力インタフェースを含む。外部のマイクは、例えばイヤホン、およびスマートスピーカなどに備えられていてもよい。

スピーカ１２は、プロセッサ１８から入力された信号に基づいて、音声を出力する。音声出力部は、プロセッサ１８からのデジタルの音声信号をデコード処理およびＤ／Ａ変換し、変換後の電気信号に基づいて音声を電子機器１に出力させてもよい。スピーカ１２は、各種プログラムの情報等を音声で出力できる。スピーカ１２は、外部のマイクと有線または無線で通信可能な音声出力インタフェースを含む。外部のスピーカは、例えばイヤホン、およびスマートスピーカ１２などに備えられていてもよい。スピーカ１２には、電話の音声を出力するレシーバが含まれてもよい。

ディスプレイ１３aは、プロセッサ１８から入力された信号に基づいて、文字、写真、記号、図形等の画像を表示する。

タッチセンサ１３ｂは、指などの接触または近接を検出する。タッチセンサ１３ｂは、検出した接触または近接に対応する信号をプロセッサ１８に入力する。

通信インタフェース１４は、外部装置と通信する。通信インタフェース１４は、例えば物理コネクタ、無線通信インタフェースを含む。物理コネクタは、電気信号による伝送に対応した電気コネクタ、光信号による伝送に対応した光コネクタ、および電磁波による伝送に対応した電磁コネクタを含む。電気コネクタは、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）、ＨＤＭＩ（登録商標）（Ｈｉｇｈ－ＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ）、ＭＨＬ（ＭｏｂｉｌｅＨｉｇｈ－ｄｉｆｉｎｉｔｉｏｎＬｉｎｋ）、ライトピーク（ＬｉｇｈｔＰｅａｋ）、サンダーボルト（登録商標）（Ｔｈｕｎｄｅｒｂｏｌｔ）、およびＬＡＮコネクタ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋｃｏｎｎｅｃｔｏｒ）などの汎用的な端子を含む。無線通信インタフェースは、種々の規格に準拠する無線通信インタフェースを含む。無線通信インタフェースによってサポートされる無線通信規格は、例えば、２Ｇ、３Ｇ、４Ｇ等のセルラーフォンの通信規格、および近距離無線の通信規格などを含む。セルラーフォンの通信規格は、例えば、ＬＴＥ（ＬｏｎｇＴｅｒｍＥｖｏｌｕｔｉｏｎ）、Ｗ－ＣＤＭＡ（ＷｉｄｅｂａｎｄＣｏｄｅＤｉｖｉｓｉｏｎＭｕｌｔｉｐｌｅＡｃｃｅｓｓ）、およびＷｉＭＡＸ（ＷｏｒｌｄｗｉｄｅＩｎｔｅｒｏｐｅｒａｂｉｌｉｔｙｆｏｒＭｉｃｒｏｗａｖｅＡｃｃｅｓｓ）などを含む。近距離無線の通信規格は、例えば、ＩＥＥＥ８０２．１１、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＩｒＤＡ（ＩｎｆｒａｒｅｄＤａｔａＡｓｓｏｃｉａｔｉｏｎ）、およびＮＦＣ（ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ）、ＷＰＡＮ（ＷｉｒｅｌｅｓｓＰｅｒｓｏｎａｌＡｒｅａＮｅｔｗｏｒｋ）などを含む。ＷＰＡＮの通信規格は、例えば、ＺｉｇＢｅｅ（登録商標）を含む。

状態センサ１５は、電子機器１の状態を検出し、検出結果をプロセッサ１８に入力する。状態センサ１５は、加速度センサを含む。状態センサ１５は、さらにジャイロセンサ、方位センサ等を含んでいてもよい。加速度センサは、電子機器１に働く加速度の方向および大きさを検出する。ジャイロセンサは、電子機器１の角度および角速度を検出する。方位センサは、地磁気の向きを検出する。状態センサは、さらに照度センサを含んでもよい。照度センサは、電子機器１に照射される光量を検出する。

測位センサ１６は、電子機器１の現在地を示す位置情報を取得し、取得した結果をプロセッサ１８に入力する。測位センサ１６は、電子機器１の位置を、例えばＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）受信機、または通信インタフェース１４が無線ネットワークを確立している基地局に基づいて取得する。

ストレージ１７は、プログラム１７ａおよびデータ１７ｂを記憶する。ストレージ１７は、半導体記憶媒体、磁気記憶媒体などの任意の非一過的（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ）な記憶媒体を含む。ストレージ１７は、複数の種類の記憶媒体を含んでもよい。ストレージ１７は、メモリカード、光ディスク、または光磁気ディスク等の可搬の記憶媒体と、記憶媒体の読み取り装置との組み合わせであってもよい。ストレージ１７は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などの、プロセッサ１８の処理結果を一時的に記憶する作業領域としても利用される記憶媒体を含んでもよい。ストレージ１７に記憶されるプログラム１７ａは、フォアグランドまたはバックグランドで実行されるアプリケーション、およびアプリケーションの動作を支援する制御プログラムなどを含む。ストレージ１７に記憶されるデータ１７ｂは、タッチセンサ１３ｂの検出結果、および音声入力部１１１が受け付けた入力結果などを含む。

データ１７ｂは、音声認識辞書データを含んでもよい。音声認識辞書データは、音声の特徴パターン（特徴量）と文字列とが対応付けられたデータである。ただし、音声認識辞書データは、ストレージ１７に記憶されていなくてもよい。音声認識データは、電子機器１が通信インタフェース１４を介してアクセス可能なネットワーク上に記憶されていてもよい。

プロセッサ１８は、ディスプレイ１３a、タッチセンサ１３ｂ、マイク１１、スピーカ１２、通信インタフェース１４、状態センサ１５、測位センサ１６、およびストレージ１７と電気的に接続される。プロセッサ１８は、電子機器１全体の動作を制御する。プロセッサ１８は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、およびＭＣＵ（ＭｉｃｒｏＣｏｎｔｒｏｌＵｎｉｔ）を含む。プロセッサ１８は、ＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）などのプログラマブルロジックデバイス（ＰＬＤ；ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）であってもよい。プロセッサ１８は、特定の処理に特化した専用のプロセッサ、および特定のプログラムを読み込むことによって特定の機能を実行する汎用のプロセッサであってもよい。専用のプロセッサは、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）および特定用途向けＩＣ（ＡＳＩＣ；ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）を含む。プロセッサ１８は、１つまたは複数のプロセッサが協働するＳｏＣ（Ｓｙｓｔｅｍ－ｏｎ－ａ－Ｃｈｉｐ）、およびＳｉＰ（ＳｙｓｔｅｍＩｎａＰａｃｋａｇｅ）のいずれかであってもよい。

プロセッサ１８は、ストレージ１７に記憶されているデータ１７ｂを必要に応じて参照し、ストレージ１７に記憶されているプログラム１７ａに含まれる命令を実行できる。そして、プロセッサ１８は、データ１７ｂおよび命令に応じて機能部を制御し、それによって各種機能を実現できる。また、プロセッサ１８は、検出部の検出結果に応じて制御を変更できる。機能部は、例えばスピーカ１２、ディスプレイ１３a、および通信インタフェース１４などを含む。検出部は、例えばマイク１１、タッチセンサ１３ｂ、状態センサ１５、および測位センサ１６などを含む。

プロセッサ１８は、タッチセンサ１３ｂにより検出された接触または近接、検出位置、検出位置の変化、接触または近接が継続した時間、接触または近接が検出された間隔、および接触が検出された回数の少なくとも１つに基づいて、ジェスチャの種別を判別する。ジェスチャは、指を用いて、タッチセンサ１３ｂに対して行われる操作である。タッチセンサ１３ｂに対して行われる操作は、タッチセンサ１３ｂを有するタッチパネル１３に対して行われてもよい。プロセッサ１８が判別するジェスチャには、例えば、タッチ、ロングタッチ、リリース、スワイプ、タップ、ダブルタップ、ロングタップ、ドラッグ、フリック、ピンチイン、およびピンチアウトが含まれるが、これらに限定されない。

プロセッサ１８は、状態センサ１５（例えば加速度センサ）が検出した検出結果（例えば加速度パターン）に基づいて、電子機器１の移動状態を判定できる。言い換えると、電子機器１は、状態センサ１５が検出した検出結果に基づいて電子機器１を携帯しているユーザの移動状態を判定できる。判定可能な移動状態には、ユーザが電車に乗っている状態、歩行している状態、走行している状態、自動車に乗っている状態を含むが、これらに限定されない。

プロセッサ１８は、状態センサ１５（例えば加速度センサおよび照度センサ）が検出した検出結果（例えば加速度パターンおよび光量）に基づいて、電子機器１の携行状態を判定できる。言い換えると、電子機器１は、状態センサ１５が検出した検出結果に基づいてユーザがどのように電子機器１を携帯しているかを判定できる。判定可能な移動状態には、ユーザが電子機器１を鞄またはリュックに収納して携行している状態、着用されたパンツのポケットに収納して携行している状態、着用されたシャツの胸ポケットに収納して携行している状態を含むが、これらに限定されない。プロセッサ１８は、電子機器１が閉空間に位置すると判定した場合に、ユーザが電子機器１を鞄またはリュックに入れて携行している状態であると判定し得る。また、プロセッサ１８は、電子機器１の片側に照射される光量が反対側に照射される光量よりも少ないと判定した場合に、ユーザが電子機器１をシャツの胸ポケットに入れて携行している状態であると判定し得る。また、プロセッサ１８は、状態センサ１５が検出した検出した検出結果、ならびに、電子機器１における状態センサ１５（例えば照度センサ）の位置およびマイク１１の位置に基づき、マイク１１がポケットの上側に近い状態および下側に近い状態のどちらで電子機器１がシャツの胸ポケットに入れているかを判定してもよい。

プロセッサ１８は、マイク１１に入力された音声を認識（音声認識）できる。プロセッサ１８は、音声認識処理として、入力された音声の特徴パターンに基づいて、ストレージ１７または通信インタフェース１４を介してアクセス可能なネットワーク上に記憶された音声認識辞書データから文字列を読み出す。文字列を読み出す際に、プロセッサ１８は、音声認識辞書データと入力された音声の特徴パターンとを照合し、その類似度を判断する。

プロセッサ１８は、マイク１１に入力された音声を認識した場合に、認識した音声に応じて処理を実行できる。認識した音声に応じて実行される処理は、例えば音声の出力、電子機器１が有する機能の実行、電子機器１の設定の変更、インターネット検索の実行、電子機器１に記憶されたアプリケーションの起動、および電子機器１に記憶されたアプリケーションが有する機能の実行を含む。なお、所定の処理を実行させる音声は、音声コマンドともいう。そして、所定の処理を実行させる音声コマンドに対して、音声コマンドの入力を受け付ける契機となる音声は、音声トリガーと呼ばれる。プロセッサ１８は、音声トリガーがマイク１１に入力された場合に音声コマンドの入力を受付けることができる。

一実施形態において、プロセッサ１８は、音声コマンドを認識した場合に、電子機器１の状態に応じて異なる処理を実行してもよい。例えば、プロセッサ１８は、音声コマンドを認識したときに、電子機器１の設定に応じて異なる処理を実行してもよい。設定は、ユーザによって変更可能な設定であってもよい。設定は、音声の出力先を変更する設定を含まなくてもよい。音声の出力先を変更することとは、例えば、音声の出力先を、電子機器１のスピーカ１２から外部のスピーカに変更することである。また例えば、プロセッサ１８は、音声コマンドを認識したときに、電子機器１が実行している処理に応じて異なる処理を実行してもよい。このとき、電子機器１が実行している処理とは、プロセッサ１８がマイク１１に入力された音声を認識する前から後にかけて継続的に実行されている処理であってもよい。また例えば、プロセッサ１８は、音声コマンドを認識したときに、音声コマンドを認識したタイミングから所定時間前までの間にユーザによって電子機器１になされた操作に応じて異なる処理を実行してもよい。また例えば、プロセッサ１８は、音声コマンドを認識したときに、状態センサ１５が取得した取得結果に応じて異なる処理を実行してもよい。また例えば、プロセッサ１８は、音声コマンドを認識したときに、測位センサ１６が取得した取得結果に応じて異なる処理を実行してもよい。

なお、プロセッサ１８は、認識した音声が、所定の音声コマンドである場合、電子機器１の状態に関わらず同一の処理を実行してもよい。

他の実施形態において、プロセッサ１８は、電子機器１の状態に応じて、音声入力を待ち受けない第１モードと、音声入力を待ち受ける第２モードとを切り替えてもよい。例えば、プロセッサ１８は、電子機器１の設定、または電子機器１が実行している処理に応じて、電子機器１を、音声入力を待ち受けない第１モードに設定してもよい。このとき、プロセッセは、状態センサ１５が取得した取得結果、または測位センサ１６が取得した取得結果に応じて、電子機器１を、音声入力を待ち受ける第２モードに変更してもよい。

他の実施形態において、プロセッサ１８は、電子機器１が所定条件を満たしたと判定すると、ユーザに音声入力を促す情報を電子機器１に出力させてもよい。例えば、プロセッサ１８は、電子機器１の設定に応じてユーザに音声入力を促す情報を電子機器１に出力させてもよい。また例えば、プロセッサ１８は、電子機器１が実行している処理に応じてユーザに音声入力を促す情報を電子機器１に出力させてもよい。また例えば、プロセッサ１８は、一定時間内にユーザによって電子機器１になされた操作に応じてユーザに音声入力を促す情報を電子機器１に出力させてもよい。また例えば、プロセッサ１８は、状態センサ１５が取得した取得結果に応じてユーザに音声入力を促す情報を電子機器１に出力させてもよい。また例えば、プロセッサ１８は、測位センサ１６が取得した取得結果に応じてユーザに音声入力を促す情報を電子機器１に出力させてもよい。

図３Ａおよび図３Ｂを参照して、一実施形態に係る電子機器１の動作について説明する。図３Ａおよび図３Ｂは、音声入力に応じて実行される電子機器１の動作の一例を示す図である。

上述したように、プロセッサ１８は、マイク１１に入力された音声に基づき音声コマンドを認識した場合に、電子機器１の状態に応じて異なる処理を実行できる。より具体的には、プロセッサ１８は、マイク１１に入力された音声に基づき音声コマンドを認識したときに、電子機器１が所定状態であるか否かを判定し、電子機器１が所定状態であると判定した場合、認識した音声コマンドに応じた第１処理を実行してもよい。また、プロセッサ１８は、電子機器１が所定状態でないと判定した場合、認識した音声コマンドに応じた第２処理を実行してもよい。

図３Ａに示すように、ステップＳ３１において、電子機器１のディスプレイ１３aには、「マナーモードに設定されています」という文字列が表示される。この表示は、電子機器１はマナーモードに設定されていることを示す。

ステップＳ３２において、ユーザは、「明日の天気は？」という音声を発する。ユーザが、「明日の天気は？」という音声を発すると、当該音声がマイク１１に入力される。

ステップＳ３３において、電子機器１は、マイク１１に入力された音声に基づき「明日の天気は？」という音声コマンドを認識する。これにより、電子機器１のディスプレイ１３aには、明日の天気に関する文字列およびオブジェクトを含む画像が表示される。具体的には、ディスプレイ１３aには、「明日（２０１８／○／×）の天気予報」および「晴れ」という文字列、並びに太陽を模した晴れを示すオブジェクトが表示される。

図３Ｂに示すように、ステップＳ４１において、電子機器１のディスプレイ１３aには、「マナーモードに設定されていません」という文字列が表示される。この表示は、電子機器１はマナーモードに設定されていないことを示す。

ステップＳ４２において、ユーザは、「明日の天気は？」という音声を発する。ユーザが、「明日の天気は？」という音声を発すると、当該音声がマイク１１に入力される。

ステップＳ３４において、電子機器１は、マイク１１に入力された音声に基づき「明日の天気は？」という音声コマンドを認識する。これにより、電子機器１のスピーカ１２からは、「明日の天気は晴れです」という音声が出力される。

このように、電子機器１は、マナーモードに設定されている場合、マイク１１に入力された音声に基づき音声コマンドを認識したときに、認識した音声コマンドの内容に応じてディスプレイ１３aに画像を表示させることができる。マナーモードに設定されている状態は、所定状態の一例である。ディスプレイ１３aに画像を表示させる処理は、第１処理の一例である。なおこのとき、電子機器１は、ディスプレイ１３aに画像を表示させるのみで、スピーカ１２に音声を出力させなくてもよい。一方、電子機器１は、電子機器１がマナーモードに設定されていない場合、マイク１１に入力された音声に基づき音声コマンドを認識したときに、認識した音声コマンドの内容に応じてスピーカ１２に音声を出力させることができる。スピーカ１２に音声を出力させる処理は、第２処理の一例である。なおこのとき、電子機器１は、スピーカ１２に音声を出力させるとともに、ディスプレイ１３aに画像を表示させてもよい。

所定状態の例はマナーモードに設定されている状態に限られない。ここで、電子機器１は、状態センサ１５が検出した検出結果に基づいてユーザの移動状態が第１移動状態であると判定した場合、マイク１１に入力された音声に基づき音声コマンドを認識したときに、認識した音声コマンドの内容に応じてディスプレイ１３aに画像を表示させてもよい。一方、電子機器１は、ユーザの移動状態が第１移動状態でないと判定した場合、または、ユーザの移動状態が第２移動状態であると判定した場合、マイク１１に入力された音声に基づき音声コマンドを認識したときに、認識した音声コマンドの内容に応じてスピーカ１２に音声を出力させてもよい。第１移動状態はユーザが電車に乗っている状態を含む。第２移動状態はユーザが歩行している状態、走行している状態、自動車に乗っている状態を含む。第１移動状態は、所定状態の一例である。

なお、電子機器１は、マナーモードに設定されていても、ユーザの移動状態が第２移動状態であると判定した場合、マイク１１に入力された音声に基づき音声コマンドを認識したとき、認識した音声コマンドの内容に応じてスピーカ１２に音声を出力させてもよい。

他の実施形態において、電子機器１は、マナーモードに設定されていても、測位センサ１６が取得した位置情報が登録された位置情報（例えば、ユーザの自宅）であると判定した場合、マイク１１に入力された音声に基づき音声コマンドを認識したとき、認識した音声コマンドの内容に応じてスピーカ１２に音声を出力させてもよい。

他の実施形態において、電子機器１は、マナーモードに設定されていても、無線通信インタフェースを介して所定の外部機器と接続した場合、マイク１１に入力された音声に基づき音声コマンドを認識したとき、認識した音声コマンドの内容に応じてスピーカ１２に音声を出力させてもよい。所定の外部機器は、無線ＬＡＮ装置を含む。無線ＬＡＮ装置は、ユーザの自宅に設置される装置であってもよい。所定の外部装置は、Ｂｌｕｅｔｏｏｔｈ（登録商標）装置を含む。Ｂｌｕｅｔｏｏｔｈ（登録商標）装置は、釣り向けの装置（例えば、魚群探知機または当たりセンサなど）であってもよい。

他の実施形態において、電子機器１は、マナーモードに設定されていても、状態センサ１５の検出結果に基づいて、マイク１１がポケットの上側に近い状態で電子機器１がユーザの着用するシャツの胸ポケットに収納されていると判定した場合に、認識した音声コマンドの内容に応じてスピーカ１２に音声を出力させてもよい。すなわち、電子機器１は、音声コマンドに対して第１処理を実行させる所定の設定がなされていても、状態センサ１５の検出結果に応じて、認識した音声コマンドに対して第２処理を実行してもよい。また他の実施形態において、電子機器１は、マナーモードに設定されていても、ユーザの移動状態が第２状態であり、かつマイク１１がポケットの上側に近い状態で電子機器１がユーザの着用するシャツの胸ポケットに収納されていると判定した場合に、認識した音声コマンドの内容に応じてスピーカ１２に音声を出力させてもよい。

図４を参照して、一実施形態に係る電子機器１の動作について説明する。図４は、音声入力に応じて実行される動作の他の例を示す図である。

上述したように、プロセッサ１８は、認識した音声が所定の音声コマンドである場合、電子機器１の状態に関わらず同一の処理を実行できる。より具体的には、プロセッサ１８は、認識した音声が第１音声コマンドである場合、電子機器１の状態に関わらず第２処理を実行してもよい。

図４に示すように、電子機器１のユーザは、「スマホはどこ？」という音声を発する。電子機器１のユーザが、「スマホはどこ？」という音声を発すると、マイク１１に、当該音声が入力される。電子機器１は、マイク１１に入力された音声に基づき、「スマホはどこ？」という音声コマンドを認識する。これにより、電子機器１のスピーカ１２からは、電子機器１の状態に関わらず音声が出力される。音声は言語で出力されてもよいし、機械音で出力されてもよい。

このように、電子機器１は、認識した音声が、電子機器１の位置を問う音声である場合、電子機器１の状態に関わらずスピーカ１２に音声を出力させることができる。電子機器１の位置を問う音声は、第１音声コマンドの一例である。スピーカ１２に音声を出力させる処理は、第２処理の一例である。

図５を参照して、一実施形態に係る電子機器１の動作について説明する。図５は、電子機器１の状態に応じて実行される処理の動作の他の例を示す図である。

上述したように、プロセッサ１８は、電子機器１の状態に応じて、音声入力を待ち受けない第１モードと、音声入力を待ち受ける第２モードとを切り替えることができる。より具体的には、プロセッサ１８は、電子機器１が第１状態であるか否かを判定し、電子機器１が第１状態であると判定した場合、電子機器１を、音声入力を待ち受けない第１モードに設定してもよい。その後、プロセッサ１８は、電子機器１が第２状態であるか否かを判定し、電子機器１が第２状態であると判定した場合、電子機器１を、音声入力を待ち受ける第２モードに設定してもよい。

ステップＳ６１において、電子機器１は通話処理を実行している。通話処理が実行されている場合、電子機器１は、音声入力を待ち受けない第１モードに設定される。ここで、ユーザは、「もしもし」という音声を発する。ユーザが、「もしもし」という音声を発すると、当該音声がマイク１１に入力される。このとき、「もしもし」という音声は音声コマンドとしては認識されず、通話音声として認識される。なお、「ばいばい」などの特定の音声のみ、通話音声として認識されると同時に、通話処理を終了するための音声コマンドとして認識されてもよい。

ステップＳ６２において、ユーザは、電子機器１を自身の耳から遠ざけている。このとき、電子機器１は、状態センサ１５の検出結果に基づいて、電気機器に物体が近接した状態から、近接していない状態になったと判定する。電子機器１に物体が近接していないと判定された場合、通話処理が継続していても、電子機器１は、音声入力を待ち受ける第２モードに設定される。ここで、ユーザは、「明日のスケジュールを教えて」という音声を発する。ユーザが、「明日のスケジュールを教えて」という音声を発すると、当該音声がマイク１１に入力される。

ステップＳ６３において、電子機器１は、マイク１１に入力された音声に基づき、「明日のスケジュールを教えて」という音声コマンドを認識する。これにより、電子機器１のディスプレイ１３aには、ユーザ入力などによって電子機器１またはユーザのアカウントなどに設定された明日のスケジュールが表示される。

このように、電子機器１は、通話処理を実行している場合、音声入力を待ち受けない第１モードに設定される。また、電子機器１に物体が近接していないと判定された場合、通話処理が継続していても、電子機器１は、音声入力を待ち受ける第２モードに設定される。電子機器１が通話処理を実行している状態は、第１状態の一例である。通話中に電子機器１に物体が近接していない状態は、第２状態の一例である。なお、電子機器１は、電子機器１に物体が近接していないと判定され、かつ通話処理がスピーカモードで行われていないと判定された場合にのみ、通話処理が継続していても、音声入力を待ち受ける第２モードに設定されてもよい。

図６および図７を参照して、一実施形態に係る電子機器１の動作について説明する。図６および図７は、電子機器１の状態に応じて実行される処理の動作の他の例を示す図である。

上述したように、プロセッサ１８は、電子機器１が所定条件を満たしたと判定すると、ユーザに音声入力を促す情報を電子機器１に出力させることができる。

図６に示すように、ステップＳ７１において、ユーザは歩行している。このときユーザは、電子機器１を携帯している。電子機器１は、状態センサ１５の検出結果に基づいて、ユーザが歩行している状態であると判定する。

ステップＳ７２において、ユーザは転倒している。このとき、電子機器１は、状態センサ１５の検出結果に基づいて、ユーザが転倒したと判定する。

ステップＳ７３において、電子機器１のスピーカ１２からは、「転倒しましたか？１１９番に電話して救助を要請しますか？」という音声が出力される。

このように、電子機器１は、状態センサ１５が取得した取得結果に基づいて電子機器１のユーザが転倒したと判定した場合に、ユーザに音声入力を促す情報をスピーカ１２に出力させることができる。ユーザが転倒することは所定条件を満たすことの一例である。ユーザに音声入力を促す情報は、例えば、所定処理を実行するか否かを問う質問を含む。所定処理は、所定の電話番号に発信する処理を含む。電子機器１は、質問を前記出力部に出力させた後、質問に対する応答の音声入力を受け付けてもよい。電子機器１は、質問に対して、所定処理を実行する旨の応答がマイク１１に入力されると、所定処理を実行する。所定処理を実行する旨の応答は、音声コマンドの１つである。なお、プロセッサ１８は、所定条件が満たされたと判定した場合、前記音声トリガーが入力されたか否かに関わらず音声コマンドの入力を受け付けてもよい。

図７に示すように、ステップＳ８１において、電子機器１のディスプレイ１３aには連絡先リストが表示されている。連絡先リストは、所定のアプリケーションが実行されることなどにより、ディスプレイ１３aに表示され得る。ユーザは、連絡先リストが表示されている画面に対してスワイプ操作を行うことで、ディスプレイ１３aの表示画面をスクロールさせている。

ステップＳ８１において、電子機器１のディスプレイ１３aには、「名前を音声入力してください。連絡先を検索できます。」という文字が表示される。

このように、電子機器１は、所定のアプリケーションを実行中、一定時間内に表示画面が所定距離または所定回数スクロールされた場合に、ユーザに音声入力を促す情報を電子機器１に出力させてもよい。または、電子機器１は、所定のユーザ操作が一定時間内に所定回数以上行われたと判定した場合に、ユーザに音声入力を促す情報を電子機器１に出力させてもよい。所定のユーザ操作とは、例えばスワイプ操作である。所定のアプリケーションを実行中において、一定時間内に表示画面が所定距離スクロールされること、一定時間内に表示画面が所定回数スクロールされること、および、一定時間内にタッチパネル１３に対して所定のユーザ操作が所定回数以上行われることは、所定条件を満たすことの一例である。なお、ユーザに音声入力を促す情報は、例えば、音声入力が可能であることを示唆する内容、認識可能な音声コマンド、認識可能な音声コマンドの内容を示唆する内容、または当該音声コマンドによって実行される所定処理の内容などを含む。なお、プロセッサ１８は、所定条件が満たされたと判定した場合、前記音声トリガーが入力されたか否かに関わらず音声コマンドの入力を受け付けてもよい。ここで、前記音声トリガーが入力されたか否かに関わらず入力を受け付ける音声コマンドとは、スピーカ１２に出力されたか、またはディスプレイ１３aに表示された音声コマンドであってもよい。プロセッサ１８は、音声コマンドがマイク１１に入力されると、音声コマンドによって実行される所定処理を実行する。所定処理は、所定のリストから１の要素を選択する処理を含む。

所定条件を満たすことの例は、電子機器１のユーザが転倒したと判定されたこと、および所定のユーザ操作が一定時間内に所定回数以上行われたと判定されたことに限られない。例えば、電子機器１は、電話着信があった場合に、ユーザに音声入力を促す情報を電子機器１に出力させてもよい。このとき、ユーザに音声入力を促す情報は、例えば「Ａさんから着信です。電話を受けますか？」という音声である。また例えば、電子機器１は、メールを受信した場合に、ユーザに音声入力を促す情報を電子機器１に出力させてもよい。このとき、ユーザに音声入力を促す情報は、例えば「メールを受信しました。内容を読み上げますか？」という音声である。

また例えば、電子機器１は、運転中に利用することが想定されたナビゲーションアプリ、または料理中に使用することが想定されたレシピ閲覧用アプリなどの所定のアプリケーションが起動した、もしくは起動している場合に、ユーザに音声入力を促す情報を出力してもよい。このとき、ユーザに音声入力を促す情報は、例えば「目的地を音声入力してください」または「レシピ閲覧中は音声トリガー無しで音声入力可能です」などという音声である。

図８を参照して、一実施形態に係る電子機器１の制御について説明する。図８は、電子機器１の状態に応じて実行される制御の一例を示すフローチャートである。

ステップＳ１０１：プロセッサ１８は、マイク１１に音声が入力されたか否かを判定する。マイク１１に音声が入力されたと判定された場合（ステップＳ１０１でＹｅｓ）、プロセッサ１８は処理をステップＳ１０２に進める。マイク１１に音声が入力されていないと判定された場合、（ステップＳ１０１でＮｏ）、プロセッサ１８はステップＳ１０１の処理を繰り返す。

ステップＳ１０２：プロセッサ１８は、マイク１１に入力された音声を認識する。

ステップＳ１０３：プロセッサ１８は、認識した音声が第１音声コマンドか否かを判定する。認識した音声が第１音声コマンドであると判定された場合（ステップＳ１０３でＹｅｓ）、プロセッサ１８は処理をステップＳ１０６に進める。認識した音声が第１音声コマンドでないと判定された場合（ステップＳ１０３でＮｏ）、プロセッサ１８は処理をステップＳ１０４に進める。

ステップＳ１０４：プロセッサ１８は、電子機器１が所定状態か否かを判定する。電子機器１が所定状態であると判定されると（ステップＳ１０４でＹｅｓ）、プロセッサ１８は処理をステップＳ１０５に進める。電子機器１が所定状態でないと判定されると（ステップＳ１０４でＮｏ）、プロセッサ１８は処理をステップＳ１０７に進める。

ステップＳ１０５：プロセッサ１８は、電子機器１に第１処理を実行し、処理を終了する。

ステップＳ１０６：プロセッサ１８は、電子機器１に第２処理を実行し、処理を終了する。

ステップＳ１０７：プロセッサ１８は、認識した音声が第２音声コマンドか否かを判定する。認識した音声が第２音声コマンドであると判定された場合（ステップＳ１０７でＹｅｓ）、プロセッサ１８は処理をステップＳ１０５に進める。認識した音声が第２音声コマンドでないと判定された場合（ステップＳ１０３でＮｏ）、プロセッサ１８は処理をステップＳ１０６に進める。

上述したように、所定状態は、電子機器１がマナーモードに設定されている状態、および電子機器１の移動状態が電車である状態を含む。第１音声コマンドは、電子機器１の位置を問う音声を含む。第１処理は、ディスプレイ１３aに画像を表示させる処理を含む。第２処理は、スピーカ１２に音声を出力させる処理を含む。

なお、図８に示すように、一実施形態において、プロセッサ１８は、電子機器１が所定状態でないと判定した場合でも、認識した音声が第２音声コマンドである場合は、第１処理を実行してもよい。また、プロセッサ１８は、電子機器１が所定状態でないと判定し、かつ前記認識した音声が第２音声コマンドでない場合には、第２処理を実行してもよい。第２音声コマンドは、例えばアプリを起動させるコマンド、または電話を発信させるコマンドなど、実行される処理が音声出力を必要としないものを含む。言い換えると、第２音声コマンドは、文字列の出力を要求しないものを含む。なお、電子機器１の設定において音声コマンドに応じた処理の出力方法が設定されている場合はこの限りではない。例えば電子機器１は、音声コマンドに応じた処理を画面表示のみに設定することができる。この場合、プロセッサ１８が、電子機器１が所定状態ではないと判定し、かつ認識した音声コマンドが第１音声コマンドとも第２音声コマンドとも異なる音声コマンドであったとしても、第１処理を実行してもよい。なお、図３Ａおよび図３Ｂで例示した「明日の天気は？」という音声コマンドは、機器が所定状態でない場合にスピーカ１２に音声を出力させる音声コマンド、すなわち第２音声コマンドとは異なる音声コマンドであるとして説明した。しかしながら、当該音声コマンドは第２音声コマンドにもなり得ることに留意されたい。

上述した実施形態にかかる電子機器１によれば、状況に応じて、音声コマンドに対して画像表示と音声出力が適切に実行されるため、ユーザは、周囲の状況に留意することなく音声認識機能を利用できる。また、特定の音声コマンドをついては、対応する処理が固定されるため、ユーザの意図と異なる処理が実行される可能性を軽減できる。ひいては、音声認識技術の利便性が向上する。

図９を参照して、一実施形態に係る電子機器１の制御について説明する。図９は、電子機器１の状態に応じて実行される制御の一例を示すフローチャートである。

ステップＳ２０１：プロセッサ１８は、電子機器１が第１状態か否かを判定する。電子機器１が第１状態であると判定されると（ステップＳ２０１でＹｅｓ）、プロセッサ１８は処理をステップＳ２０２に進める。電子機器１が第２１状態でないと判定されると（ステップＳ２０１でＮｏ）、プロセッサ１８は、ステップＳ２０１の処理を繰り返す。

ステップＳ２０２：プロセッサ１８は、電子機器１に、音声入力を待ち受けない第１モードを実行させる。

ステップＳ２０３：プロセッサ１８は、電子機器１が第２状態か否かを判定する。電子機器１が第２状態であると判定されると（ステップＳ２０３でＹｅｓ）、プロセッサ１８は処理をステップＳ２０４に進める。電子機器１が第２状態でないと判定されると（ステップＳ２０３でＮｏ）、プロセッサ１８は、ステップＳ２０１の処理を繰り返す。

ステップＳ２０４：プロセッサ１８は、電子機器１に、音声入力を待ち受ける第２モードを実行させる。

上述したように、第１状態は、通話状態を含む。第２状態は、通話中に電子機器１が物体（例えばユーザの顔）から離れている状態を含む。

上述した実施形態にかかる電子機器１によれば、通常音声コマンドの入力が制限される場合においても、ユーザの意図に応じて音声コマンドの入力が可能になる。ひいては、音声認識技術の利便性が向上する。

図１０を参照して、一実施形態に係る電子機器１の制御について説明する。図１０は、電子機器１の状態に応じて実行される制御の他の例を示すフローチャートである。

ステップＳ３０１：プロセッサ１８は、電子機器１が所定条件を満たすか否かを判定する。電子機器１が所定条件を満たすと判定されると（ステップＳ３０１でＹｅｓ）、プロセッサ１８は処理をステップＳ３０２に進める。電子機器１が所定条件を満たさないと判定されると（ステップＳ３０１でＮｏ）、ステップＳ３０１の処理を繰り返す。

ステップＳ３０２：プロセッサ１８は、電子機器１にユーザに音声入力を促す情報を出力させる。

ステップＳ３０３：プロセッサ１８は、電子機器１がユーザに音声入力を促す情報を出力してから一定時間の間に、マイク１１に音声コマンドが入力されたか否かを判定する。マイク１１に音声コマンドが入力されたと判定されると（ステップＳ３０３でＹｅｓ）、プロセッサ１８は、処理をステップＳ３０４に進める。マイク１１に音声コマンドが入力されていないと判定すると（ステップＳ３０３でＮｏ）、処理を終了する。なおステップＳ３０３において、プロセッサ１８は、音声トリガーの入力を要求しなくてもよい。

ステップＳ３０４：プロセッサ１８は、マイク１１に入力された音声コマンドに応じた処理を実行する。

上述したように、所定条件を満たすことは、ユーザが転倒したと判定されること、および所定のアプリケーションを実行中、一定時間内に表示画面が所定距離または所定回数スクロールされること（または、スワイプ操作が所定回数以上行われたと判定されること）、電話着信があったこと、メールを受信したことを、所定のアプリケーションが起動した、もしくは起動していることを含む。ユーザに音声入力を促す情報は、音声入力が可能であることを示唆する内容、認識可能な音声コマンド、認識可能な音声コマンドの内容を示唆する内容、または当該音声コマンドによって実行される所定処理の内容などを含む。

なお、ユーザに音声入力を促す情報が出力されるタイミングは、所定条件を満たすと判定されてから一定時間内でもよいが、これに限られない。例えば、プロセッサは、所定条件が満たされたと判定すると、電子機器１のモードを着信時に音声で受話を開始できるモード（第３モード）に変更し、実際に着信があった場合に、音声で受話を開始できることを示唆する内容の情報を電子機器１に出力させてもよい。このとき、所定条件を満たすこととは、状態センサ１５の検出結果に基づきユーザが自動車を運転している状態であると判定すること、測位センサ１６が取得した位置情報に基づいてユーザが自宅にいると判定すること、状態センサ１５の検出結果に基づき、マイク１１がポケットの上側に近い状態で電子機器１がユーザの着用するシャツの胸ポケットに収納されていると判定することなどを含む。加えて、第３モードにおいては、着信時の着信音やバイブレータの振動パターンを変更してもよい。着信音または振動パターンを変更することとは、例えば、着信中に着信音または振動が停止する時間を長くすることである。かかる構成によれば、通常、着信音の鳴動中またはバイブレータの振動中は音声コマンドが認識されにくいところ、音声コマンドが認識される可能性を高めることができる。また、第３モードにおいては、通話をスピーカモードで開始するようにしてもよい。

上述した実施形態にかかる電子機器１によれば、ユーザは、音声認識機能を利用できる場面を容易に認知することができる。また、ユーザは、通常よりも容易に音声コマンドを入力することができる。ひいては、音声認識技術の利便性が向上する。

他の実施形態において、プロセッサ１８は、電子機器１が所定条件を満たすと判定した場合、電子機器１にユーザに音声入力を促す情報を出力させるとともに、マイク１１の感度を上げてもよい。

他の実施形態において、プロセッサ１８は、電子機器１が所定の条件を満たすと判定した場合、ディスプレイ１３aに表示させる情報の量を一時的に制限したり、使用可能なアプリケーションの数を制限したりしてもよい。

他の実施形態において、電子機器１は、ディスプレイに表示される画像が電子機器１の短手方向（左右方向）を上下方向として表示（すなわち、横画面モード）されており、かつ所定のアプリケーションが起動した、もしくは起動している場合に、ユーザに音声入力を促す情報を出力してもよい。

電子機器１は折りたたみ式の機器であってもよい。折りたたみ式の機器は、フィーチャーフォンを含む。プロセッサ１８は、電子機器１が閉状態および開状態のどちらかを判定できる。ここでプロセッサ１８は、電子機器１が閉状態であり、かつ所定条件が満たされたと判定した場合に、電子機器１にユーザに音声入力を促す情報を出力させてもよい。

実施形態では特に触れていないが、電子機器１が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、ＣＤ－ＲＯＭやＤＶＤ－ＲＯＭ等の記録媒体であってもよい。

あるいは、電子機器１が行う各処理を実行するためのプログラムを記憶するメモリおよびメモリに記憶されたプログラムを実行するプロセッサによって構成されるチップが提供されてもよい。

以上、本発明を図面や実施形態に基づき説明してきたが、本発明は図面や上位実施形態に限定されるべきではないことに注意されたい。当業者であれば本開示に基づき種々の変形や修正を行うことが容易であり、したがって、これらの変形や修正は本発明の範囲に含まれる。例えば、各手段、各ステップ、またそれらに含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の手段、ステップ、または機能等を１つに組み合わせたり、分割したりすることができる。

１電子機器
１１マイク
１２スピーカ
１３タッチパネル
１３ａディスプレイ
１３ｂタッチセンサ
１４通信インタフェース
１５状態センサ
１６測位センサ
１７ストレージ
１７ａプログラム
１７ｂデータ
１８プロセッサ

Claims

音声を入力するマイクと、前記マイクに入力された前記音声を認識するプロセッサとを備えた電子機器であって、
前記プロセッサは、
通話処理を実行中でないことを条件に、前記マイクに入力された前記音声に基づき音声コマンドを認識したときに、前記電子機器が所定状態であるか否かを判定し、
前記電子機器が前記所定状態であると判定した場合、前記音声コマンドに応じて前記スピーカに音声を出力させずに前記ディスプレイに画像を表示させる処理を含む第１処理を実行し、
前記電子機器が前記所定状態でないと判定した場合、前記音声コマンドに応じて前記スピーカに音声を出力させる処理を含む第２処理を実行し、
通話処理を実行中であっても物体の近接が検知されない場合に前記音声コマンドを認識すると、前記第１処理を実行する
電子機器。
請求項１に記載の電子機器であって、
前記音声コマンドは第１音声コマンドを含み、
前記プロセッサは、前記認識した音声コマンドが前記第１音声コマンドである場合、前記電子機器の状態にかかわらず、前記第２処理を実行する
電子機器。
請求項２に記載の電子機器であって、
前記音声コマンドはさらに第２音声コマンドを含み、
前記プロセッサは、前記電子機器が前記所定状態でないと判定した場合でも、前記認識した音声が前記第２音声コマンドである場合は、前記第１処理を実行する
電子機器。
請求項３に記載の電子機器であって、
前記プロセッサは、前記電子機器が前記所定状態でないと判定し、かつ前記音声が前記第２音声コマンドでない場合に、前記第２処理を実行する
電子機器。
請求項４に記載の電子機器であって、
前記第１処理は、前記ディスプレイに画像を表示させかつ前記スピーカに音声を出力させない処理を含む
電子機器。
請求項１から５のいずれか一項に記載の電子機器であって、
前記所定状態は、前記電子機器がマナーモードである状態を含む
電子機器。
請求項２から６のいずれか一項に記載の電子機器であって、
前記第１音声コマンドは、前記電子機器の位置を問う音声を含む
電子機器。
請求項３又は４に記載の電子機器であって、
前記第２音声コマンドは、前記電子機器に文字列の出力を要求しない
電子機器。
請求項６に記載の電子機器であって、
前記電子機器の動きを検出する状態センサをさらに備え、
前記プロセッサは、
前記状態センサの検出結果に基づいて前記電子機器を携帯しているユーザの移動状態を判定し、
前記電子機器がマナーモードであると判定しても、ユーザの移動状態が所定の条件を満たすと判定した場合、前記音声コマンドを認識したときに、前記音声コマンドに応じた前記第２処理を実行する
電子機器。
請求項６に記載の電子機器であって、
前記電子機器の位置情報を取得する測位センサをさらに備え、
前記プロセッサは、
前記電子機器がマナーモードであると判定しても、前記測位センサの取得結果に基づき、前記電子機器の位置が所定の条件を満たすと判定した場合、前記音声コマンドを認識したときに、前記音声コマンドに応じた前記第２処理を実行する
電子機器。
請求項１から１０のいずれか一項に記載の電子機器であって、
前記所定状態は、音声出力先の設定に関する前記電子機器の状態を含まない
電子機器。
音声を入力するマイクを備える電子機器の制御方法であって、
通話処理を実行中でないことを条件に、前記マイクに入力された前記音声に基づき音声コマンドを認識したときに、前記電子機器が所定状態であるか否かを判定し、
前記電子機器が前記所定状態であると判定した場合、前記音声コマンドに応じて前記スピーカに音声を出力させずに前記ディスプレイに画像を表示させる処理を含む第１処理を実行し、
前記電子機器が前記所定状態でないと判定した場合、前記音声コマンドに応じて前記スピーカに音声を出力させる処理を含む第２処理を実行し、
通話処理を実行中であっても物体の近接が検知されない場合に前記音声コマンドを認識すると、前記第１処理を実行する
制御方法。
音声を入力するマイクを備える電子機器で用いられるプログラムであって、
通話処理を実行中でないことを条件に、前記マイクに入力された前記音声に基づき音声コマンドが認識されたときに、前記電子機器が所定状態であるか否かを判定させ、
前記電子機器が前記所定状態であると判定された場合、前記音声コマンドに応じて前記スピーカに音声を出力させずに前記ディスプレイに画像を表示させる処理を含む第１処理を実行させ、
前記電子機器が前記所定状態でないと判定された場合、前記音声コマンドに応じて前記スピーカに音声を出力させる処理を含む第２処理を実行させ、
通話処理を実行中であっても物体の近接が検知されない場合に前記音声コマンドを認識すると、前記第１処理を実行させる
プログラム。