JP6520100B2

JP6520100B2 - 電子機器制御システム、端末装置、及び、サーバー

Info

Publication number: JP6520100B2
Application number: JP2014252853A
Authority: JP
Inventors: 近藤　裕介; 裕介近藤
Original assignee: Onkyo Corp
Current assignee: Onkyo Corp
Priority date: 2014-12-15
Filing date: 2014-12-15
Publication date: 2019-05-29
Anticipated expiration: 2034-12-15
Also published as: JP2016114744A

Description

本発明は、テレビ、照明等の電子機器を制御するための電子機器制御システム、電子機器制御システムを構成する端末装置、及び、サーバーに関する。

近年、ユーザーが発話した音声を利用して、テレビ、照明等の電子機器を制御する技術が開発されている（例えば、特許文献１参照。）。図６は、従来の電子機器制御システムのシステム構成を示す図である。電子機器制御システム１１は、端末装置１２（１２ａ〜１２ｃ）、ホームサーバー１３、クラウドサーバー１４、ルーター１５を備える。例えば、端末装置１２ａ、ホームサーバー１３、ルーター１５は、自宅１階のリビングに設置されている。端末装置１２ｂは、自宅２階の書斎に設置されている。端末装置１２ｃは、自宅２階の子供部屋に設置されている。クラウドサーバー１４は、自宅外に設置された外部サーバーである。

端末装置１２ａ〜１２ｃは、同一の構成を有する。端末装置１２は、マイクロコンピュータ１２１、マイク１２２、スピーカー１２３、赤外線ＬＥＤ１２４等を備える。マイクロコンピュータ１２１は、端末装置１２を構成する各部を制御する。また、マイクロコンピュータ１２１は、無線ＬＡＮネットワークプロセッサーを有しており、ルーター１５と無線ＬＡＮに従った通信を行う。マイク１２２は、外部の音声を集音し音声データとして出力する。マイク１２２が出力した音声データは、図示しないＤＳＰ（Digital Signal Processor）を介して、マイクロコンピュータ１２１に入力される。なお、マイク１２２は、デジタルマイクであり、集音した音声データをＡ／Ｄ変換してＤＳＰに出力する。スピーカー１２３は、音声データに基づいて音声を出力する。なお、スピーカー１２３には、図示しないＤ／Ａコンバータが音声データ（デジタルデータ）をＤ／Ａ変換し、図示しないパワーアンプが増幅した音声データが出力される。赤外線ＬＥＤ１２４は、テレビ１６、照明１７に対して、テレビ１６、照明１７を制御するためのリモコンコードを送信する。

ホームサーバー１３は、ＣＰＵ（Central Processing Unit）１３１、ＲＡＭ（Random Access Memory）１３２、記憶部１３３、ネットワークインターフェース（以下、「ＮＷＩ／Ｆ」という。）１３４を備える。ＣＰＵ１３１は、ホームサーバー１３を構成する各部を制御する。ＲＡＭ１３２は、ＣＰＵ１３１のワークメモリとして機能する。記憶部１３３は、各種のプログラム、データを記憶する。ＮＷＩ／Ｆ１３４は、外部の機器（例えば、ルーター１５）と有線ＬＡＮ、無線ＬＡＮに従った通信を行うためのものである。

ルーター１５は、アクセスポイント機能を有しており、端末装置１２と無線ＬＡＮに従った通信を行う。また、ルーター１５は、ホームサーバー１３と有線ＬＡＮに従った通信を行う。また、ルーター１５は、ホームサーバー１３とクラウドサーバー１４とをインターネット接続する。

上述したホームサーバー１３は、電子機器（テレビ１６、照明１７）を制御するために、機器制御情報データベース（以下、「機器制御情報ＤＢ」という。）を記憶部１３３に記憶している。図７は、機器制御情報ＤＢを示す図である。図７（ａ）に示すように、機器制御情報ＤＢには、端末装置１２ａ〜１２ｃのＩＤと、端末装置１２ａ〜１２ｃの位置と、が対応付けて記憶されている。例えば、ＩＤが「ＸＸＸ１」の端末装置１２ａは、自宅１階のリビングにあることが記憶されている。また、図７（ｂ）に示すように、機器制御情報ＤＢには、端末装置１２ａ〜１２ｃのＩＤと、電子機器のプロファイルと、が対応付けて記憶されている。電子機器のプロファイルとしては、「Ａｃｃｅｓｓｏｒｙ」、「Ｓｅｒｖｉｃｅ」、「Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ」がある。「Ａｃｃｅｓｓｏｒｙ」は、制御対象の電子機器（照明、テレビ）を示す。「Ｓｅｒｖｉｃｅ」は、制御対象の機能（Ｌｉｇｈｔ、ｔｖ＿ｃｏｎｔｒｏｌ）を示す。「Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ」は、実行内容（ＰｏｗｅｒＳｔａｔｅ、ＶｏｌｕｍｅＣｏｎｔｒｏｌ等）を示す。

また、図７（ｃ）に示すように、制御対象の電子機器を特定するために、機器制御情報ＤＢには、Ａｃｃｅｓｓｏｒｙと、音声コマンドと、が対応付けて記憶されている。また、図７（ｄ）に示すように、制御対象の機能を特定するために、機器制御情報ＤＢには、Ｓｅｒｖｉｃｅと、音声コマンドと、が対応付けて記憶されている。また、図７（ｅ）に示すように、実行内容を特定するために、機器制御情報ＤＢには、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓと、音声コマンドと、が対応付けて記憶されている。

例えば、音声コマンドが、「テレビつけて」であれば、音声コマンド「テレビ」に対応するＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）は、「テレビ」である。また、音声コマンド「つけ」に対応するＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）は、「ＰｏｗｅｒＳｔａｔｅ」である。従って、ＣＰＵ１３１は、音声コマンドと機器制御情報ＤＢとに基づいて、テレビの電源をオンすることを決定することができる。そして、ＣＰＵ１３１は、テレビの電源をオンする制御コマンドを端末装置１２に送信する。

図８は、従来の電子機器制御システムの動作を示すシーケンス図である。以下、図８に基づいて、テレビ１６を制御する一連の動作を説明する。まず、ユーザーは、端末装置１２がホームサーバー１３に音声データを送信するデータ送信モードとするために、所定のキーワードを発話する。例えば、ユーザーは、「こんにちはオンキヨー」と発話する（図８の（１））。端末装置１２のマイク１２２は、ユーザーが発話した音声を集音し音声データとしてマイクロコンピュータ１２１に出力する。マイクロコンピュータ１２１は、音声認識機能を有しており、音声データに含まれる文字データを認識し、認識した文字データが所定のキーワードと一致しているか否かを判断する。マイクロコンピュータ１２１は、認識した文字データが所定のキーワードと一致していると判断した場合、データ送信モードに遷移する（図８の（２））。

次に、例えば、ユーザーは、テレビの電源をオンにしたい場合、「テレビつけて」と発話する（図８の（３））。端末装置１２のマイク１２２は、ユーザーが発話した音声を集音し音声データとしてマイクロコンピュータ１２１に出力する。マイクロコンピュータ１２１は、音声データ（「テレビつけて」）をホームサーバー１４に送信する（図８の（４））。ホームサーバー１３のＣＰＵ１３１は、ＮＷＩ／Ｆ１３４により端末装置１２が送信した音声データを受信する。次に、ＣＰＵ１３１は、ＮＷＩ／Ｆ１３４によりクラウドサーバー１４に音声データを送信し、音声認識の問い合わせを行う（図８の（５））。

クラウドサーバー１４は、ホームサーバー１３が送信した音声データを受信する。クラウドサーバー１４は、音声認識機能を有しており、音声データに含まれる文字データを認識する。次に、クラウドサーバー１４は、認識した文字データに対応する音声コマンド（「テレビつけて」）をホームサーバー１３に送信し、音声認識の結果を応答する（図８の（６））。ホームサーバー１３のＣＰＵ１３１は、ＮＷＩ／Ｆ１３４によりクラウドサーバー１４が送信した音声コマンドを受信する。ＣＰＵ１３１は、音声認識結果の解析を行う（図８の（７））。具体的には、ＣＰＵ１３１は、機器制御情報ＤＢと音声コマンドとに基づいて、音声コマンドに対応する制御コマンドを決定する。ＣＰＵ１３１は、ＮＷＩ／Ｆ１３４により決定した制御コマンド（テレビの電源をオンする制御コマンド）を送信する（図８の（８））。

同時に、ＣＰＵ１３１は、ＮＷＩ／Ｆ１３４によりクラウドサーバー１４に音声合成を行わせる要求を送信する（図８の（９））。例えば、ＣＰＵ１３１は、音声コマンドが「テレビつけて」であった場合、これに対応する「テレビつけました」の音声合成をクラウドサーバー１４に行わせる。クラウドサーバー１４は、音声合成を行い、音声合成データをホームサーバー１３に送信し、音声合成の結果を応答する（図８の（１０））。ホームサーバー１３のＣＰＵ１３１は、ＮＷＩ／Ｆ１３４により音声合成データを受信する。次に、ＣＰＵ１３１は、ＮＷＩ／Ｆ１３４により受信した音声合成データを端末装置１２に送信する（図８の（１１））。

一方、端末装置１２のマイクロコンピュータ１２１は、ホームサーバー１３が送信した制御コマンドを受信する。次に、マイクロコンピュータ１２１は、受信した制御コマンドに対応するリモコンコード（テレビの電源をオンするリモコンコード）を、赤外線ＬＥＤ１２４により送信する（図８の（１２））。テレビ１６は、端末装置１２が送信したテレビの電源をオンするリモコンコードにより電源がオンする（図８の（１３））。また、マイクロコンピュータ１２１は、ホームサーバー１３が送信した音声合成データを受信する。マイクロコンピュータ１２１は、受信した音声合成データに基づいてスピーカー１２３から音声（「テレビつけました」）を出力させる。

特開２０１３−０８８５３５号公報

従来技術においては、ユーザーは、端末装置１２をデータ送信モードとするために、所定のキーワードを発話する必要がある。このため、例えば、テレビをつけた後に、テレビの音量をあげたい場合、「こんにちはオンキヨー」、「テレビつけて」、「こんにちはオンキヨー」、「テレビの音量あげて」と所定のキーワードを復唱しなければならない。また、ユーザーは、制御したい対象の電子機器（例えば、テレビ）も復唱する必要がある。また、端末装置１２側で逐一キーワードの音声認識をする必要があるため、端末装置１２の処理能力が低く、キーワードの認識率が低い場合は、端末装置１２がデータ送信モードに遷移しない場合がある。

本発明の目的は、少ない発話量で電子機器の制御を可能とすることである。

第１の発明の電子機器制御システムは、音声区間検出機能及び音声認識機能を有し、音声データに対応する音声コマンドを送信する外部サーバーと通信を行うサーバーと、前記サーバーと通信を行う端末装置と、を備える電子機器制御システムであって、前記端末装置は、外部の音声を集音し音声データとして出力するマイクと、電子機器を制御するためのコードを送信する送信部と、前記マイクが出力する音声データに含まれる文字データと所定のキーワードとが一致した場合に、所定のキーワードよりも後に前記マイクが出力する音声データをサーバーに送信し、前記サーバーが送信する制御コマンドを受信し、受信した制御コマンドに対応するコードを前記送信部により前記電子機器に送信する第１制御部と、を備え、前記サーバーは、前記端末装置が送信する音声データを受信し、受信した音声データを前記外部サーバーに送信し、送信した音声データに対応する音声コマンドを前記外部サーバーから受信し、受信した音声コマンドに基づいて制御コマンドを決定し、決定した制御コマンドを前記端末装置に送信する第２制御部を備えることを特徴とする。

本発明では、端末装置の第１制御部は、マイクが出力する音声データに含まれる文字データと所定のキーワードとが一致した場合に、所定のキーワードよりも後にマイクが出力する音声データをサーバーに送信する。サーバーの第２制御部は、端末装置が送信する音声データを外部サーバーに送信し、送信した音声データに対応する音声コマンドを外部サーバーから受信する。また、第２制御部は、受信した音声コマンドに基づいて制御コマンドを決定し、決定した制御コマンドを端末装置に送信する。そして、端末装置の第１制御部は、サーバーが送信する制御コマンドを受信し、受信した制御コマンドに対応するコードを送信部により電子機器に送信する。従って、ユーザーは、所定のキーワードを一度発話すればよく、所定のキーワードを復唱する必要がないため、少ない発話量で電子機器を制御することができる。また、端末装置側で逐一キーワードの音声認識をする必要がない。

第２の発明の電子機器制御システムは、第１の発明の電子機器制御システムにおいて、前記サーバーは、記憶部をさらに備え、前記第２制御部は、受信した音声コマンドに対応する制御対象の電子機器、制御対象の機能、実行内容を前記記憶部に記憶し、前記記憶部に記憶されている制御対象の電子機器、制御対象の機能、実行内容に基づいて、制御コマンドを決定することを特徴とする。

本発明では、サーバーの第２制御部は、受信した音声コマンドに対応する制御対象の電子機器（例えば、テレビ）、制御対象の機能（例えば、テレビコントロール）、実行内容（例えば、電源オン）を記憶部に記憶する。そして、第２制御部は、記憶部に記憶されている制御対象の電子機器（例えば、テレビ）、制御対象の機能（例えば、テレビコントロール）、実行内容（例えば、電源オン）に基づいて、制御コマンド（例えば、テレビの電源をオンする制御コマンド）を決定する。例えば、第２制御部は、制御対象の電子機器（例えば、テレビ）、制御対象の機能（例えば、テレビコントロール）、実行内容（例えば、電源オン）が記憶部に記憶されており、且つ、実行内容（例えば、電源オフ）に対応する音声コマンドを受信した場合、制御コマンド（例えば、テレビの電源をオフにする制御コマンド）を決定することができる。このため、ユーザーは、制御対象の電子機器（例えば、テレビ）、制御対象の機能（例えば、テレビコントロール）、実行内容（電源オン）に対応する音声を発話しており、実行内容（例えば、電源オフ）だけ異なる制御を行いたい場合は、実行内容に対応する音声のみを発話すればよい。これにより、ユーザーは、少ない発話量で電子機器を制御することができる。

第３の発明の電子機器制御システムは、第２の発明の電子機器制御システムにおいて、前記第２制御部は、受信した音声コマンドが制御対象の電子機器に対応している場合、制御対象の電子機器よりも優先順位が下位の、前記記憶部に記憶されている制御対象の機能、実行内容を消去し、受信した音声コマンドが制御対象の機能に対応している場合、制御対象の機能よりも優先順位が下位の、前記記憶部に記憶されている実行内容を消去することを特徴とする。

本発明では、サーバーの第２制御部は、受信した音声コマンドが制御対象の電子機器（例えば、テレビ）に対応している場合、記憶部に記憶されている制御対象の機能（例えば、テレビコントロール）、実行内容（例えば、電源オン）を消去する。また、第２制御部は、受信した音声コマンドが制御対象の機能（例えば、テレビコントロール）に対応している場合、記憶部に記憶されている実行内容（例えば、電源オン）を消去する。このため、ユーザーは、制御対象の電子機器、制御対象の機能に対応する音声を発話して、それらを変更することができる。

第４の発明の電子機器制御システムは、第３の発明の電子機器制御システムにおいて、前記第２制御部は、前記記憶部に制御対象の電子機器、制御対象の機能、実行内容が記憶されていない初期状態で、且つ、受信した音声コマンドが実行内容に対応している場合、前記記憶部に実行内容を記憶し、この後、受信した音声コマンドが制御対象の電子機器又は制御対象の機能に対応している場合、前記記憶部に記憶されている実行内容を消去せずに、受信した音声コマンドが対応する制御対象の電子機器又は制御対象の機能を前記記憶部に記憶することを特徴とする。

本発明では、サーバーの第２制御部は、記憶部に制御対象の電子機器、制御対象の機能、実行内容が記憶されていない初期状態で、且つ、受信した音声コマンドが実行内容（例えば、電源オン）に対応している場合、記憶部に実行内容を記憶し、この後、受信した音声コマンドが制御対象の電子機器又は制御対象の機能に対応している場合、記憶部に記憶されている実行内容を消去せずに、受信した音声コマンドが対応する制御対象の電子機器（例えば、テレビ）又は制御対象の機能（例えば、テレビコントロール）を記憶部に記憶する。そして、第２制御部は、記憶部に記憶されている制御対象の電子機器（例えば、テレビ）、制御対象の機能（例えば、テレビコントロール）、実行内容（例えば、電源オン）に基づいて、制御コマンド（例えば、テレビの電源をオンする制御コマンド）を決定する。このため、ユーザーは、初期状態では、音声の発話順を考えることなく発話して、電子機器を制御することができる。

第５の発明の電子機器制御システムは、第３の発明の電子機器制御システムにおいて、前記第２制御部は、受信した音声コマンドが制御対象の電子機器、制御対象の機能、実行内容のいずれか２つ以上に対応している場合、優先順位に関係なく、受信した音声コマンドに対応する制御対象の電子機器、制御対象の機能、実行内容を前記記憶部に記憶することを特徴とする。

本発明では、サーバーの第２制御部は、受信した音声コマンドが制御対象の電子機器、制御対象の機能、実行内容のいずれか２つ以上に対応している場合、優先順位に関係なく、受信した音声コマンドに対応する制御対象の電子機器、制御対象の機能、実行内容を記憶部に記憶する。そして、第２制御部は、記憶部に記憶されている制御対象の電子機器、制御対象の機能、実行内容に基づいて、制御コマンドを決定する。このため、ユーザーは、制御対象の電子機器、制御対象の機能、実行内容に対応する音声を連続して発話することで、電子機器を制御することができる。また、ユーザーは、制御対象の電子機器、制御対象の機能、実行内容に対応する音声を連続して発話することで、音声の発話順を考えることなく発話して、電子機器を制御することができる。また、制御対象の電子機器、制御対象の機能、実行内容に対応する音声が連続して発話されれば、制御対象の電子機器、制御対象の機能、実行内容の順に発話される必要がない。このため、例えば、日本語では、「テレビつけて」のように、制御対象の電子機器、実行内容の順に発話するのが一般的であるが、例えば、英語の「ＴｕｒｎｏｎｔｈｅＴＶ」のように、制御対象の電子機器、実行内容の順の発話にも対応することができる。

第６の発明の端末装置は、第１〜第５の発明のいずれかの電子機器制御システムにおける端末装置である。

第７の発明のサーバーは、第１〜第５の発明のいずれかの電子機器制御システムにおけるサーバーである。

本発明によれば、少ない発話量で電子機器の制御することができる。

本発明の実施形態に係る電子機器制御システムのシステム構成を示す図である。コマンド情報データベースを示す図である。電子機器制御システムの動作を示すシーケンス図である。電子機器制御システムの動作を示すシーケンス図である。クラウドサーバーが送信した音声コマンドを受信した場合のホームサーバーの処理動作を示すフローチャートである。従来の電子機器制御システムのシステム構成を示す図である。機器制御情報データベースを示す図である。従来の電子機器制御システムの動作を示すシーケンス図である。

以下、本発明の実施形態について説明する。図１は、本実施形態に係る電子機器制御システムの構成を示すブロック図である。電子機器制御システム１は、端末装置２（２ａ〜２ｃ）、ホームサーバー３、クラウドサーバー４、ルーター５を備える。例えば、端末装置２ａ、ホームサーバー３、ルーター５は、自宅１階のリビングに設置されている。端末装置２ｂは、自宅２階の書斎に設置されている。端末装置２ｃは、自宅２階の子供部屋に設置されている。クラウドサーバー４は、自宅外に設置された外部サーバーである。端末装置２は、ホームサーバー３と通信を行う。ホームサーバー３は、クラウドサーバー４と通信を行う。

端末装置２は、マイクロコンピュータ２１、マイク２２、スピーカー２３、赤外線ＬＥＤ２４等を備える。マイクロコンピュータ２１（第１制御部）は、端末装置２を構成する各部を制御する。また、マイクロコンピュータ２１は、無線ＬＡＮネットワークプロセッサーを有しており、ルーター５と無線ＬＡＮに従った通信を行う。マイク２２は、外部の音声を集音し音声データとして出力する。マイク２２が出力した音声データは、図示しないＤＳＰ（Digital Signal Processor）を介して、マイクロコンピュータ２１に入力される。なお、マイク２２は、デジタルマイクであり、集音した音声データをＡ／Ｄ変換してＤＳＰに出力する。スピーカー２３は、音声データに基づいて音声を出力する。なお、スピーカー２３には、図示しないＤ／Ａコンバータが音声データ（デジタルデータ）をＤ／Ａ変換し、図示しないパワーアンプが増幅した音声データが出力される。赤外線ＬＥＤ２４（送信部）は、テレビ６（電子機器）、照明（電子機器）７に対して、テレビ６、照明７を制御するためのリモコンコードを送信する。

ホームサーバー３（サーバー）は、ＣＰＵ（Central Processing Unit）３１、ＲＡＭ（Random Access Memory）３２、記憶部３３、ネットワークインターフェース（以下、「ＮＷＩ／Ｆ」という。）３４を備える。ＣＰＵ３１（第２制御部）は、ホームサーバー３を構成する各部を制御する。ＲＡＭ３２は、ＣＰＵ３１のワークメモリとして機能する。記憶部３３は、各種のプログラム、データを記憶する。また、記憶部３３には、機器制御情報データベース（以下、「機器制御情報ＤＢ」という。）が記憶されている。機器制御情報ＤＢは、図７に示す従来の機器制御情報ＤＢと同様であるため、説明を省略する。ＮＷＩ／Ｆ３４は、外部の機器（例えば、ルーター５）と有線ＬＡＮ、無線ＬＡＮに従った通信を行うためのものである。

ルーター５は、アクセスポイント機能を有しており、端末装置２と無線ＬＡＮに従った通信を行う。また、ルーター５は、ホームサーバー３と有線ＬＡＮに従った通信を行う。また、ルーター５は、ホームサーバー３とクラウドサーバー４とをインターネット接続する。

クラウドサーバー４（外部サーバー）は、音声区間検出（Voice Activity Detection、以下、「ＶＡＤ」という。）機能を有する。また、クラウドサーバー４は、音声認識機能を有する。クラウドサーバー４は、ＶＡＤ機能を有しているため、無音区間を検出し、適切に音声認識を行うことができる。例えば、ユーザーが「こんにちはオンキヨー」と発話した場合、無音区間を検出し、「こんにちは」「おんきよー」と文字データを認識する。一方で、ＶＡＤ機能がなければ、ユーザーが「こんにちはオンキヨー」と発話した場合、例えば、「こんに」「ちわ」「おん」「きよー」と認識されてしまう。なお、本明細書中、文中の空白部分は、無音区間を示している場合がある。

電子機器制御システム１において、端末装置２は、集音した音声データ（例えば、「テレビつけて」）をホームサーバー３に送信する。ホームサーバー３は、音声データを受信し、受信した音声データをクラウドサーバー４に送信する。クラウドサーバー４は、音声データを受信する。クラウドサーバー４は、受信した音声データを音声認識し、対応する音声コマンド（例えば、「テレビ」「つけて」）を決定する。クラウドサーバー４は、決定した音声コマンドをホームサーバー３に送信する。ホームサーバー３は、クラウドサーバー４が送信した音声コマンドを受信する。ホームサーバー３は、受信した音声コマンドに対応する制御コマンド（例えば、「テレビの電源をオンする制御コマンド」）を端末装置２に送信する。端末装置２は、ホームサーバー３が送信した制御コマンドを受信する。端末装置２は、受信した制御コマンドに対応するリモコンコード（例えば、「テレビの電源をオンするリモコンコード」）を赤外線ＬＥＤ２４により送信する。

ホームサーバー３のＣＰＵ３１が、受信した音声コマンドに対応する制御コマンド（例えば、「テレビの電源をオンする制御コマンド」）を決定するために、記憶部３３には、受信した音声コマンドに対応するＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）の情報が記憶される。図２は、受信した音声コマンドに対応するＡｃｃｅｓｓｏｒｙ、Ｓｅｒｖｉｃｅ、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓの情報を記憶するコマンド情報データベース（以下、「コマンド情報ＤＢ」という。）を示す図である。図２（ａ）に示すように、コマンド情報ＤＢには、初期状態では何も記憶されていない（「Ｎｏｎｅ」）。ＣＰＵ３１は、例えば、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンド「テレビ」を受信した場合、機器制御情報ＤＢに基づいて、音声コマンド「テレビ」に対応するＡｃｃｅｓｓｏｒｙ「テレビ」をコマンド情報ＤＢに記憶する（図２（ｂ））。この時点では、テレビに対するＳｅｒｖｉｃｅ、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓが確定していないため、ＣＰＵ３１は、動作未決定の「ＮｏＡｃｔｉｏｎ」状態となる。

続いて、ＣＰＵ３１は、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンド「つけて」を受信した場合、機器制御情報ＤＢに基づいて、音声コマンド「つけ」に対応するＣｈａｒａｃｔｅｒｉｓｔｉｃｓ「ＰｏｗｅｒＳｔａｔｅＯＮ」を記憶する（図２（ｃ））。このとき、ＣＰＵ３１は、音声コマンド「つけ」に対応するＣｈａｒａｃｔｅｒｉｓｔｉｃｓから、Ｓｅｒｖｉｃｅが「ｔｖ＿ｃｏｎｔｒｏｌ」であることが判別できるため、Ｓｅｒｖｉｃｅ「ｔｖ＿ｃｏｎｔｒｏｌ」をコマンド情報ＤＢに記憶する。ＣＰＵ３１は、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）が確定したため、制御コマンドを「テレビの電源をオンする制御コマンド」に決定することができる。また、図２（ｃ）に示す状態において、ＣＰＵ３１は、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンド「オフ」を受信した場合、機器制御情報ＤＢに基づいて、音声コマンド「オフ」に対応するＣｈａｒａｃｔｅｒｉｓｔｉｃｓ「ＰｏｗｅｒＳｔａｔｅＯＦＦ」を記憶する（図２（ｄ））。コマンド情報ＤＢには、既に、Ａｃｃｅｓｓｏｒｙ「テレビ」、Ｓｅｒｖｉｃｅ「ｔｖ＿ｃｏｎｔｒｏｌ」が記憶されているため、Ａｃｃｅｓｓｏｒｙ、Ｓｅｒｖｉｃｅ、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓが確定し、ＣＰＵ３１は、受信した音声コマンドに対応する制御コマンドを「テレビの電源をオフする制御コマンド」に決定することができる。

このように、ＣＰＵ３１は、受信した音声コマンドに対応するＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）を記憶部３３のコマンド情報ＤＢに記憶する。そして、ＣＰＵ３１は、記憶部３３のコマンド情報ＤＢに記憶されているＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）に基づいて、制御コマンドを決定する。ここで、記憶部３３のコマンド情報ＤＢに記憶されているＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）は、受信した音声コマンドに対応するものであるため、ＣＰＵ３１は、受信した音声コマンドに基づいて、制御コマンドを決定していることになる。

コマンド情報ＤＢには、優先順位がある。その優先順位は、Ａｃｃｅｓｓｏｒｙ＞Ｓｅｒｖｉｃｅ＞Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓである。図２（ｃ）に示す状態において、ＣＰＵ３１は、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンド「おんりょう」を受信した場合、機器制御情報ＤＢに基づいて、音声コマンド「おんりょう」に対応するＳｅｒｖｉｃｅ「ｔｖ＿ｃｏｎｔｒｏｌ」を記憶する（図２（ｅ））。ここで、ＣＰＵ３１は、Ｓｅｒｖｉｃｅよりも優先順位が下位のＣｈａｒａｃｔｅｒｉｓｔｉｃｓを消去（「Ｎｏｎｅ」に変更）する。また、図２（ｃ）に示す状態において、ＣＰＵ３１は、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンド「でんき」を受信した場合、機器制御情報ＤＢに基づいて、音声コマンド「でんき」に対応するＡｃｃｅｓｓｏｒｙ「照明」を記憶する（図２（ｆ））。ここで、ＣＰＵ３１は、Ａｃｃｅｓｓｏｒｙよりも優先順位が下位のＳｅｒｖｉｃｅ、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓを消去（「Ｎｏｎｅ」に変更）する。

このように、ＣＰＵ３１は、受信した音声コマンドがＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）に対応している場合、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器）よりも優先順位が下位の、記憶部３３のコマンド情報ＤＢに記憶されているＳｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）を消去する。また、ＣＰＵ３１は、受信した音声コマンドがＳｅｒｖｉｃｅ（制御対象の機能）に対応している場合、Ｓｅｒｖｉｃｅ（制御対象の機能）よりも優先順位が下位の、記憶部３３のコマンド情報ＤＢに記憶されているＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）を消去する。

図２（ａ）に示す初期状態において、ＣＰＵ３１は、例えば、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンド「つけて」を受信した場合、機器制御情報ＤＢに基づいて、音声コマンド「つけ」に対応するＣｈａｒａｃｔｅｒｉｓｔｉｃｓ「ＰｏｗｅｒＳｔａｔｅＯＮ」をコマンド情報ＤＢに記憶する（図２（ｇ））。この時点では、Ａｃｃｅｓｓｏｒｙ、Ｓｅｒｖｉｃｅが確定していないため、ＣＰＵ３１は、動作未決定の「ＮｏＡｃｔｉｏｎ」状態となる。続いて、ＣＰＵ３１は、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンド「でんき」を受信した場合、機器制御情報ＤＢに基づいて、音声コマンド「でんき」に対応するＡｃｃｅｓｏｒｒｙ「照明」をコマンド情報ＤＢに記憶する（図２（ｈ））。初期状態において、優先順位が下位の情報が確定した後、それよりも優先順位が上位の情報が確定した場合は、優先順位が下位の情報を消去しない（「Ｎｏｎｅ」に変更しない）。これにより、初期状態で、ＣＰＵ３１は、例えば、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンド「つけて」、「でんき」を受信した場合、「照明の電源をオンする制御コマンド」を決定することができる（図２（ｈ）参照）。

このように、ＣＰＵ３１は、記憶部３３のコマンド情報ＤＢにＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）が記憶されていない初期状態で、且つ、受信した音声コマンドがＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）に対応している場合、記憶部３３のコマンド情報ＤＢにＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）を記憶する。そして、ＣＰＵ３１は、この後、受信した音声コマンドがＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）又はＳｅｒｖｉｃｅ（制御対象の機能）に対応している場合、記憶部３３のコマンド情報ＤＢに記憶されているＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）を消去せずに、受信した音声コマンドが対応するＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）又はＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（制御対象の機能）を記憶部３３のコマンド情報ＤＢに記憶する。

上述のように、クラウドサーバー４は、ＶＡＤ機能を有している。例えば、ユーザーが「テレビつけて」のように、「テレビ」と「つけて」の間に無音を挟んで発話した場合、クラウドサーバー４は、「テレビ」「つけて」の音声コマンドをホームサーバー３に送信する。例えば、ユーザーが「テレビつけて」のように、連続して発話した場合、クラウドサーバー４は、「テレビつけて」の音声コマンドをホームサーバー３に送信する。この場合、ＣＰＵ３１は、優先順位に関係なく、音声コマンド「テレビ」に対応するＡｃｃｅｓｓｏｒｙ「テレビ」、音声コマンド「つけ」に対応するＣｈａｒａｃｔｅｒｉｓｔｉｃｓ「ＰｏｗｅｒＳｔａｔｅＯＮ」をコマンド情報ＤＢに記憶する。同様に、例えば、ユーザーが「つけてテレビ」のように、連続して発話した場合、クラウドサーバー４は、「つけてテレビ」の音声コマンドをホームサーバー３に送信する。この場合、ＣＰＵ３１は、優先順位に関係なく、音声コマンド「つけ」に対応するＣｈａｒａｃｔｅｒｉｓｔｉｃｓ「ＰｏｗｅｒＳｔａｔｅＯＮ」、音声コマンド「テレビ」に対応するＡｃｃｅｓｓｏｒｙ「テレビ」をコマンド情報ＤＢに記憶する。

このように、ＣＰＵ３１は、受信した音声コマンドがＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）のいずれか２つ以上に対応している場合、優先順位に関係なく、受信した音声コマンドに対応するＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）を記憶部３３のコマンド情報ＤＢに記憶する。

図３及び図４は、電子機器制御システムの動作を示すシーケンス図である。以下、図３及び図４に基づいて、テレビ６を制御する一連の動作を説明する。まず、ユーザーは、端末装置２がホームサーバー３に音声データを送信するデータ送信モードとするために、所定のキーワードを発話する。例えば、ユーザーは、「こんにちはオンキヨー」と発話する（図３の（１））。端末装置２のマイク２２は、ユーザーが発話した音声を集音し音声データとしてマイクロコンピュータ２１に出力する。マイクロコンピュータ２１は、音声認識機能を有しており、音声データに含まれる文字データを認識し、認識した文字データが所定のキーワードと一致しているか否かを判断する。マイクロコンピュータ２１は、認識した文字データが所定のキーワードと一致していると判断した場合、データ送信モードに遷移する（図３の（２））。

次に、例えば、ユーザーは、テレビの電源をオンにしたい場合、「テレビつけて」と発話する（図３の（３）、（４））。端末装置２のマイク２２は、ユーザーが発話した音声を集音し音声データとしてマイクロコンピュータ２１に出力する。マイクロコンピュータ２１は、音声データ（「テレビつけて」）をホームサーバー３に送信する（図３の（５）、（６））。ホームサーバー３のＣＰＵ３１は、ＮＷＩ／Ｆ３４により端末装置２が送信した音声データを受信する。次に、ＣＰＵ３１は、ＮＷＩ／Ｆ３４によりクラウドサーバー４に音声データを送信し、音声認識の問い合わせを行う（図３の（７）、（８））。

クラウドサーバー４は、ホームサーバー３が送信した音声データを受信する。クラウドサーバー４は、音声認識機能を有しており、音声データに含まれる文字データを認識する。上述したように、クラウドサーバー４は、ＶＡＤ機能を有しているため、無音区間を検出し、適切に音声認識を行うことができる。次に、クラウドサーバー４は、認識した文字データに対応する音声コマンド（「テレビ」「つけて」）をホームサーバー３に送信し、音声認識の結果を応答する（図３の（９）、（１０））。ホームサーバー３のＣＰＵ３１は、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンドを受信する。ＣＰＵ３１は、音声認識結果の解析を行う（図３の（１１）、（１２））。具体的には、ＣＰＵ３１は、機器制御情報ＤＢと音声コマンドとに基づいて、音声コマンドに対応する制御コマンドを決定する。

ここで、ＣＰＵ３１は、音声コマンド「テレビ」を受信したときに、機器制御情報ＤＢに基づいて、音声コマンド「テレビ」に対応するＡｃｃｅｓｓｏｒｙ「テレビ」をコマンド情報ＤＢに記憶する（図２（ｂ）参照。）。また、ＣＰＵ３１は、音声コマンド「つけて」を受信したときに、機器制御情報ＤＢに基づいて、音声コマンド「つけ」に対応するＣｈａｒａｃｔｅｒｉｓｔｉｃｓ「ＰｏｗｅｒＳｔａｔｅＯＮ」を記憶する（図２（ｃ）参照。）。このとき、ＣＰＵ３１は、音声コマンド「つけ」に対応するＣｈａｒａｃｔｅｒｉｓｔｉｃｓから、Ｓｅｒｖｉｃｅが「ｔｖ＿ｃｏｎｔｒｏｌ」であることが判別できるため、Ｓｅｒｖｉｃｅ「ｔｖ＿ｃｏｎｔｒｏｌ」の情報をコマンド情報ＤＢに記憶する。ＣＰＵ３１は、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）が確定したため、受信した音声コマンドに対応する制御コマンドを「テレビの電源をオンする制御コマンド」に決定することができる。ＣＰＵ３１は、ＮＷＩ／Ｆ３４により決定した制御コマンド（テレビの電源をオンする制御コマンド）を端末装置２に送信する（図３の（１３））。

端末装置２のマイクロコンピュータ２１は、ホームサーバー３が送信した制御コマンドを受信する。次に、マイクロコンピュータ２１は、受信した制御コマンドに対応するリモコンコード（テレビの電源をオンするリモコンコード）を、赤外線ＬＥＤ２４により送信する（図３の（１４））。テレビ６は、端末装置２が送信したテレビの電源をオンするリモコンコードにより電源がオンする（図３の（１５））。

次に、例えば、ユーザーは、テレビの電源をオフにしたい場合、「オフ」と発話する（図４の（１６））。端末装置２のマイク２２は、ユーザーが発話した音声を集音し音声データとしてマイクロコンピュータ２１に出力する。マイクロコンピュータ２１は、音声データ（「オフ」）をホームサーバー３に送信する（図４の（１７））。ホームサーバー３のＣＰＵ３１は、ＮＷＩ／Ｆ３４により端末装置２が送信した音声データを受信する。次に、ＣＰＵ３１は、ＮＷＩ／Ｆ３４によりクラウドサーバー４に音声データを送信し、音声認識の問い合わせを行う（図４の（１８））。

クラウドサーバー４は、ホームサーバー３が送信した音声データを受信する。クラウドサーバー４は、音声データに含まれる文字データを認識し、認識した文字データに対応する音声コマンド（「オフ」）をホームサーバー３に送信し、音声認識の結果を応答する（図４の（１９））。ホームサーバー３のＣＰＵ３１は、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンドを受信する。ＣＰＵ３１は、音声認識結果の解析を行う（図４の（２０））。

ＣＰＵ３１は、音声コマンド「オフ」を受信したときに、機器制御情報ＤＢに基づいて、音声コマンド「オフ」に対応するＣｈａｒａｃｔｅｒｉｓｔｉｃｓ「ＰｏｗｅｒＳｔａｔｅＯＦＦ」を記憶する（図２（ｄ）参照）。コマンド情報ＤＢには、既に、Ａｃｃｅｓｓｏｒｙ「テレビ」、Ｓｅｒｖｉｃｅ「ｔｖ＿ｃｏｎｔｒｏｌ」が記憶されているため、Ａｃｃｅｓｓｏｒｙ、Ｓｅｒｖｉｃｅ、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓが確定し、ＣＰＵ３１は、受信した音声コマンドに対応する制御コマンドを「テレビの電源をオフする制御コマンド」に決定することができる。ＣＰＵ３１は、ＮＷＩ／Ｆ３４により決定した制御コマンド（テレビの電源をオフする制御コマンド）を端末装置２に送信する（図４の（２１））。

端末装置２のマイクロコンピュータ２１は、ホームサーバー３が送信した制御コマンドを受信する。次に、マイクロコンピュータ２１は、受信した制御コマンドに対応するリモコンコード（テレビの電源をオフするリモコンコード）を、赤外線ＬＥＤ２４により送信する（図４の（２２））。テレビ６は、端末装置２が送信したテレビの電源をオフするリモコンコードにより電源がオフする（図４の（２３））。

端末装置２のマイクロコンピュータ２１は、データ送信モードに遷移してから所定時間経過後、データ送信モードを終了する。また、クラウドサーバー４が所定時間、無音を検出した場合に、マイクロコンピュータ２１は、データ送信モードを終了するようにしてもよい。

次に、クラウドサーバー４が送信した音声コマンドを受信した場合のホームサーバー３の処理動作を、図５に示すフローチャートに基づいて説明する。ホームサーバー３のＣＰＵ３１は、ＮＷＩ／Ｆ３４によりクラウドサーバー４が送信した音声コマンドを受信すると（Ｓ１）、機器制御情報ＤＢに基づいて、受信した音声コマンドが機器制御情報と一致するか否かを判断する（Ｓ２）。ＣＰＵ３１は、受信した音声コマンドが機器制御情報と一致しないと判断した場合（Ｓ２：Ｎｏ）、処理を終了する。

ＣＰＵ３１は、受信した音声コマンドが機器制御情報と一致すると判断した場合（Ｓ２：Ｙｅｓ）、受信した音声コマンドがＡｃｃｅｓｓｏｒｙに対応しているか否かを判断する（Ｓ３）。ＣＰＵ３１は、受信した音声コマンドがＡｃｃｅｓｓｏｒｙに対応していると判断した場合（Ｓ３：Ｙｅｓ）、コマンド情報ＤＢに基づいて、初期状態（図２（ａ）参照）であるか否かを判断する（Ｓ４）。ＣＰＵ３１は、初期状態でないと判断した場合（Ｓ４：Ｎｏ）、コマンド情報ＤＢにおいて、Ａｃｃｅｓｓｏｒｙよりも優先順位が下位のＳｅｒｖｉｃｅ、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓを消去（「Ｎｏｎｅ」に変更）する（Ｓ５）。

ＣＰＵ３１は、受信した音声コマンドがＡｃｃｅｓｓｏｒｙに対応していないと判断した場合（Ｓ３：Ｎｏ）、受信した音声コマンドがＳｅｒｖｉｃｅに対応しているか否かを判断する（Ｓ６）。ＣＰＵ３１は、受信した音声コマンドがＳｅｒｖｉｃｅに対応していると判断した場合（Ｓ６：Ｎｏ）、コマンド情報ＤＢに基づいて、初期状態（図２（ａ）参照）であるか否かを判断する（Ｓ７）。ＣＰＵ３１は、初期状態でないと判断した場合（Ｓ７：Ｎｏ）、コマンドＤＢ情報において、Ｓｅｒｖｉｃｅよりも優先順位が下位のＣｈａｒａｃｔｅｒｉｓｔｉｃｓを消去（「Ｎｏｎｅ」に変更）する（Ｓ８）。

ＣＰＵ３１は、初期状態であると判断した場合（Ｓ４、Ｓ７：Ｙｅｓ）、受信した音声コマンドがＳｅｒｖｉｃｅに対応していないと判断した場合（Ｓ６：Ｎｏ）、Ｓ５、Ｓ８の処理の後、情報コマンドＤＢに基づいて、Ａｃｃｅｓｓｏｒｙ、Ｓｅｒｖｉｃｅ、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓが確定しており、制御コマンドを決定できるか否かを判断する（Ｓ９）。ＣＰＵ３１は、Ａｃｃｅｓｓｏｒｙ、Ｓｅｒｖｉｃｅ、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓが確定しておらず、制御コマンドを決定できないと判断した場合（Ｓ９：Ｎｏ）、処理を終了する。

ＣＰＵ３１は、Ａｃｃｅｓｓｏｒｙ、Ｓｅｒｖｉｃｅ、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓが確定しており、制御コマンドを決定できると判断した場合（Ｓ９：Ｙｅｓ）、コマンド情報ＤＢに基づいて制御コマンドを決定し、ＮＷＩ／Ｆ３４により決定した制御コマンドを端末装置２に送信する（Ｓ１０）。

以上説明したように、本実施形態では、端末装置２のマイクロコンピュータ２１は、マイク２２が出力する音声データに含まれる文字データと所定のキーワードとが一致した場合に、所定のキーワードよりも後にマイク２２が出力する音声データをホームサーバー３に送信する。ホームサーバー３のＣＰＵ３１は、端末装置２が送信した音声データをクラウドサーバー４に送信し、送信した音声データに対応する音声コマンドをクラウドサーバー４から受信する。また、ＣＰＵ３１は、受信した音声コマンドに基づいて制御コマンドを決定し、決定した制御コマンドを端末装置２に送信する。そして、端末装置２のマイクロコンピュータ２１は、ホームサーバー３が送信する制御コマンドを受信し、受信した制御コマンドに対応するリモコンコードを赤外線ＬＥＤ２４によりテレビ６又は照明７に送信する。従って、ユーザーは、所定のキーワードを一度発話すればよく、所定のキーワードを復唱する必要がないため、少ない発話量で電子機器を制御することができる。また、端末装置２側で逐一キーワードの音声認識をする必要がない。

また、本実施形態では、ホームサーバー３のＣＰＵ３１は、受信した音声コマンドに対応するＡｃｃｅｓｓｏｒｙ（制御対象の電子機器（例えば、テレビ））、Ｓｅｒｖｉｃｅ（制御対象の機能（例えば、ｔｖ＿ｃｏｎｔｒｏｌ））、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容（例えば、ＰｏｗｅｒＳｔａｔｅＯＮ））を記憶部３３のコマンド情報ＤＢに記憶する。そして、ＣＰＵ３１は、記憶部３３のコマンド情報ＤＢに記憶されているＡｃｃｅｓｓｏｒｙ（制御対象の電子機器（例えば、テレビ））、Ｓｅｒｖｉｃｅ（制御対象の機能（例えば、ｔｖ＿ｃｏｎｔｒｏｌ））、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容（例えば、ＰｏｗｅｒＳｔａｔｅＯＮ））に基づいて、制御コマンド（例えば、テレビの電源をオンする制御コマンド）を決定する。例えば、ＣＰＵ３１は、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器（例えば、テレビ））、Ｓｅｒｖｉｃｅ（制御対象の機能（例えば、ｔｖ＿ｃｏｎｔｒｏｌ））、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容（例えば、ＰｏｗｅｒＳｔａｔｅＯＮ））が記憶部３３のコマンド情報ＤＢに記憶されており、且つ、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容（例えば、ＰｏｗｅｒＳｔａｔｅＯＦＦ）に対応する音声コマンドを受信した場合、制御コマンド（例えば、テレビの電源をオフにする制御コマンド）を決定することができる。このため、ユーザーは、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器（例えば、テレビ））、Ｓｅｒｖｉｃｅ（制御対象の機能（例えば、ｔｖ＿ｃｏｎｔｒｏｌ））、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容（例えば、ＰｏｗｅｒＳｔａｔｅＯＮ））に対応する音声を発話しており、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容（例えば、ＰｏｗｅｒＳｔａｔｅＯＦＦ）だけ異なる制御を行いたい場合は、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）に対応する音声のみを発話すればよい。これにより、ユーザーは、少ない発話量で電子機器を制御することができる。

また、本実施形態では、ホームサーバー３のＣＰＵ３１は、受信した音声コマンドがＡｃｃｅｓｓｏｒｙ（制御対象の電子機器（例えば、テレビ））に対応している場合、記憶部３３のコマンド情報ＤＢに記憶されているＳｅｒｖｉｃｅ（制御対象の機能（例えば、ｔｖ＿ｃｏｎｔｒｏｌ）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容（例えば、ＰｏｗｅｒＳｔａｔｅＯＮ）を消去する。また、ＣＰＵ３１は、受信した音声コマンドがＳｅｒｖｉｃｅ（制御対象の機能（例えば、ｔｖ＿ｃｏｎｔｒｏｌ））に対応している場合、記憶部３３のコマンド情報ＤＢに記憶されているＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容（例えば、ＰｏｗｅｒＳｔａｔｅＯＮ）を消去する。このため、ユーザーは、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）に対応する音声を発話して、それらを変更することができる。

また、本実施形態では、ホームサーバー３のＣＰＵ３１は、記憶部３３のコマンド情報ＤＢにＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）が記憶されていない初期状態で、且つ、受信した音声コマンドがＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容（例えば、ＰｏｗｅｒＳｔａｔｅＯｎ）に対応している場合、記憶部３３のコマンド情報ＤＢにＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）を記憶し、この後、受信した音声コマンドがＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）又はＳｅｒｖｉｃｅ（制御対象の機能）に対応している場合、記憶部３３のコマンド情報ＤＢに記憶されているＣｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）を消去せずに、受信した音声コマンドが対応するＡｃｃｅｓｓｏｒｙ（制御対象の電子機器（例えば、テレビ））又はＳｅｒｖｉｃｅ（制御対象の機能（例えば、ｔｖ＿ｃｏｎｔｒｏｌ））を記憶部３３のコマンド情報ＤＢに記憶する。そして、ＣＰＵ３１は、記憶部３３のコマンド情報ＤＢに記憶されているＡｃｃｅｓｓｏｒｙ（制御対象の電子機器（例えば、テレビ））、Ｓｅｒｖｉｃｅ（制御対象の機能（例えば、ｔｖ＿ｃｏｎｔｒｏｌ））、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容（例えば、ＰｏｗｅｒＳｔａｔｅＯＮ））に基づいて、制御コマンド（例えば、テレビの電源をオンする制御コマンド）を決定する。このため、ユーザーは、初期状態では、音声の発話順を考えることなく発話して、電子機器を制御することができる。

また、本実施形態では、ホームサーバー３のＣＰＵ３１は、受信した音声コマンドがＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）のいずれか２つ以上に対応している場合、優先順位に関係なく、受信した音声コマンドに対応するＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）を記憶部３３のコマンド情報ＤＢに記憶する。そして、ＣＰＵ３１は、記憶部３３のコマンド情報ＤＢに記憶されているＡｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）に基づいて、制御コマンドを決定する。このため、ユーザーは、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）に対応する音声を連続して発話することで、電子機器を制御することができる。また、ユーザーは、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）に対応する音声を連続して発話することで、音声の発話順を考えることなく発話して、電子機器を制御することができる。また、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）に対応する音声が連続して発話されれば、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｓｅｒｖｉｃｅ（制御対象の機能）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）の順に発話される必要がない。このため、例えば、日本語では、「テレビつけて」のように、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器）、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）の順に発話するのが一般的であるが、例えば、英語の「ＴｕｒｎｏｎｔｈｅＴＶ」のように、Ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ（実行内容）、Ａｃｃｅｓｓｏｒｙ（制御対象の電子機器）の順の発話にも対応することができる。

以上、本発明の実施形態について説明したが、本発明を適用可能な形態は、上述の実施形態には限られるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更を加えることが可能である。

本発明は、テレビ、照明等の電子機器を制御するための電子機器制御システム、電子機器制御システムを構成する端末装置、及び、サーバーに好適に採用され得る。

１電子機器制御システム
２端末装置
２１マイクロコンピュータ（第１制御部）
２２マイク
２４赤外線ＬＥＤ（送信部）
３ホームサーバー（サーバー）
３１ＣＰＵ（第２制御部）
３３記憶部
４クラウドサーバー（外部サーバー）
６テレビ（電子機器）
７照明（電子機器）

Claims

音声区間検出機能及び音声認識機能を有し、音声データに対応する音声コマンドを送信する外部サーバーと通信を行うサーバーと、前記サーバーと通信を行う端末装置と、を備える電子機器制御システムであって、
前記端末装置は、
外部の音声を集音し音声データとして出力するマイクと、
電子機器を制御するためのコードを送信する送信部と、
前記マイクが出力する音声データに含まれる文字データと所定のキーワードとが一致した場合に、所定のキーワードよりも後に前記マイクが出力する音声データを前記サーバーに送信し、
前記サーバーが送信する制御コマンドを受信し、
受信した制御コマンドに対応するコードを前記送信部により前記電子機器に送信する第１制御部と、を備え、
前記サーバーは、
前記端末装置が送信する音声データを受信し、
受信した音声データを前記外部サーバーに送信し、
送信した音声データに対応する音声コマンドを前記外部サーバーから受信し、
受信した音声コマンドに基づいて制御コマンドを決定し、
決定した制御コマンドを前記端末装置に送信する第２制御部
を備えることを特徴とする電子機器制御システム。
前記サーバーは、記憶部をさらに備え、
前記第２制御部は、
受信した音声コマンドに対応する制御対象の電子機器、制御対象の機能、実行内容を前記記憶部に記憶し、
前記記憶部に記憶されている制御対象の電子機器、制御対象の機能、実行内容に基づいて、制御コマンドを決定することを特徴とする請求項１に記載の電子機器制御システム。
前記第２制御部は、
受信した音声コマンドが制御対象の電子機器に対応している場合、制御対象の電子機器よりも優先順位が下位の、前記記憶部に記憶されている制御対象の機能、実行内容を消去し、
受信した音声コマンドが制御対象の機能に対応している場合、制御対象の機能よりも優先順位が下位の、前記記憶部に記憶されている実行内容を消去することを特徴とする請求項２に記載の電子機器制御システム。
前記第２制御部は、
前記記憶部に制御対象の電子機器、制御対象の機能、実行内容が記憶されていない初期状態で、且つ、受信した音声コマンドが実行内容に対応している場合、前記記憶部に実行内容を記憶し、この後、受信した音声コマンドが制御対象の電子機器又は制御対象の機能に対応している場合、前記記憶部に記憶されている実行内容を消去せずに、受信した音声コマンドが対応する制御対象の電子機器又は制御対象の機能を前記記憶部に記憶することを特徴とする請求項３に記載の電子機器制御システム。
前記第２制御部は、
受信した音声コマンドが制御対象の電子機器、制御対象の機能、実行内容のいずれか２つ以上に対応している場合、優先順位に関係なく、受信した音声コマンドに対応する制御対象の電子機器、制御対象の機能、実行内容を前記記憶部に記憶することを特徴とする請求項３に記載の電子機器制御システム。
請求項１〜５のいずれか１項に記載のサーバー。