WO2015029362A1

WO2015029362A1 - 機器制御方法及び機器制御システム

Info

Publication number: WO2015029362A1
Application number: PCT/JP2014/004200
Authority: WO
Inventors: 美沙貴辻川
Original assignee: パナソニックインテレクチュアルプロパティコーポレーションオブアメリカ
Priority date: 2013-08-29
Filing date: 2014-08-18
Publication date: 2015-03-05
Also published as: US9418665B2; JPWO2015029362A1; JP6466844B2; US20150287414A1

Abstract

機器制御システムは、第１の時間に複数の機器の周囲の環境音を取得する環境音取得部と、ネットワークを介して複数の機器の第１の時間における運転状況を取得する運転状況取得部と、運転状況取得部によって取得した第１の時間における運転状況と、環境音取得部によって第１の時間に取得した環境音とを関連付けてデータベースに記憶するデータベース管理部とを備える。

Description

機器制御方法及び機器制御システム

　本開示は、ユーザからの音声コマンドに基づいて複数の機器を制御する機器制御方法及び機器制御システムに関するものである。

　近年の音声認識技術の発展により、音声認識による様々な機器の制御が実現している。

　更に、家庭内に配置したマイクで音声入力を受け付け、ネットワークで接続された複数の機器を制御する機器制御方法も提案されている（例えば、特許文献１参照）。

特開２００２－１８２６７９号公報

　上記、従来の音声認識による機器制御方法では更なる改善が必要とされていた。

　本開示の一局面に係る機器制御方法は、ユーザからの音声コマンドに基づいて複数の機器を制御する機器制御方法であって、第１の時間に複数の機器の周囲の環境音を取得する環境音取得ステップと、ネットワークを介して複数の機器の第１の時間における運転状況を取得する第１の運転状況取得ステップと、第１の運転状況取得ステップにおいて取得した第１の時間における運転状況と、環境音取得ステップにおいて第１の時間に取得した環境音とを関連付けてデータベースに記憶するデータベース管理ステップと、を含む。

　なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラム、または、記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

　本開示によれば、音声認識による機器制御の更なる改善を実現できる。

本開示の実施の形態における機器制御システムの全体構成を示す図である。本開示の実施の形態１における機器制御システムの構成を示すブロック図である。本開示の実施の形態１における機器制御システムのデータベース構築処理を示すフローチャートである。環境音情報データベースのデータ構造の一例を示す図である。本開示の実施の形態１の第１の変形例における機器制御システムのデータベース構築処理を示すフローチャートである。本開示の実施の形態１の第２の変形例における機器制御システムのデータベース構築処理を示すフローチャートである。本開示の実施の形態１における機器制御システムのノイズ除去処理を示すフローチャートである。本開示の実施の形態２における機器制御システムの構成を示すブロック図である。本開示の実施の形態２における機器制御システムの機器制御処理を示すフローチャートである。音声認識を可能にするために機器が制御される際に表示装置に表示される表示画面の一例を示す図である。本開示の実施の形態３における機器制御システムの構成を示すブロック図である。本開示の実施の形態３における機器制御システムの情報提示処理を示すフローチャートである。音声認識が不可能であることをユーザに提示する際に表示装置に表示される表示画面の一例を示す図である。

　（本開示の基礎となった知見）
　音声認識により機器を制御する際に、家庭内の他の機器により発せられる環境音（ノイズ）によって命令が正しく認識されないおそれがある。そのため、音声入力時にノイズを除去する必要がある。特許文献１では、環境音をマイクで取得して、雑音解析を行うことによってノイズを除去している。特許文献１の図４のステップＳ５～Ｓ６の処理では、定常的な雑音が大きく変化したか否かを検出し、定常的な雑音が大きく変化していなければ雑音解析処理は行われない。しかしながら、定常的な雑音の大きな変化は頻繁に発生するため、結果として常に雑音解析処理を行わなければならないことになる。例えば、特許文献１の段落００５６等に記載されているように、エアコンの送風が弱から強へ変更された際には、その都度雑音解析処理を行わなければならない。その結果、処理が遅くなり、音声コマンドを受け付ける状態になるまでに時間がかかるという問題が発生する可能性がある。

　上記考察により、本発明者らは本開示の各態様を想到するに至った。

　この構成によれば、第１の時間に複数の機器の周囲の環境音が取得され、ネットワークを介して複数の機器の第１の時間における運転状況が取得され、取得した第１の時間における運転状況と、第１の時間に取得した環境音とが関連付けられてデータベースに記憶される。

　したがって、音声コマンドが入力された際の複数の機器の運転状況に対応する環境音をデータベースから取得し、取得した環境音に基づいて音声コマンドに含まれるノイズを除去することにより、過剰な雑音解析処理を行うことなく、より確実に音声認識を行うことができる。

　また、上記の機器制御方法において、第１の時間とは異なる第２の時間にユーザからの音声コマンドを取得する音声コマンド取得ステップと、ネットワークを介して複数の機器の第２の時間における運転状況を取得する第２の運転状況取得ステップと、第２の運転状況取得ステップにおいて取得した複数の機器の第２の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音に基づいて、音声コマンドからノイズを除去するノイズ除去ステップと、をさらに含むことが好ましい。

　この構成によれば、第１の時間とは異なる第２の時間にユーザからの音声コマンドが取得され、ネットワークを介して複数の機器の第２の時間における運転状況が取得され、取得した複数の機器の第２の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音に基づいて、音声コマンドからノイズが除去される。

　したがって、音声コマンドに含まれるノイズ（環境音）を確実に除去することができ、より確実に音声認識を行うことができる。

　また、上記の機器制御方法において、第１の時間とは異なる第２の時間にユーザからの音声コマンドを取得する音声コマンド取得ステップと、ネットワークを介して複数の機器の第２の時間における運転状況を取得する第２の運転状況取得ステップと、第２の運転状況取得ステップにおいて取得した複数の機器の第２の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音から予測される音環境で、音声認識が可能であるか否かを判断する判断ステップと、判断ステップにおいて判断された結果をユーザに提示する提示ステップと、をさらに含むことが好ましい。

　この構成によれば、第１の時間とは異なる第２の時間にユーザからの音声コマンドが取得され、ネットワークを介して複数の機器の第２の時間における運転状況が取得され、取得した複数の機器の第２の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音から予測される音環境で、音声認識が可能であるか否かが判断され、判断された結果がユーザに提示される。

　したがって、環境音の影響により音声認識が困難である場合に、ユーザに対して機器の運転状況の変更を促すことができ、音声認識の妨げとなる環境音を低減させることができる。

　また、上記の機器制御方法において、第１の時間とは異なる第２の時間にユーザからの音声コマンドを取得する音声コマンド取得ステップと、ネットワークを介して複数の機器の第２の時間における運転状況を取得する第２の運転状況取得ステップと、第２の運転状況取得ステップにおいて取得した複数の機器の第２の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音から予測される音環境で、音声認識が可能であるか否かを判断する判断ステップと、判断ステップにおいて音声認識が不可能であると判断された場合に、複数の機器のうち、環境音を発している機器を制御する機器制御ステップと、をさらに含むことが好ましい。

　この構成によれば、第１の時間とは異なる第２の時間にユーザからの音声コマンドが取得され、ネットワークを介して複数の機器の第２の時間における運転状況が取得され、取得した複数の機器の第２の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音から予測される音環境で、音声認識が可能であるか否かが判断され、音声認識が不可能であると判断された場合に、複数の機器のうち、環境音を発している機器が制御される。

　したがって、音声認識が不可能であると判断された場合に、複数の機器のうち、環境音を発している機器が制御されるので、音声認識の妨げとなる環境音を低減することができ、より確実に音声認識を行うことができる。

　また、上記の機器制御方法において、データベースは、過去に音声認識が成功したか否かを、運転状況に関連付けてさらに記憶しており、機器制御ステップは、判断ステップにおいて音声認識が不可能であると判断された場合に、データベースに記憶されている過去に音声認識に成功した運転状況で運転するように、複数の機器を制御することが好ましい。

　この構成によれば、音声認識が不可能であると判断された場合に、データベースに記憶されている過去に音声認識に成功した運転状況で運転するように、複数の機器が制御されるので、機器の制御が容易となり、より確実に音声認識を行うことができる。

　また、上記の機器制御方法において、判断ステップは、第２の運転状況取得ステップにおいて取得した複数の機器の第２の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音の音量が、音声認識が可能な所定の音量以下であるか否かを判断することにより、音声認識が可能であるか否かを判断することが好ましい。

　この構成によれば、運転状況に関連付けてデータベースに記憶されている環境音の音量が、音声認識が可能な所定の音量以下であるか否かを判断することにより、音声認識が可能であるか否かを容易に判断することができる。

　また、上記の機器制御方法において、音声コマンドの入力が一定時間以上無いことを検知する音声検知ステップをさらに含み、環境音取得ステップは、音声検知ステップにおいて音声コマンドの入力が一定時間以上無いことが検知された場合、複数の機器の周囲の環境音を取得することが好ましい。

　この構成によれば、ユーザによって発話された音声コマンド以外の不要な音が環境音として取得されるので、音声コマンドに含まれる環境音を確実に除去することができる。

　また、上記の機器制御方法において、複数の機器の周囲に存在する人を検知する人検知ステップをさらに含み、環境音取得ステップは、人検知ステップにおいて人が検知されない場合、複数の機器の周囲の環境音を取得することが好ましい。

　また、上記の機器制御方法において、環境音取得ステップは、第１の運転状況取得ステップにおいて取得した複数の機器の第１の時間における運転状況と一致する運転状況がデータベースに記憶されていない場合、複数の機器の周囲の環境音を取得することが好ましい。

　この構成によれば、取得した複数の機器の第１の時間における運転状況と一致する運転状況がデータベースに記憶されていない場合、複数の機器の周囲の環境音が取得されるので、新たな運転状況と環境音とを関連付けたデータベースを構築することができる。

　本開示の他の局面に係る機器制御システムは、ユーザからの音声コマンドに基づいて複数の機器を制御する機器制御システムであって、第１の時間に複数の機器の周囲の環境音を取得する環境音取得部と、ネットワークを介して複数の機器の第１の時間における運転状況を取得する運転状況取得部と、運転状況取得部によって取得した第１の時間における運転状況と、環境音取得部によって第１の時間に取得した環境音とを関連付けてデータベースに記憶するデータベース管理部と、を備える。

　この構成によれば、第１の時間に複数の機器の周囲の環境音が取得され、ネットワークを介して複数の機器の運転状況が取得され、取得した第１の時間における運転状況と、第１の時間に取得した環境音とが関連付けられてデータベースに記憶される。

　以下添付図面を参照しながら、本開示の実施の形態について説明する。なお、以下の実施の形態は、本開示を具体化した一例であって、本開示の技術的範囲を限定するものではない。

　（実施の形態１）
　（各装置の構成）
　図１は、本開示の実施の形態における機器制御システムの全体構成を示す図である。なお、図１に示す機器制御システムの構成は一例であり、図１に示されている構成以外の構成を備えていてもよい。また、図１に示す機器制御システムの構成の一部が欠けていてもよい。

　機器制御システムは、サーバ装置１００と、機器制御装置１１０と、機器１２０とを備える。機器１２０は、家庭内に配置されたテレビ又はエアコンなどの音声認識により制御可能な機器である。図１に示すようにサーバ装置１００と、機器制御装置１１０と、制御対象の各機器１２０とは、それぞれネットワークを介して接続される。なお、サーバ装置１００に対して単数の機器１２０又は複数の機器１２０が接続されてもよい。また、機器１２０は、サーバ装置１００と直接接続されていなくてもよく、機器制御装置１１０と例えばＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）を介して接続されてもよく、機器制御装置１１０を介してサーバ装置１００と接続されてもよい。

　サーバ装置１００が設置されている場所に関しては、特に限定しない。サーバ装置１００は、ビッグデータを扱うデータセンターを管理及び運営する会社が保有するデータセンターに配置されていてもよいし、各家庭に配置されていてもよい。また、サーバ装置１００の各構成は１つの装置内に集約されていてもよいし、各構成が別々の装置に配置されていてもよい。

　サーバ装置１００は、制御部１０１と、通信部１０２と、環境音情報データベース（ＤＢ）１０３とを備える。

　制御部１０１は、サーバ装置１００に関する様々な制御を行うための構成であり、特に限定しない。制御部１０１は、例えばＣＰＵ（中央演算処理装置）などで構成される。

　通信部１０２は、ネットワーク（例えば、インターネット）に接続するための構成であり、特に限定しない。インターネットへの接続方法に関しては問わない。

　環境音情報データベース１０３は、大量の情報を蓄積可能な記録装置である。環境音情報データベース１０３は、例えば家庭内の各機器１２０の運転状況と、環境音情報とを対応付けて記憶している。環境音情報データベース１０３は、同一の装置内に格納されていてもよいし、別々の装置内に格納されていてもよい。

　機器制御装置１１０は、制御部１１１と、通信部１１２と、音情報取得部１１３と、表示部１１４とを備える。なお、機器制御装置１１０のこれらの構成は、機器の一部として内蔵されていてもよいし、別途外部に接続する装置であってもよい。ここで、機器制御装置１１０としては、上記した各構成を備えていれば、例えば一般家庭用のテレビ、又はＰＣ（パーソナルコンピュータ）のモニタなどであってもよい。また、機器制御装置１１０は、本機器制御システムのための専用装置であってもよい。

　制御部１１１及び通信部１１２は、サーバ装置１００の制御部１０１及び通信部１０２と同様の構成であるため、その説明は省略する。

　音情報取得部１１３は、マイクを備えた記録装置である。表示部１１４は、モニタなどの表示機能を持つ装置である。

　機器１２０は、制御部１１１と、通信部１１２とを備える。なお、機器１２０のこれらの構成は、機器の一部として内蔵されていてもよいし、別途外部に接続する装置であってもよい。

　なお、図１では、サーバ装置１００と機器制御装置１１０と機器１２０とによって以下に述べる機器制御システムを構成しているが、これに限られない。例えば、サーバ装置１００及び機器制御装置１１０の一部又は全部の構成が、機器１２０に含まれており、機器１２０のみで機器制御システムを構成してもよい。

　なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ及びステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、全ての実施の形態において、各々の内容を組み合わせることもできる。

　（機器制御システムの構成）
　図２は、本開示の実施の形態１における機器制御システムの構成を示すブロック図である。

　本実施の形態１における機器制御システムは、環境音取得部２０１と、運転状況取得部２０２と、データベース管理部２０３と、環境音情報データベース２０４と、音声コマンド取得部２０５と、ノイズ除去部２０６とを備える。

　環境音取得部２０１は、複数の機器１２０の周囲の環境音を示す環境音情報を取得する。ここで、環境音情報とは、各機器１２０の発する作動音又は家庭内のその他の騒音を含む音であればよい。環境音取得部２０１は、環境音に、定常的な環境音ではない突発的な音が含まれる場合は、突発的な音を除去する機能を有していてもよい。また、環境音取得部２０１が環境音を取得するタイミング、及び環境音取得部２０１が取得する環境音の時間長に関しては特に限定しない。環境音取得部２０１は、常に環境音を取得していてもよいし、予め設定した時間間隔で環境音を取得してもよい。また、環境音取得部２０１は、人が音声を発していないときだけ環境音を取得してもよい。環境音取得部２０１は、取得した環境音情報をデータベース管理部２０３に出力する。

　運転状況取得部２０２は、環境音取得部２０１が環境音を取得したタイミングにおいて、ネットワークを介して接続された各機器の運転状況を示す運転状況情報を取得する。ここで、運転状況情報とは、例えば、電源のＯＮ／ＯＦＦ状態又は運転モード等である。なお、運転状況情報は、各機器から取得できるその他の情報を含んでもよい。運転状況取得部２０２は、取得した運転状況情報を、データベース管理部２０３に出力する。

　データベース管理部２０３は、環境音取得部２０１によって取得された環境音情報と、運転状況取得部２０２によって取得された運転状況情報とを使用して、環境音情報データベース２０４を構築及び管理する。環境音情報データベース２０４には、過去に取得された環境音情報と、環境音情報が取得された時の運転状況情報とが関連付けて記憶されている。データベース管理部２０３は、運転状況取得部２０２によって取得された第１の時間における運転状況情報と、環境音取得部２０１によって第１の時間に取得された環境音情報とを関連付けて環境音情報データベース２０４に記憶する。

　ここで、取得された環境音情報は、ＷＡＶ形式のファイルとして登録されている。なお、環境音情報は、必ずしもＷＡＶ形式ファイルでなくてもよい。例えば、環境音情報は、ＭＰＥＧ形式又はＡＩＦＦ形式等の音声圧縮されたデータであってもよい。また、環境音情報は、環境音から算出されたノイズ除去に必要な特徴量であってもよい。ノイズ除去に必要な特徴量とは、例えば、周波数スペクトルなどである。なお、ノイズ除去に必要な特徴量又はノイズ除去の方法については限定しない。

　データベース管理部２０３は、環境音情報データベース２０４に記憶された環境音情報と運転状況情報とを、ノイズ除去部２０６に出力する。

　音声コマンド取得部２０５は、環境音取得部２０１によって環境音情報が取得されたタイミングとは異なるタイミングにユーザからの音声コマンドを取得する。音声コマンドは、機器を動作させるためにユーザが発した音声を示す。また、運転状況取得部２０２は、音声コマンド取得部２０５によって音声コマンドが取得されたタイミングにおいて、ネットワークを介して複数の機器の運転状況情報を取得する。

　ノイズ除去部２０６は、機器制御のための音声コマンドが入力されたタイミングにおいて取得した複数の機器の運転状況情報と、構築された環境音情報データベース２０４の環境音情報とを参照して、音声コマンドからノイズを除去する。すなわち、ノイズ除去部２０６は、音声コマンドが取得されたタイミングにおいて運転状況取得部２０２によって取得された複数の機器の運転状況と一致する運転状況が環境音情報データベース２０４に記憶されている場合に、運転状況に関連付けて環境音情報データベース２０４に記憶されている環境音に基づいて、音声コマンドからノイズを除去する。ここで、ノイズを除去する方法については限定しない。ノイズ除去部２０６は、環境音情報からノイズをキャンセルする音を算出して再生してもよいし、取得した音声コマンドから信号処理によってノイズを除去してもよい。

　なお、環境音取得部２０１は、図１に示す音情報取得部１１３、通信部１１２及び通信部１０２によって実現され、運転状況取得部２０２は、図１に示す通信部１１２及び通信部１０２によって実現され、データベース管理部２０３は、図１に示す制御部１０１によって実現され、環境音情報データベース２０４は、図１に示す環境音情報データベース１０３によって実現され、音声コマンド取得部２０５は、図１に示す音情報取得部１１３、通信部１１２及び通信部１０２によって実現され、ノイズ除去部２０６は、図１に示す制御部１０１によって実現される。

　（機器制御システムの動作）
　図３は、本開示の実施の形態１における機器制御システムのデータベース構築処理を示すフローチャートである。

　図３を用いて、本実施の形態１における機器制御システムによる、データベースに蓄積される環境音の取得方法について説明する。なお、フローチャートの処理は継続的に行われるものとする。

　本実施の形態１における機器制御システムの目的上、データベースに蓄積される環境音には機器を制御するための音声が含まれていないことが望ましい。そこで、音声検知部（不図示）は、音声コマンドの入力が一定時間以上無いことを検知する。

　まず、音声検知部は、音声コマンドの入力が一定時間以上無いことが検知されたか否かを判断する（ステップＳ１）。音声検知部は、音声コマンドの取得が完了してから次に音声コマンドの取得が開始されるまでの時間を計時し、音声コマンドの取得が完了してからの時間が一定時間以上経過したか否かを判断する。音声コマンドの入力が一定時間以上無いと判断された場合（ステップＳ１でＹＥＳ）、ステップＳ２の処理に進む。一方、音声コマンドの入力が一定時間以内にあったと判断された場合（ステップＳ１でＮＯ）、ステップＳ１の処理を継続的に繰り返す。

　音声コマンドの入力が一定時間以上無いと判断された場合、運転状況取得部２０２は、複数の機器の運転状況を取得する（ステップＳ２）。

　次に、環境音取得部２０１は、環境音を取得する（ステップＳ３）。このように、環境音取得部２０１は、音声検知部によって音声コマンドの入力が一定時間以上無いことが検知された場合、複数の機器の周囲の環境音を取得する。なお、運転状況取得部２０２が複数の機器の運転状況を取得する処理と、環境音取得部２０１が環境音を取得する処理とが連続的に行われることにより、ほぼ同時刻に運転状況と環境音とを取得することができる。また、運転状況取得部２０２と環境音取得部２０１とは、同一時刻にそれぞれ運転状況と環境音とを取得してもよい。

　次に、データベース管理部２０３は、運転状況取得部２０２によって取得された複数の機器の運転状況と、環境音取得部２０１によって取得された環境音とを関連付けて環境音情報データベース２０４に記憶する（ステップＳ４）。

　図４は、環境音情報データベースのデータ構造の一例を示す図である。例えば、機器Ａ、機器Ｂ及び機器Ｃがネットワーク上に存在する場合、図４に示すように、機器Ａ及び機器ＢのＯＮ／ＯＦＦ状態情報と機器Ｃの運転モード（送風の強又は弱）とを組み合わせた１つのパターンに対して１つの環境音が関連付けられる。

　例えば、音声コマンドの入力が一定時間以上無いと判断された場合、運転状況取得部２０２は、電源がＯＮ状態である運転状況情報を機器Ａから取得し、電源がＯＮ状態である運転状況情報を機器Ｂから取得し、運転モードが強である運転状況情報を機器Ｃから取得する。また、この際、環境音取得部２０１は、環境音を取得し、取得した環境音をＷＡＶ形式ファイルの環境音情報「ＸＸＸ０１．ｗａｖ」としてデータベース管理部２０３へ出力する。データベース管理部２０３は、運転状況取得部２０２によって取得された各機器Ａ，Ｂ，Ｃの運転状況情報と、環境音取得部２０１によって取得された環境音情報とを関連付けて環境音情報データベース２０４に記憶する。

　なお、本実施の形態１では、音声コマンドの入力が一定時間以上無いことを検知することにより、人の有無を検知しているが、本開示は特にこれに限定されず、人感センサなどのセンサにより、人の有無を検知してもよい。

　図５は、本開示の実施の形態１の第１の変形例における機器制御システムのデータベース構築処理を示すフローチャートである。

　図５を用いて、本実施の形態１の第１の変形例における機器制御システムによる、データベースに蓄積される環境音の取得方法について説明する。なお、フローチャートの処理は継続的に行われるものとする。

　まず、人感センサ（不図示）は、複数の機器の周囲に存在する人を検知する（ステップＳ１１）。ここで、人の有無を検知するセンサは、人感センサに限定されない。

　次に、人感センサは、人が検知されたか否かを判断する。ここで、人が検知されないと判断された場合（ステップＳ１２でＮＯ）、ステップＳ１３の処理に進む。一方、人が検知されたと判断された場合（ステップＳ１２でＹＥＳ）、ステップＳ１１及びステップＳ１２の処理を継続的に繰り返す。

　人が検知されないと判断された場合、運転状況取得部２０２は、複数の機器の運転状況を取得する（ステップＳ１３）。

　次に、環境音取得部２０１は、環境音を取得する（ステップＳ１４）。このように、環境音取得部２０１は、人感センサによって人が検知されない場合、複数の機器の周囲の環境音を取得する。

　次に、環境音取得部２０１は、取得した環境音から、ノイズ除去に必要な環境音情報を算出する（ステップＳ１５）。環境音取得部２０１は、ステップＳ１４において環境音を取得した後、取得した環境音からノイズ除去に必要な特徴量を環境音情報として算出する。

　次に、データベース管理部２０３は、運転状況取得部２０２によって取得された複数の機器の運転状況と、環境音取得部２０１によって取得された環境音情報とを関連付けて環境音情報データベース２０４に記憶する（ステップＳ１６）。

　なお、図５に示す機器制御システムの動作において、ステップＳ１５の処理は省略してもよく、環境音取得部２０１は、ステップＳ１４で取得された環境音を環境音情報としてデータベース管理部２０３へ出力してもよい。

　また、図３及び図５では、運転状況を取得した後、環境音が取得されているが、本開示は特にこれに限定されず、環境音が取得された後、運転状況が取得されてもよい。また、運転状況取得部２０２は、運転状況を定期的に取得し、取得した時刻と運転状況とを対応付けて記憶してもよい。そして、データベース管理部２０３は、環境音取得部２０１によって環境音が取得された時刻に対応する運転状況を運転状況取得部２０２から読み出し、読み出した運転状況と、環境音とを関連付けて環境音情報データベース２０４に記憶してもよい。

　また、本実施の形態１において、環境音情報データベースが既に存在しており、環境音情報データベース上にない運転状況が検知された場合に環境音を取得してもよい。

　図６は、本開示の実施の形態１の第２の変形例における機器制御システムのデータベース構築処理を示すフローチャートである。

　図６を用いて、本実施の形態１の第２の変形例における機器制御システムによる、データベースに蓄積される環境音の取得方法について説明する。なお、フローチャートの処理は継続的に行われるものとする。

　まず、運転状況取得部２０２は、複数の機器の運転状況を取得する（ステップＳ２１）。

　次に、データベース管理部２０３は、運転状況取得部２０２によって取得された複数の機器の運転状況の組合せが、環境音情報データベース２０４にあるか否かを判断する（ステップＳ２２）。ここで、運転状況の組合せが環境音情報データベース２０４内に存在しないと判断された場合（ステップＳ２２でＮＯ）、ステップＳ２３の処理に進む。一方、運転状況の組合せが環境音情報データベース２０４内に存在すると判断された場合（ステップＳ２２でＹＥＳ）、ステップＳ２１及びステップＳ２２の処理を継続的に繰り返す。

　次に、環境音取得部２０１は、環境音を取得する（ステップＳ２３）。環境音取得部２０１は、運転状況取得部２０２によって取得した複数の機器の第１の時間における運転状況と一致する運転状況が環境音情報データベース２０４に記憶されていない場合、複数の機器の周囲の環境音を取得する。

　次に、データベース管理部２０３は、運転状況取得部２０２によって取得された複数の機器の運転状況と、環境音取得部２０１によって取得された環境音とを関連付けて環境音情報データベース２０４に記憶する（ステップＳ２４）。

　なお、環境音を取得するタイミングとしては、図３、図５及び図６のうちのどれか一つのフローチャートの条件を満たせばよく、図３、図５及び図６の全てのフローチャートの条件を満たしてもよい。

　なお、図６において、複数の機器の運転状況を取得している場合であっても、図５の複数の機器の運転状況を取得していない場合と同様に、環境音取得部２０１は、環境音から特徴量を算出してもよい。

　続いて、図７を用いて、本実施の形態１における機器制御システムのノイズ除去処理について説明する。

　図７は、本開示の実施の形態１における機器制御システムのノイズ除去処理を示すフローチャートである。

　まず、音声コマンド取得部２０５は、ユーザの発する音声コマンドの入力を受け付け、音声コマンドが入力されたか否かを判断する（ステップＳ３１）。

　次に、運転状況取得部２０２は、複数の機器の運転状況を取得する（ステップＳ３２）。

　次に、データベース管理部２０３は、運転状況取得部２０２によって取得された複数の機器の運転状況の組合せが、環境音情報データベース２０４にあるか否かを判断する（ステップＳ３３）。ここで、運転状況の組合せが環境音情報データベース２０４内に存在すると判断された場合（ステップＳ３３でＹＥＳ）、ノイズ除去部２０６は、環境音情報データベース２０４に記憶されている、取得された運転状況の組合せに対応する環境音情報を用いて、取得された音声コマンドから環境音（ノイズ）を除去する（ステップＳ３４）。

　一方、運転状況の組合せが環境音情報データベース２０４内に存在しないと判断された場合（ステップＳ３３でＮＯ）、ノイズ除去部２０６は、取得された音声コマンドに対して通常のノイズ除去処理を行い、取得された音声コマンドから環境音（ノイズ）を除去する（ステップＳ３５）。なお、通常のノイズ除去処理としては、例えば、スペクトラム・サブストラクション、ケプストラム平均化処理、又は音源を推定したエコーキャンセルなどがある。

　その後、ノイズ除去部２０６によってノイズが除去された音声コマンドに対して音声認識処理が行われ、音声コマンドに応じた機器の制御が行われる。

　このように、実施の形態１では、取得した複数の機器の運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音に基づいて、音声コマンドからノイズが除去されるので、音声コマンドに含まれるノイズ（環境音）を確実に除去することができ、より確実に音声認識を行うことができる。

　なお、本実施の形態１において、環境音情報データベースは、家庭内の全ての機器の運転状況と環境音とを関連付けて記憶してもよい。また、環境音情報データベースは、環境音及び音声コマンドを取得するマイクが配置されている部屋ごとに設けられてもよく、各部屋内に配置された複数の機器の運転状況と環境音とを関連付けて記憶してもよい。

　また、図７に示すノイズ除去処理は、音声コマンドが入力されたマイクが配置されている部屋の環境音情報データベースを利用して行われてもよい。また、ノイズ除去処理が行われた後、音声認識が不可能であると判断された場合、さらに隣接する部屋の環境音情報データベースを利用してノイズ除去処理が行われてもよい。

　（実施の形態２）
　実施の形態１では、音声コマンドからノイズ（環境音）を除去しているが、実施の形態２では、騒音源となっている機器を制御することによりノイズ（環境音）を低減させる。

　図８は、本開示の実施の形態２における機器制御システムの構成を示すブロック図である。

　本実施の形態２における機器制御システムは、環境音取得部２０１と、運転状況取得部２０２と、データベース管理部２０３と、環境音情報データベース２０４と、音声コマンド取得部２０５と、ノイズ除去部２０７と、音声認識判断部２０８と、機器制御部２０９とを備える。なお、実施の形態２において、実施の形態１における機器制御システムと同じ構成については同じ符号を付し、説明を省略する。

　ノイズ除去部２０７は、音声コマンド取得部２０５によって取得された音声コマンドに対して通常のノイズ除去処理を行う。運転状況の組合せが環境音情報データベース２０４内に存在しないと判断された場合、ノイズ除去部２０７は、取得された音声コマンドに対して通常のノイズ除去処理を行い、取得された音声コマンドから環境音（ノイズ）を除去する。

　音声認識判断部２０８は、運転状況取得部２０２によって取得した複数の機器の第２の時間における運転状況と一致する運転状況が環境音情報データベース２０４に記憶されている場合に、運転状況に関連付けて環境音情報データベース２０４に記憶されている環境音から予測される音環境で、音声認識が可能であるか否かを判断する。

　ここで、環境音取得部２０１は、環境音を取得する際に、環境音の音量も取得する。環境音情報データベース２０４は、環境音だけでなく、環境音の音量も記憶している。音声認識判断部２０８は、運転状況取得部２０２によって取得した複数の機器の第２の時間における運転状況と一致する運転状況が環境音情報データベース２０４に記憶されている場合に、運転状況に関連付けて環境音情報データベース２０４に記憶されている環境音の音量が、音声認識が可能な所定の音量以下であるか否かを判断することにより、音声認識が可能であるか否かを判断する。環境音取得部２０１は、運転状況に関連付けて環境音情報データベース２０４に記憶されている環境音の音量が所定の音量以下である場合、音声認識が可能であると判断する。また、環境音取得部２０１は、運転状況に関連付けて環境音情報データベース２０４に記憶されている環境音の音量が所定の音量より大きい場合、音声認識が不可能であると判断する。

　機器制御部２０９は、音声認識判断部２０８によって音声認識が不可能であると判断された場合に、複数の機器のうち、環境音を発している機器を制御する。例えば、機器制御部２０９は、音声認識判断部２０８によって音声認識が不可能であると判断された場合に、複数の機器のうち、環境音が所定の音量以上である機器を制御してもよい。また、例えば、機器制御部２０９は、音声認識判断部２０８によって音声認識が不可能であると判断された場合に、複数の機器のうち、電源がオン状態である機器の電源をオフ状態にしてもよい。また、機器制御部２０９は、音声認識判断部２０８によって音声認識が不可能であると判断された場合に、音量が最も小さい環境音に対応する運転状況の組合せに応じて運転するように、複数の機器を制御してもよい。

　また、環境音情報データベース２０４は、過去に音声認識が成功したか否かに関する情報を、運転状況の組合せに関連付けて記憶してもよく、機器制御部２０９は、音声認識判断部２０８によって音声認識が不可能であると判断された場合に、過去に音声認識が成功した運転状況の組合せに応じて運転するように、複数の機器を制御してもよい。また、環境音情報データベース２０４が、過去に音声認識が成功したか否かに関する情報を、運転状況の組合せに関連付けて記憶している場合、音声認識判断部２０８は、運転状況取得部２０２によって取得された複数の機器の運転状況の組合せに関連付けて記憶されている、過去に音声認識が成功したか否かに関する情報に基づいて、音声認識が可能であるか否かを判断してもよい。

　なお、ノイズ除去部２０７は、図１に示す制御部１０１によって実現され、音声認識判断部２０８は、図１に示す制御部１０１によって実現され、機器制御部２０９は、図１に示す制御部１０１によって実現される。

　また、本開示の実施の形態２における機器制御システムのデータベース構築処理は、実施の形態１の図３、図５及び図６に示すデータベース構築処理と同じであるので、説明を省略する。

　続いて、図９を用いて、本実施の形態２における機器制御システムの機器制御処理について説明する。

　図９は、本開示の実施の形態２における機器制御システムの機器制御処理を示すフローチャートである。

　なお、図９に示すステップＳ４１～ステップＳ４３の処理は、図７に示すステップＳ３１～ステップＳ３３の処理と同じであるので、説明を省略する。

　運転状況の組合せが環境音情報データベース２０４内に存在しないと判断された場合（ステップＳ４３でＮＯ）、ノイズ除去部２０７は、取得された音声コマンドに対して通常のノイズ除去処理を行い、取得された音声コマンドから環境音（ノイズ）を除去する（ステップＳ４４）。

　一方、運転状況の組合せが環境音情報データベース２０４内に存在すると判断された場合（ステップＳ４３でＹＥＳ）、音声認識判断部２０８は、運転状況に関連付けて環境音情報データベース２０４に記憶されている環境音から予測される音環境で、音声認識が可能であるか否かを判断する（ステップＳ４５）。ここで、音声認識が可能であると判断された場合（ステップＳ４５でＹＥＳ）、処理を終了する。

　一方、音声認識が不可能であると判断された場合（ステップＳ４５でＮＯ）、機器制御部２０９は、複数の機器のうち、環境音を発している機器を制御する（ステップＳ４６）。機器制御部２０９は、音声コマンドにより機器を制御するために、環境音情報データベース２０４の情報を基に、音声認識の妨げとなるノイズを発している機器を制御する。機器制御部２０９は、例えば、ある機器Ａの電源がＯＮ状態である際に取得される環境音情報が、音声認識に適さないノイズを含む場合、機器Ａの電源を音声コマンドが入力される間だけ一時的にＯＦＦ状態にする。

　その後、ノイズが低減された音声コマンドに対して音声認識処理が行われ、音声コマンドに応じた機器の制御が行われる。

　なお、本機器制御システムにおいて、サーバ装置１００と表示装置（テレビ、スマートフォン、タブレット型コンピュータ又はＰＣなど）とがネットワークを介して接続されている場合、表示装置に対し、機器制御部２０９によって機器が制御されることを通知してもよい。

　図１０は、音声認識を可能にするために機器が制御される際に表示装置に表示される表示画面の一例を示す図である。

　図１０に示すように、表示画面には、運転中の複数の機器を示す画像と、各機器のノイズ値（音量）とが表示されている。データベース管理部２０３は、環境音取得部２０１によって取得された環境音から、各機器のノイズ値を算出する。なお、各機器のノイズ値は、各機器の運転状況に関連付けて予め記憶されていてもよい。また、表示画面には、音声認識を利用する際にどの機器をどの程度制御するかという情報が表示されている。例えば、図１０に示す表示画面では、エアコンの運転状況が強から弱に変更されることが表示されている。

　このように、実施の形態２では、音声認識が不可能であると判断された場合に、複数の機器のうち、環境音を発している機器が制御されるので、音声認識の妨げとなるノイズ（環境音）を低減することができ、より確実に音声認識を行うことができる。また、音声認識を利用する際に特定の機器が自動的に制御されることが通知されるため、ユーザの不快感を軽減できる。

　（実施の形態３）
　実施の形態２では、騒音源となっている機器を制御することによりノイズ（環境音）を低減させるが、実施の形態３では、騒音源となっている機器が存在することをユーザに提示する。

　図１１は、本開示の実施の形態３における機器制御システムの構成を示すブロック図である。

　本実施の形態３における機器制御システムは、環境音取得部２０１と、運転状況取得部２０２と、データベース管理部２０３と、環境音情報データベース２０４と、音声コマンド取得部２０５と、ノイズ除去部２０７と、音声認識判断部２０８と、提示部２１０とを備える。なお、実施の形態３において、実施の形態１及び実施の形態２における機器制御システムと同じ構成については同じ符号を付し、説明を省略する。

　提示部２１０は、音声認識判断部２０８によって判断された結果をユーザに提示する。提示部２１０は、音声認識判断部２０８によって音声認識が不可能であると判断された場合に、音声認識が不可能であることをユーザに提示する。提示部２１０は、音声認識判断部２０８によって音声認識が不可能であると判断された場合に、音声認識が不可能であることを示す表示画面を表示装置に送信する。表示装置は、受信した表示画面を表示する。なお、表示装置は、例えば、テレビ、スマートフォン、タブレット型コンピュータ又はＰＣなどである。

　なお、提示部２１０は、図１に示す制御部１０１によって実現される。

　また、本開示の実施の形態３における機器制御システムのデータベース構築処理は、実施の形態１の図３、図５及び図６に示すデータベース構築処理と同じであるので、説明を省略する。

　続いて、図１２を用いて、本実施の形態３における機器制御システムの情報提示処理について説明する。

　図１２は、本開示の実施の形態３における機器制御システムの情報提示処理を示すフローチャートである。

　なお、図１２に示すステップＳ５１～ステップＳ５３の処理は、図７に示すステップＳ３１～ステップＳ３３の処理と同じであるので、説明を省略する。また、図１２に示すステップＳ５４～ステップＳ５５の処理は、図９に示すステップＳ４４～ステップＳ４５の処理と同じであるので、説明を省略する。

　音声認識が不可能であると判断された場合（ステップＳ４５でＮＯ）、提示部２１０は、音声認識が不可能であることを示す音声認識可否情報をユーザに提示する（ステップＳ５６）。提示部２１０は、現状が音声コマンドの入力に適しているかどうかをユーザに提示してもよい。提示部２１０は、環境音情報データベース２０４の情報を基に、現状の機器の運転状況から予想される音環境で音声認識が可能であるか否かについての現状をユーザに提示する。なお、提示部２１０は、現状を提示した上で、音声認識可能な音環境となるようにユーザに機器の制御を促してもよい。また、音声認識可否情報は、音声認識が不可能であることを示す情報だけでなく、音声認識が可能であることを示す情報を含んでもよい。

　本機器制御システムにおいて、サーバ装置１００と表示装置（テレビ、スマートフォン、タブレット型コンピュータ又はＰＣなど）とがネットワークを介して接続されている場合、表示装置に対し、現在の環境音の状況を表示する。

　図１３は、音声認識が不可能であることをユーザに提示する際に表示装置に表示される表示画面の一例を示す図である。

　図１３に示すように、表示画面には、運転中の複数の機器を示す画像と、各機器のノイズ値（音量）とが表示されている。データベース管理部２０３は、環境音取得部２０１によって取得された環境音から、各機器のノイズ値を算出する。なお、各機器のノイズ値は、各機器の運転状況に関連付けて予め記憶されていてもよい。この際、図１３に示すように、表示装置は、ノイズ値の大きい機器を他の機器よりも大きく表示してもよい。また、図１３に示すように、表示装置は、現在のノイズ状況が、音声認識にふさわしくないノイズ状況であることを表示してもよい。

　音声認識が不可能であることを示す音声認識不可情報が提示されたユーザは、環境音を低減するべく機器の運転状況を変更する。これにより、ユーザに対して機器の運転状況の変更を促すことができ、音声認識の妨げとなるノイズ（環境音）を低減させることができる。

　以上、本実施の形態３における機器制御システムによれば、ユーザは、現在の機器の運転状況及びノイズの状況を容易に把握できる。また、ユーザは、ノイズの要因となっている機器を確認できる。

　本開示に係る機器制御方法及び機器制御システムは、より確実に音声認識を行うことができ、ユーザからの音声コマンドに基づいて複数の機器を制御する機器制御方法及び機器制御システムとして有用である。

　１００　　サーバ装置
　１０１　　制御部
　１０２　　通信部
　１０３　　環境音情報データベース
　１１０　　機器制御装置
　１１１　　制御部
　１１２　　通信部
　１１３　　音情報取得部
　１１４　　表示部
　１２０　　機器
　２０１　　環境音取得部
　２０２　　運転状況取得部
　２０３　　データベース管理部
　２０４　　環境音情報データベース
　２０５　　音声コマンド取得部
　２０６，２０７　　ノイズ除去部
　２０８　　音声認識判断部
　２０９　　機器制御部
　２１０　　提示部

Claims

　ユーザからの音声コマンドに基づいて複数の機器を制御する機器制御方法であって、
　第１の時間に前記複数の機器の周囲の環境音を取得する環境音取得ステップと、
　ネットワークを介して前記複数の機器の前記第１の時間における運転状況を取得する第１の運転状況取得ステップと、
　前記第１の運転状況取得ステップにおいて取得した前記第１の時間における前記運転状況と、前記環境音取得ステップにおいて前記第１の時間に取得した前記環境音とを関連付けてデータベースに記憶するデータベース管理ステップと、
　を含む機器制御方法。
　前記第１の時間とは異なる第２の時間に前記ユーザからの音声コマンドを取得する音声コマンド取得ステップと、
　前記ネットワークを介して前記複数の機器の前記第２の時間における運転状況を取得する第２の運転状況取得ステップと、
　前記第２の運転状況取得ステップにおいて取得した前記複数の機器の前記第２の時間における運転状況と一致する運転状況が前記データベースに記憶されている場合に、前記運転状況に関連付けて前記データベースに記憶されている前記環境音に基づいて、前記音声コマンドからノイズを除去するノイズ除去ステップと、
　をさらに含む請求項１記載の機器制御方法。
　前記第１の時間とは異なる第２の時間に前記ユーザからの音声コマンドを取得する音声コマンド取得ステップと、
　前記ネットワークを介して前記複数の機器の前記第２の時間における運転状況を取得する第２の運転状況取得ステップと、
　前記第２の運転状況取得ステップにおいて取得した前記複数の機器の前記第２の時間における運転状況と一致する運転状況が前記データベースに記憶されている場合に、前記運転状況に関連付けて前記データベースに記憶されている前記環境音から予測される音環境で、音声認識が可能であるか否かを判断する判断ステップと、
　前記判断ステップにおいて判断された結果をユーザに提示する提示ステップと、
　をさらに含む請求項１記載の機器制御方法。
　前記第１の時間とは異なる第２の時間に前記ユーザからの音声コマンドを取得する音声コマンド取得ステップと、
　前記ネットワークを介して前記複数の機器の前記第２の時間における運転状況を取得する第２の運転状況取得ステップと、
　前記第２の運転状況取得ステップにおいて取得した前記複数の機器の前記第２の時間における運転状況と一致する運転状況が前記データベースに記憶されている場合に、前記運転状況に関連付けて前記データベースに記憶されている前記環境音から予測される音環境で、音声認識が可能であるか否かを判断する判断ステップと、
　前記判断ステップにおいて音声認識が不可能であると判断された場合に、前記複数の機器のうち、前記環境音を発している機器を制御する機器制御ステップと、
　をさらに含む請求項１記載の機器制御方法。
　前記データベースは、過去に音声認識が成功したか否かを、前記運転状況に関連付けてさらに記憶しており、
　前記機器制御ステップは、前記判断ステップにおいて音声認識が不可能であると判断された場合に、前記データベースに記憶されている過去に音声認識に成功した運転状況で運転するように、前記複数の機器を制御する請求項４記載の機器制御方法。
　前記判断ステップは、前記第２の運転状況取得ステップにおいて取得した前記複数の機器の前記第２の時間における運転状況と一致する運転状況が前記データベースに記憶されている場合に、前記運転状況に関連付けて前記データベースに記憶されている前記環境音の音量が、音声認識が可能な所定の音量以下であるか否かを判断することにより、音声認識が可能であるか否かを判断する請求項３～５のいずれかに記載の機器制御方法。
　前記音声コマンドの入力が一定時間以上無いことを検知する音声検知ステップをさらに含み、
　前記環境音取得ステップは、前記音声検知ステップにおいて前記音声コマンドの入力が一定時間以上無いことが検知された場合、前記複数の機器の周囲の環境音を取得する請求項１～６のいずれかに記載の機器制御方法。
　前記複数の機器の周囲に存在する人を検知する人検知ステップをさらに含み、
　前記環境音取得ステップは、前記人検知ステップにおいて人が検知されない場合、前記複数の機器の周囲の環境音を取得する請求項１～６のいずれかに記載の機器制御方法。
　前記環境音取得ステップは、前記第１の運転状況取得ステップにおいて取得した前記複数の機器の前記第１の時間における運転状況と一致する運転状況が前記データベースに記憶されていない場合、前記複数の機器の周囲の環境音を取得する請求項１～６のいずれかに記載の機器制御方法。
　ユーザからの音声コマンドに基づいて複数の機器を制御する機器制御システムであって、
　第１の時間に前記複数の機器の周囲の環境音を取得する環境音取得部と、
　ネットワークを介して前記複数の機器の前記第１の時間における運転状況を取得する運転状況取得部と、
　前記運転状況取得部によって取得した前記第１の時間における前記運転状況と、前記環境音取得部によって前記第１の時間に取得した前記環境音とを関連付けてデータベースに記憶するデータベース管理部と、
　を備える機器制御システム。