JP4821648B2 - 音声コントローラ - Google Patents

音声コントローラ Download PDF

Info

Publication number
JP4821648B2
JP4821648B2 JP2007043127A JP2007043127A JP4821648B2 JP 4821648 B2 JP4821648 B2 JP 4821648B2 JP 2007043127 A JP2007043127 A JP 2007043127A JP 2007043127 A JP2007043127 A JP 2007043127A JP 4821648 B2 JP4821648 B2 JP 4821648B2
Authority
JP
Japan
Prior art keywords
signal
noise
unit
sound
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007043127A
Other languages
English (en)
Other versions
JP2008203800A (ja
Inventor
朗 馬場
清隆 竹原
健治 奥野
賢二 中北
新平 日比谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Electric Works Co Ltd
Original Assignee
Panasonic Corp
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Works Ltd filed Critical Panasonic Corp
Priority to JP2007043127A priority Critical patent/JP4821648B2/ja
Publication of JP2008203800A publication Critical patent/JP2008203800A/ja
Application granted granted Critical
Publication of JP4821648B2 publication Critical patent/JP4821648B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、住宅等の建物内に設置され、住宅内の設備を音声で操作する音声コントローラに関するものである。
住宅等の建物内に設置され、住宅内の設備を音声で操作する音声コントローラが提供されている。
ところで、住宅内には多様な機器が存在し、これらをスイッチ等で操作するのは煩雑である。例えばキッチン空間には、給湯コントローラ、床暖房コントローラ、照明スイッチ、インターホンなどがあり、また浴室空間には、気泡浴槽コントローラ、照明スイッチ、浴室暖房換気乾燥機のスイッチ、テレビ等がある。
また、これらのコントローラ、スイッチが複数存在することは、宅内の景観も損なうという課題がある。
これらの課題を解決するために、複数の機器を制御可能とする統合的なコントローラが提供されており、またその操作を音声認識によって行うものが提供されてきている。このコントローラが所謂音声コントローラである。
音声コントローラは、発話入力スイッチがあると、発話入力スイッチを操作する必要があるため、発話入力スイッチを設けていない場合が多いが、このような音声コントローラでは、設置している宅内の環境雑音(騒音)が集音用のマイクに入力されるために、環境騒音をユーザの発話音声と認識して、誤った制御を行う可能性がある。特に、対象空間にテレビ、ラジオ等の音響機器がある場合には、人の音声がマイクに入力された音響機器の出力音をエコーキャンセラにより低減する、例えば特許文献1に開示されている音声認識装置を用い方法も考えられる。
特開2003−241791号公報
ところで、エコーキャンセラは、音響機器が出力する音信号を参照信号として適応フィルタを逐次学習することで、音響機器の出力音が集音部であるマイクへ回り込むのを低減する技術である。また音声認識方法は、音声から特徴量を抽出し、この特徴量の時系列変化から発話内容を識別する方法であり、発話音量の個人差は、発話者とマイクとの距離の変動による入力レベルの変動の影響を受けないように、特徴量に音声パワーを用いずに音声パワーの日瓶値を用いるのが一般的である。
一方住宅内の設備機器を音声で操作する音声コントローラでは、マイクから離れたユーザの声も認識できるように、集音部の入力ゲインを高く設定しなければならない上に、キッチンや浴室等の音の反射が強い環境では、残響時間が長くなるために、エコーキャンセラが推定するフィルタ長も長くなり、精度の高いフィルタ学習が困難になる。そのため回り込みの抑圧できなかった成分が多くなる。
かように従来の音声コントローラでは、エコーキャンセラの抑圧量が十分ではなく、音響機器の出力音をユーザの発話音声と認識してしまい、誤った制御を行うという課題があった。
本発明は、上述の点に鑑みて為されたもので、その目的とするところは、宅内の音響機器が音を出力している環境下でも、誤った音声認識による誤制御を防ぐことができる音声コントローラを提供することにある。
上述の目的を達成するために、請求項1の発明では、ユーザから発声された音声を認識し、この認識した音声で規定される制御命令に従って制御対象の機器の動作を制御する音声コントローラであって、宅内の音信号を集音する集音部と、該集音部で集音した音に含まれる宅内の音響機器の出力音に対してエコーキャンセル処理を施すエコーキャンセル処理部と、音声認識の基準となる音声認識モデル及び重畳させる雑音信号を記憶している記憶部と、エコーキャンセル処理部の出力信号に雑音信号を重畳させて前記出力信号を平滑化する雑音重畳部と、前記雑音信号が重畳された出力信号と、前記音声認識モデルとを比較して前記出力信号に含まれる音声を認識する音声認識部と、該音声認識部で認識した音声に対応する制御命令を実行する制御実行部とを備えて成り、音響機器からの出力音の大きさを検知する出力音検知部を備え、雑音重畳部は、前記出力音検知部が検知した出力音の大きさに応じて、前記出力信号に重畳させる雑音信号の大きさを変化させることを特徴とする。
請求項1の発明によれば、雑音重畳部を設けてエコーキャンセル部の出力信号に雑音信号を重畳して平滑化するので、宅内の音響機器が音を出力している環境下でも、音声認識部がユーザの音声を認識することができ、その結果誤った音声認識による誤制御を防ぐことができる。また、出力音のパワーが小さいときには重畳する雑音信号の割合を小さくし、出力音が大きいときには重畳ずる雑音信号の割合を大きくすることができ、そのため音響機器の出力音のパワーが小さいときに過大な雑音信号が重畳され、ユーザの音声信号も雑音信号により平滑化されてしまうことがなく、その結果ユーザの音声を認識できなくなるという問題を回避できる
請求項の発明では、請求項の発明において、前記音声認識モデルは、前記出力信号に重畳させる雑音信号を予め組み込んで構成されていることを特徴とする。
請求項の発明によれば、音声認識モデルに重畳用の雑音信号を組み込んでいるので、雑音重畳部で雑音信号が重畳された音声信号と音声認識モデルとの間の音響的ミスマッチが減少することになり、ユーザの音声に雑音を重畳することによる認識性能の低下を減少させることができる。
請求項の発明では、請求項1又は2の発明において、前記記憶部に記憶されている雑音信号は、宅内に設置された制御対象機器の定常雑音信号であることを特徴とする。
請求項の発明によれば、重畳用雑音信号が、既に宅内に設置された制御対象機器が発生する騒音の信号を用いるので、雑音信号を重畳することによる性能低下が、宅内機器の動作時の騒音による性能低下と同程度になり、ユーザの使用感に不自然さがなくなる。
請求項の発明では、請求項の発明において、前記音声認識モデルは、前記出力信号に重畳する前記定常雑音信号を予め組み込んで構成されていることを特徴とする。
請求項の発明によれば、音声認識モデルにも重畳用の定常雑音信号を組み込んでいるので、雑音重畳部で定常雑音信号が重畳された音声信号と音声認識モデルとの間の音響的ミスマッチが減少することになり、ユーザの音声に雑音を重畳することによる認識性能の低下を減少させることができる。
請求項の発明では、請求項又はの発明において、前記制御対象機器の電源のオン/オフを検知する機器電源検知部を備え、前記雑音重畳部は、前記制御対象機器の電源がオンしている場合に、前記出力信号への雑音信号の重畳を抑止することを特徴とする。
請求項の発明によれば、制御対象機器の電源がオンしている場合には、雑音信号を重畳しないので、雑音信号の重畳分に代わり、浴室機器2の発する騒音が混入されることになるが、ユーザの音声と雑音のS/N比が想定以上に劣化して認識性能が低下することもなく、しかも浴室機器の騒音がエコーキャンセル未抑圧成分を平滑化するので、雑音信号を重畳しなくても音響機器の出力音信号を平滑化し、誤制御することがない。
請求項の発明では、請求項1乃至の何れかの発明において、前記音響機器の電源のオン/オフを検知する機器電源検知部を備え、前記雑音重畳部は、前記音響機器の電源がオフしている場合に、前記出力信号への雑音信号の重畳を抑止することを特徴とする。
請求項の発明によれば、音響機器の電源がオフしている場合に、雑音信号を重畳しないので、ユーザが小さな声で音声入力しても十分なS/N比を得ることができ、高い認識性能を得ることができる。
本発明は、雑音重畳部を設けてエコーキャンセル部の出力信号に雑音信号を重畳して平滑化するので、宅内の音響機器が音を出力している環境下でも、音声認識部がユーザの音声を認識することができ、その結果誤った音声認識による誤制御を防ぐことができるという効果がある。
以下本発明を実施形態により説明する。
(実施形態1)
本実施形態の音声コントローラ1は、例えば図1に示すように浴室に設置した浴室機器2を制御対象とするものであり、図示するようにユーザの発話音声を捉えて音信号(音声信号)に変換するマイクのような集音部10と、集音部10で集音される例えば浴室テレビ等の音響機器3の出力音に対してエコーキャンセル処理を施すエコーキャンセル部11と、音響機器3から、例えばライン入力でエコーキャンセル部11に参照信号として入力される出力音の音信号の信号パワーを計測する出力音検知部12と、エコーキャンセル部11の出力信号に重畳する重畳用雑音信号のデータを記憶する記憶部13と、エコーキャンセル部11の出力信号に重畳用雑音信号を重畳する雑音重畳部14と、制御対象機器である浴室機器2及び音響機器3の電源のオン/オフを検知する機器電源検知部15と、音声認識処理に用いる音声認識モデルのデータを記憶している記憶部16と、雑音重畳部14の出力信号と音声認識モデルとを比較して発話音声を認識する音声認識部17と、音声認識部17で認識した音声に対応する制御命令を実行して、本実施形態の制御対象機器である浴室機器2を制御する制御実行部18とで構成される。尚記憶部13,16は同じ記憶装置を用いて構成しても良い。
図2はエコーキャンセル部11の構成を示しており、このエコーキャンセル部11は減算器11aと、適応フィルタ11bとで構成され、集音部10を構成するマイクでユーザの発話音声及び音響機器3のスピーカ3aで再生される出力音からなる音信号を減算器11aに入力する。この減算器11aは、音信号から適応フィルタ11bによって合成された推定エコー信号を減算し、エコーを消去して出力する。一方適応フィルタ11bは、減算器11aによる減算処理後の誤差信号から音響機器3のスピーカ3aから集音部10までの室内の伝達特性を推定し、この推定したフィルタを用いて音響機器3の出力音の音信号(参照信号)から前記推定エコー信号を減算器11aに出力する。
次に本実施形態の音声コントローラ1の動作を説明する。
まず、ユーザは、浴室機器2の制御を行いたい場合には、集音部10に所定の音声を入力する。
このときに、浴室内の音響機器3が動作し、そのスピーカ3a(図2参照)から再生音、つまり出力音が出力されている場合、集音部10にこの出力音も入力することになる。
図3(a)はユーザの音声(I)に続いて音響機器3の出力音(II)が集音部10に入力したときの集音部10から出力される音信号の波形例を示す。
エコーキャンセル部11は集音部10から出力される音信号を入力するとともに、ライン入力で音響機器3の出力音信号を入力し、この出力音信号により、集音部10から出力される音信号に含まれる音響機器3の出力音(II)の成分を抑制する処理を行う。図3(b)はこの抑制処理され、エコーキャンセル部11から出力される出力信号の波形例である。
そしてエコーキャンセル部11の出力信号を入力した雑音重畳部14は、記憶部13から読み出した重畳用雑音信号(図3(c)参照)をエコーキャンセル部11の出力信号に重畳して図3(d)に示すように平滑化を行う。
ここで重畳用雑音信号としては、例えば浴室乾燥機のような浴室機器2の動作音信号を用いている。また雑音重畳部14は重畳する雑音信号の割合を出力音検知部12から出力される信号パワーに対応して通知される信号に基づいて制御する。出力音検知部12は、音響機器3からエコーキャンセル部11へ出力される参照信号の単位時間当たりの信号パワーを所定の時間間隔毎に雑音重畳部14へ通知している。尚信号パワーの変動があった場合のみ、雑音重畳部14へ通知するようにしても良い。
尚、雑音重畳部14は、機器電源検知部15から浴室機器2の電源がオン状態である信号が出力されている場合、或いは機器電源検知部15から音響機器3の電源がオフ状態である場合に、雑音重畳を行わない。
さて、音声認識部17は、雑音重畳部14からの出力信号と音声認識モデルとを比較して、音声認識処理を行っており、ユーザの音声が集音部10に入力されていない場合には、主音部10には音響機器3の出力音のみが入力されているが、エコーキャンセル部11の出力信号に雑音信号が重畳されるため、音声認識部17は音声と認識しない。
一方、ユーザの音声が入力されている場合には、重畳されている雑音よりもユーザの音声のパワーが十分に大きいので、正しく音声と判断されて音声認識処理が行われる。このときユーザの音声に雑音が重畳されているが、音声認識モデルも雑音が重畳された学習データから作成されているので、音声と音声認識モデルの音響的ミスマッチによる認識性能の低下は少ない。
制御実行部18は、音響認識部17による認識結果に基づいて、浴室機器2に制御命令を出力して所定の制御を実行する。
以上のように本実施形態の音声コントローラ1は、上述のように雑音重畳部14を設けてエコーキャンセル部11の出力信号に雑音信号を重畳して平滑化するので、音声認識部17が、エコーキャンセル部11で完全に抑制できなかった音響機器3の出力音を音声と判断して音声認識処理を行うことがなくなり、その結果として出力音をユーザの音声と判断して誤った制御が為されるのを防ぐことができる。
また、音響機器3からの出力音の大きさを検知する出力音検知部12を備えていることで、出力音のパワーが小さいときには重畳する雑音信号の割合を小さくし、出力音が大きいときには重畳ずる雑音信号の割合を大きくするので、音響機器3の出力音のパワーが小さいときに過大な雑音信号が重畳され、ユーザの音声信号も雑音信号により平滑化されてしまうことがなく、その結果ユーザの音声を認識できなくなるという問題を回避できる。
尚、出力音が大きい場合には、重畳する雑音の割合が大きくするが、ユーザの発話音声の大きさは、音響機器の再生音の大きさに影響されて大きくなるので、雑音によって平滑化されてしまうことはない。
更に、また重畳用雑音信号が、既に浴室内に設置された浴室機器2が発生する騒音の信号を用いるので、雑音信号を重畳することによる性能低下が、浴室機器2の動作時の騒音による性能低下と同程度になり、ユーザの使用感に不自然さがなくなる。
また、浴室機器2の電源がオンしている場合には、雑音信号を重畳しないので、雑音信号の重畳分に代わり、浴室機器2の発する騒音が混入されることになるが、ユーザの音声と雑音のS/N比が想定以上に劣化して認識性能が低下することもなく、しかも浴室機器2の騒音がエコーキャンセル未抑圧成分を平滑化するので、雑音信号を重畳しなくても音響機器3の出力音信号を平滑化し、誤動作することがない。
また音響機器3の電源がオフしている場合にも、雑音信号を重畳しないので、ユーザが小さな声で音声入力しても十分なS/N比を得ることができ、高い認識性能を得ることができる。
記憶部16に記憶させている音声認識モデルに、定常雑音信号、例えば重畳用雑音信号<浴室機器2の騒音>を組み込めば、雑音重畳部14で雑音信号を重畳した音声信号と音声認識モデルとの間の音響的ミスマッチが減少することになり、ユーザの音声に雑音を重畳するこことによる認識性能の低下を減少させることができる。この音声認識モデルへの重畳用雑音の組み込みは、音声認識モデルの学習用音声データに対して雑音を重畳した後、音声認識モデルを作成しても良い。
一実施形態の構成図である。 一実施形態に用いるエコーキャンセル部の構成図である。 一実施形態の動作説明用の波形図である。
符号の説明
1 音声コントローラ
10 集音部
11 エコーキャンセル部
12 出力音検知部
13 記憶部
14 雑音重畳部
15 機器電源検知部
16 記憶部
17 音声認識部
18 制御実行部
2 浴室機器
3 音響機器

Claims (6)

  1. ユーザから発声された音声を認識し、この認識した音声で規定される制御命令に従って制御対象の機器の動作を制御する音声コントローラであって、
    宅内の音信号を集音する集音部と、
    該集音部で集音した音に含まれる宅内の音響機器の出力音に対してエコーキャンセル処理を施すエコーキャンセル処理部と、
    音声認識の基準となる音声認識モデル及び重畳させる雑音信号を記憶している記憶部と、
    エコーキャンセル処理部の出力信号に雑音信号を重畳させて前記出力信号を平滑化する雑音重畳部と、
    前記雑音信号が重畳された出力信号と、前記音声認識モデルとを比較して前記出力信号に含まれる音声を認識する音声認識部と、
    該音声認識部で認識した音声に対応する制御命令を実行する制御実行部とを備えて成り、
    音響機器からの出力音の大きさを検知する出力音検知部を備え、
    雑音重畳部は、前記出力音検知部が検知した出力音の大きさに応じて、前記出力信号に重畳させる雑音信号の大きさを変化させることを特徴とする音声コントローラ。
  2. 前記音声認識モデルは、前記出力信号に重畳させる雑音信号を予め組み込んで構成されていることを特徴とする請求項1記載の音声コントローラ。
  3. 前記記憶部に記憶されている雑音信号は、宅内に設置された制御対象機器の定常雑音信号であることを特徴とする請求項1又は2記載の音声コントローラ。
  4. 前記音声認識モデルは、前記出力信号に重畳する前記定常雑音信号を予め組み込んで構成されていることを特徴とする請求項記載の音声コントローラ。
  5. 前記制御対象機器の電源のオン/オフを検知する機器電源検知部を備え、前記雑音重畳部は、前記制御対象機器の電源がオンしている場合に、前記出力信号への雑音信号の重畳を抑止することを特徴とする請求項3又は4記載の音声コントローラ。
  6. 前記音響機器の電源のオン/オフを検知する機器電源検知部を備え、前記雑音重畳部は、前記音響機器の電源がオフしている場合に、前記出力信号への雑音信号の重畳を抑止することを特徴とする請求項1乃至5の何れか1項に記載の音声コントローラ
JP2007043127A 2007-02-23 2007-02-23 音声コントローラ Expired - Fee Related JP4821648B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007043127A JP4821648B2 (ja) 2007-02-23 2007-02-23 音声コントローラ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007043127A JP4821648B2 (ja) 2007-02-23 2007-02-23 音声コントローラ

Publications (2)

Publication Number Publication Date
JP2008203800A JP2008203800A (ja) 2008-09-04
JP4821648B2 true JP4821648B2 (ja) 2011-11-24

Family

ID=39781329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007043127A Expired - Fee Related JP4821648B2 (ja) 2007-02-23 2007-02-23 音声コントローラ

Country Status (1)

Country Link
JP (1) JP4821648B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3128870B2 (ja) * 1991-07-04 2001-01-29 ソニー株式会社 ノイズ低減装置
JP3357629B2 (ja) * 1999-04-26 2002-12-16 旭化成株式会社 設備制御システム
JP2001275176A (ja) * 2000-03-24 2001-10-05 Matsushita Electric Ind Co Ltd リモートコントロール装置
CN1271595C (zh) * 2001-12-17 2006-08-23 旭化成株式会社 语音识别方法
JP2004012884A (ja) * 2002-06-07 2004-01-15 Sharp Corp 音声認識装置
JP4283212B2 (ja) * 2004-12-10 2009-06-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 雑音除去装置、雑音除去プログラム、及び雑音除去方法

Also Published As

Publication number Publication date
JP2008203800A (ja) 2008-09-04

Similar Documents

Publication Publication Date Title
TWI398855B (zh) 多重麥克風聲音活動偵測器
JP2005084253A (ja) 音響処理装置、方法、プログラム及び記憶媒体
US8842851B2 (en) Audio source localization system and method
US9558755B1 (en) Noise suppression assisted automatic speech recognition
JP4837917B2 (ja) 音声に基づく装置制御
US8275120B2 (en) Adaptive acoustic echo cancellation
US10062372B1 (en) Detecting device proximities
US7957542B2 (en) Adaptive beamformer, sidelobe canceller, handsfree speech communication device
US20210067854A1 (en) Capturing and processing sound signals
JP4725422B2 (ja) エコーキャンセル回路、音響装置、ネットワークカメラ、及びエコーキャンセル方法
EP3061242B1 (en) Acoustic echo control for automated speaker tracking systems
CN103426433A (zh) 噪声消除方法
CN111199748A (zh) 回声消除方法、装置、设备以及存储介质
JP4438720B2 (ja) エコーキャンセラ及びマイク装置
JP2011066668A (ja) エコー除去装置、エコー除去方法、およびエコー除去装置のプログラム
JP2011069901A (ja) 雑音除去装置
CN108540680B (zh) 讲话状态的切换方法及装置、通话系统
JP4821648B2 (ja) 音声コントローラ
JP2006126841A (ja) 周期信号増強システム
JP5359744B2 (ja) 音処理装置及びプログラム
JP2004297791A (ja) エコーキャンセル装置、エコーキャンセル方法、プログラムおよび記録媒体
JP2006314051A (ja) エコー消去装置
JP2003255987A (ja) 音声認識を利用した機器の制御方法、制御装置及び制御プログラム
JP2004274683A (ja) エコーキャンセル装置、エコーキャンセル方法、プログラムおよび記録媒体
JP6748678B2 (ja) 情報処理装置、情報処理システム、制御プログラム、情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090924

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100917

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110809

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110822

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140916

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees