JP2016025619A - エコーキャンセラ装置 - Google Patents

エコーキャンセラ装置 Download PDF

Info

Publication number
JP2016025619A
JP2016025619A JP2014150679A JP2014150679A JP2016025619A JP 2016025619 A JP2016025619 A JP 2016025619A JP 2014150679 A JP2014150679 A JP 2014150679A JP 2014150679 A JP2014150679 A JP 2014150679A JP 2016025619 A JP2016025619 A JP 2016025619A
Authority
JP
Japan
Prior art keywords
signal
unit
echo
echo canceller
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014150679A
Other languages
English (en)
Inventor
栄治 三沢
Eiji Misawa
栄治 三沢
敏男 八木
Toshio Yagi
敏男 八木
泰正 柴田
Yasumasa Shibata
泰正 柴田
洋之 豊住
Hiroyuki Toyozumi
洋之 豊住
清嗣 新井
Kiyotsugu Arai
清嗣 新井
佐藤 克昌
Katsumasa Sato
克昌 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ARI KK
Original Assignee
ARI KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ARI KK filed Critical ARI KK
Priority to JP2014150679A priority Critical patent/JP2016025619A/ja
Publication of JP2016025619A publication Critical patent/JP2016025619A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 受話信号が出力されているにもかかわらず、それがスピーカで全く又はほとんど再生されなくなった場合でも、安定したエコーキャンセル性能を発揮し得るエコーキャンセラ装置を提供する。
【解決手段】 エコーキャンセラ装置30は、第一入力信号x1(k)をフィルタ係数h(k)によってフィルタ処理することにより第一出力信号y1(k)を生成する第一フィルタ部111と、第一目的信号d1(k)と第一出力信号y1(k)とを入力しこれらの差である第一誤差信号e1(k)を出力する第一減算部121と、第一誤差信号e1(k)が小さくなるようにフィルタ係数h(k)を適応アルゴリズムに基づいて修正する適応部13と、第一減算部121に入力される第一目的信号d1(k)に第一入力信号x1(k)を加える内部帰還部31と、を備えている。
【選択図】 図1

Description

本発明は、スピーカから再生された音声がマイクロホンで収音されることによって発生するエコー信号を除去するエコーキャンセラ装置に関する。
近年、音声認識は、認識性能の向上により、機器の操作手段として利用される場面が増加している。特に自動車分野においては、運転中の音声認識による手を使わない操作が、安全性の観点から注目されている。
例えば自動車用のナビゲーションシステムでは、地図情報、それに付随する各種の情報、エンタテーメント情報など種々の情報が収集され、それらの情報を基にした機器の操作が音声認識によって実行されている。つまり、自動車用のナビゲーションシステムは、運転者を含むユーザと会話しながら、それらに関連する機器を制御するのである。そこでは、ナビゲーションシステムがユーザとのコミュニケーションの主たる制御機能を司る。
このとき、ナビゲーションシステムは、ユーザと正しく会話をし、誤りなく制御指示を出すために、ユーザが発声した言葉を正確に認識する必要がある。そのため、ナビゲーションシステムには、自ら発したガイダンススピーチがエコー信号となって戻ってきた場合に、これをユーザの音声信号から取り除くためのエコーキャンセラ装置が具備されている(例えば特許文献1参照)。
図4は、関連技術1のエコーキャンセラ装置を示すブロック図である。以下、この図面に基づき説明する。
本関連技術1のエコーキャンセラ装置80は、自動車用のナビゲーションシステム90に組み込まれている。ナビゲーションシステム90は、スピーカ91、マイクロホン92、音声認識部93、主制御部94、ガイダンススピーチ生成部95などを備えている。
エコーキャンセラ装置80は、スピーカ91から再生された音声がマイクロホン92で収音されることによって発生するエコー信号y'(k)を、除去するものである。ここで、スピーカ91で再生される信号を入力信号x(k)とし、エコー信号y'(k)を含む信号を目的信号d(k)とする。「k」は離散的時間を表す変数である。
このとき、エコーキャンセラ装置80は、入力信号x(k)をフィルタ係数h(k)によってフィルタ処理することにより出力信号y(k)を生成するフィルタ部81と、目的信号d(k)と出力信号y(k)とを入力しこれらの差である誤差信号e(k)を出力する減算部82と、誤差信号e(k)が小さくなるようにフィルタ係数h(k)を適応アルゴリズムに基づいて修正する適応部83と、を備えている。
ユーザ100が発した音声は、マイクロホン92で収音されて送話信号Sinとなり、図示しないA/DコンバータによってA/D変換され、エコーキャンセラ装置80を経て送話信号Soutとなって音声認識部93へ出力される。音声認識部93は、その送話信号Soutを音声認識アルゴリズムによって解読し、その解読情報を主制御部94へ伝える。主制御部94は、その解読情報に基づいて適切なガイダンススピーチを決定し、これをガイダンススピーチ生成部95へ伝える。ガイダンススピーチ生成部95は、そのガイダンススピーチを音声合成して受話信号Rinとして出力する。受話信号Rinは、図示しないD/AコンバータによってD/A変換され、受話信号Routとなってスピーカ91で再生される。
図示するように、エコーキャンセラ装置80は、適応フィルタを用いた信号処理によって音響エコーを抑制する。そのエコーキャンセラの原理を説明する。スピーカ91で再生される入力信号x(k)と、マイクロホン92で受音されるエコー信号y'(k)とは、車内のインパルス応答h'(k)を用いて、y'(k)=x(k)*h'(k)(「*」は畳み込み演算を表す。)と関係付けられる。そこで、エコーキャンセラ装置80は、このインパルス応答h'(k)の推定値であるフィルタ係数h(k)を求め、これにより推定エコー信号である出力信号y(k)を作り、それをマイクロホン92で収音された目的信号d(k)から差し引くことで音響エコーを防止する。車内のインパルス応答h'(k)は、人の移動、ドアや窓の開閉などによって時間的変動を伴うため、その推定に適応部83が用いられる。適応部83は、誤差信号e(k)のパワーを最小にするように、フィルタ係数h(k)を逐次的に修正する。
なお、目的信号d(k)には、エコー信号y'(k)の他に、ユーザ100からの話者信号s(k)や、周囲雑音などのノイズn(k)が含まれる。また、エコーキャンセラ装置80は、入力信号x(k)と目的信号d(k)との時間差を調整する遅延調整部85や、誤差信号e(k)に含まれるノイズn(k)などを抑制するノイズ抑制部86等も備えている。
特許第5373473号公報 特開2002−204175号公報
しかしながら、関連技術1のエコーキャンセラ装置80では、次の(1)、(2)、(3)のような問題があった。
(1)適応部83は、最適なフィルタ係数h(k)の決定に、一定の学習時間を要する。そのため、スピーカ91からガイダンススピーチが発声された直後は、フィルタ係数h(k)がまだ収束していないため、エコー信号y'(k)を十分に除去できずに、残留エコーが発生することがある。例えば、エコーキャンセラ装置80が動作を初めて最初のガイダンススピーチの場合や、ガイダンススピーチの終了後から再びガイダンススピーチを始めるまでの間に、インパルス応答h'(k)が大きく変化した場合などに、このような現象が起きやすい。
(2)ノイズn(k)が大きくなるほど、インパルス応答h'(k)の推定値であるフィルタ係数h(k)を求めることが難しくなる。特に、ノイズn(k)がエコー信号y'(k)よりも大きくなり、ノイズn(k)にエコー信号y'(k)が埋もれてしまうと、エコー信号y'(k)がマイクロホン92に到達する伝達関数であるインパルス応答h'(k)を推定することはほぼ不可能となる。
(3)ユーザ100がミュート操作をしたりスピーカ用ボリュームを大きく下げたりすると、ガイダンススピーチ生成部95から受話信号Rinが出力されても、それがスピーカ91では全く又はほとんど再生されなくなる。この場合、インパルス応答h'(k)が大きく変化したことになるため、フィルタ係数h(k)の修正量が大きくなり、その収束までに時間がかかるので、この間のエコーキャンセル性能が大幅に低下する。
そこで、本発明の目的は、(1)スピーカから発声された直後でも、(2)ノイズが大きい場合でも、(3)受話信号が出力されているにもかかわらず、それがスピーカで全く又はほとんど再生されなくなった場合でも、安定したエコーキャンセル性能を発揮し得るエコーキャンセラ装置を提供することにある。
本発明に係るエコーキャンセラ装置は、
スピーカから再生された音声がマイクロホンで収音されることによって発生するエコー信号を除去するエコーキャンセラ装置であって、
前記スピーカで再生される信号を入力信号とし、前記エコー信号を含む信号を目的信号としたとき、
前記入力信号をフィルタ係数によってフィルタ処理することにより出力信号を生成するフィルタ部と、
前記目的信号と前記出力信号とを入力しこれらの差である誤差信号を出力する減算部と、
前記誤差信号が小さくなるように前記フィルタ係数を適応アルゴリズムに基づいて修正する適応部と、
前記減算部に入力される前記目的信号に前記入力信号を加える内部帰還部と、
を備えたものである。
本発明に係るエコーキャンセラ装置によれば、減算部に入力される目的信号に入力信号を加える内部帰還部を備えたことにより、ユーザがミュート操作をしたりスピーカ用ボリュームを大きく下げたりして、受話信号がスピーカから再生されなくなった場合でも、目的信号に含まれるエコー信号が実質的に極端に下がることはない。したがって、この場合のフィルタ係数の修正量を低減できるので、その収束に要する時間を短縮でき、安定したエコーキャンセル性能を発揮できる。
実施形態1のエコーキャンセラ装置を示すブロック図である。 参考例1のエコーキャンセラ装置を示すブロック図である。 参考例2のエコーキャンセラ装置を示すブロック図である。 関連技術1のエコーキャンセラ装置を示すブロック図である。 比較例1のエコーキャンセラ装置を示すブロック図である。
以下、添付図面を参照しながら、本発明を実施するための形態(以下「実施形態」という。)について説明する。なお、本明細書及び図面において、実質的に同一の構成要素については同一の符号を用いる。
図2は、参考例1のエコーキャンセラ装置を示すブロック図である。以下、この図面に基づき説明する。
本参考例1のエコーキャンセラ装置10は、自動車用のナビゲーションシステム41に組み込まれている。ナビゲーションシステム41は、スピーカ91、マイクロホン92、音声認識部93、主制御部94、ガイダンススピーチ生成部95などを備えている。ナビゲーションシステム41は、エコーキャンセラ装置10を除き、関連技術1のナビゲーションシステムと同じ構成である。
本参考例1のエコーキャンセラ装置10は、スピーカ91から再生された音声がマイクロホン92で収音されることによって発生するエコー信号y'(k)を除去するものである。ここで、スピーカ91で再生される信号を第一入力信号x1(k)とし、エコー信号y'(k)を含む信号を第一目的信号d1(k)とする。
このとき、エコーキャンセラ装置10は、第一入力信号x1(k)をフィルタ係数h(k)によってフィルタ処理することにより第一出力信号y1(k)を生成する第一フィルタ部111と、第一目的信号d1(k)と第一出力信号y1(k)とを入力しこれらの差である第一誤差信号e1(k)を出力する第一減算部121と、第一誤差信号e1(k)が小さくなるようにフィルタ係数h(k)を適応アルゴリズムに基づいて修正する適応部13と、第一目的信号d1(k)を一定時間τ遅らせて第二目的信号d2(k)として出力する第一遅延部141と、第一入力信号x1(k)を一定時間τ遅らせて第二入力信号x2(k)として出力する第二遅延部142と、適応部13で修正されたフィルタ係数h(k)によって第二入力信号x2(k)をフィルタ処理することにより第二出力信号y2(k)を生成する第二フィルタ部122と、第二目的信号d2(k)と第二出力信号y2(k)とを入力しこれらの差である第二誤差信号e2(k)を出力する第二減算部122と、を備えている。
また、一定時間τは、フィルタ係数h(k)が十分に収束するまでの時間(例えば100ms)に設定される。エコーキャンセラ装置10は、第一入力信号x1(k)と第一目的信号d1(k)との時間差を調整する遅延調整部15や、第二誤差信号e2(k)に含まれるノイズn(k)などを抑制するノイズ抑制部16等も備えている。ただし、それらの時間差やノイズn(k)が許容されれば、遅延調整部15やノイズ抑制部16は省略してもよい。エコーキャンセラ装置10のその他の構成は、関連技術1のエコーキャンセラ装置と同様である。
エコーキャンセラ装置10の各部は、例えばコンピュータプログラムによって、コンピュータ(例えばDSP)内に実現することができる。本コンピュータプログラムは、非一時的な記録媒体(non-transitory storage medium)、例えば光ディスク、半導体メモリなどに記録されてもよい。その場合、本コンピュータプログラムは、記録媒体からコンピュータによって読み出され、実行される。
次に、エコーキャンセラ装置10の動作について説明する。
適応部13は、第一出力信号y1(k)が第一目的信号d1(k)に似た信号になって、第一誤差信号e1(k)のパワーが小さくなるように、フィルタ係数h(k)を修正する。フィルタ係数h(k)の修正手順は、適応アルゴリズムと呼ばれ、各時刻kにおいて観測される第一入力信号x1(k)及び第一誤差信号e1(k)に基づいて、フィルタ係数h(k)を最適係数hoに近づけていく。適応部13の動作開始時刻k=0において、フィルタ係数h(k)には適当な初期値(例えば、h(0)=0)が与えられる。適応アルゴリズムは、各時刻kにおいて、次式<1>に示すように、フィルタ係数h(k)をh(k+1)に修正し、少しずつ最適係数に近づけていく。
h(k+1)=h(k)+δh(k) ・・・<1>
上式において、δh(k)は、修正ベクトルと呼ばれ、L次のベクトルである。適応アルゴリズムとしては、学習同定法、LMSアルゴリズム、射影アルゴリズム、RLSアルゴリズムなどが知られている。本参考例1では学習同定法を用いている。
新たなフィルタ係数h(k+1)は、第一フィルタ部111及び第二フィルタ部112の両方へ出力される。
第一フィルタ部111は、第一入力信号x1(k+1)と時刻k+1におけるフィルタ係数h(k+1)とから、次式<2>に基づき第一出力信号y1(k+1)を生成する。
y1(k+1)=x1(k+1)*h(k+1) ・・・<2>
そして、第一減算部121は、第一目的信号d1(k+1)及び第一出力信号y1(k+1)に基づいて、時刻k+1における第一誤差信号e1(k+1)を次式<3>のように決定する。
e1(k+1)=d1(k+1)−y1(k+1) ・・・<3>
一方、第二フィルタ部112は、一定時間τ遅れて入力した第一入力信号x1(k+1)である第二入力信号x2(k+1)と、時刻k+1+τにおけるフィルタ係数h(k+1+τ)とから、次式<4>に基づき第二出力信号y2(k+1)を生成する。
y2(k+1)=x2(k+1)*h(k+1+τ) ・・・<4>
そして、第二減算部122は、一定時間τ遅れて入力した第一目的信号d1(k+1)である第二目的信号d2(k+1)と第二出力信号y2(k+1)とに基づいて、時刻k+1における第二誤差信号e2(k+1)を次式<5>のように決定する。
e2(k+1)=d2(k+1)−y2(k+1) ・・・<5>
次に、エコーキャンセラ装置10の作用及び効果について説明する。
前述のように、適応部13は、最適なフィルタ係数h(k)の決定に、一定の学習時間を要する。そのため、スピーカ91からガイダンススピーチが発声された直後は、フィルタ係数h(k)がまだ収束していないため、第一誤差信号e1(k)からエコー信号y'(k)を十分に除去できないことがある。例えば、ガイダンススピーチの終了後、再びガイダンススピーチを始めるまでの間に、インパルス応答h'(k)があまり変化しなければ、ガイダンススピーチ再開後のフィルタ係数h(k)も速やかに収束する。ところが、ガイダンススピーチの終了後、再びガイダンススピーチを始めるまでの間に、インパルス応答h'(k)が大きく変化した場合は、第一誤差信号e1(k)をそのまま使って音声認識をすると、第一誤差信号e1(k)に含まれるエコー信号y'(k)によってその認識率が低下してしまう。また、エコーキャンセラ装置10が動作を初めて最初のガイダンススピーチの場合も、フィルタ係数h(k)が収束するまでに時間がかかることがある。
そこで、エコーキャンセラ装置10では、第一目的信号d1(k)を一定時間τ遅らせて第二目的信号d2(k)とし、第一入力信号x1(k)を一定時間τ遅らせて第二入力信号x2(k)とし、一定時間τ経過して収束の進んだフィルタ係数h(k)を用いて第二入力信号x2(k)をフィルタ処理することにより第二出力信号y2(k)を生成し、第二出力信号y2(k)及び第二目的信号d2(k)から第二誤差信号e2(k)を求めるようにしたので、スピーカ91から発声された直後でも、第二誤差信号e2(k)に含まれるエコー信号y'(k)を確実に除去でき、これにより安定したエコーキャンセル性能を発揮できる。
次に、エコーキャンセラ装置10について、言葉を変えてもう一度説明する。
エコーキャンセラの基本機能は、スピーカ91から出力される音声(ガイダンススピーチ)が空間を伝播しマイクロホン92に入力されるまでの伝達関数であるインパルス応答h'(k)を、スピーカ91から出力される受話信号Routと、マイクロホン92より収音される送話信号Sinとにより推定することである。この推定は、ユーザ100からの話者信号s(k)のない状況で実施する。
スピーカ91からガイダンススピーチが出ている状況において、ユーザ100が認識目的の音声を発すると、それらの音がマイクロホン92で収音される。そして、エコーキャンセラ装置10にてインパルス応答h'(k)を推定した演算を行うことによって、ガイダンススピーチ成分が削除され、ユーザ100の音声が音声認識部93に伝送される。
系の推定は学習同定法によって行なわれる。伝達関数を実現するフィルタ係数h(k)は、スピーカ91やマイクロホン92の位置の変化、スピーカ91からのガイダンススピーチや外部騒音の急激な変化、などの経路変動に追従して同定される。
このとき、フィルタ係数h(k)は、系の変化に対して一定時間の学習をもって決定される。そのため、系が変動した瞬間は系が収束していないことから、スピーカ91からのエコー信号y'(k)は消去し切れずに残留エコーが発生する。つまり、学習の初期の時点では、フィル係数h(k)が同定中であるため、残留エコー成分がより多く残ることになる。
このように、伝達関数同定の初期の部分では、実際の系の状態とは全く異なったフィルタ係数h(k)となっているため、残留エコーが発生する。これに対して、エコーキャンセラ装置10は、例えばガイダンススピーチが発声された直後など、学習の期間がほとんどない場合においても残留エコーを低減できる。ここで、適応フィルタでのエコー成分の計算を開始する前に、事前に適応フィルタの同定を行っておくこととする。本参考例1では、システム同定部分とエコー成分計算部分とを分離し、時間差を与えてエコーキャンセルできる構成としている。この構成により、エコーキャンセルの初期状態でも、フィルタ係数h(k)は系の特徴を現す値となっており、エコー信号をキャンセルできるようにしている。
図3は、参考例2のエコーキャンセラ装置を示すブロック図である。以下、この図面に基づき説明する。
本参考例2のエコーキャンセラ装置20は、自動車用のナビゲーションシステム42に組み込まれている。ナビゲーションシステム42は、エコーキャンセラ装置20を除き、参考例1のナビゲーションシステムと同じ構成である。
エコーキャンセラ装置20は、ゲイン係数g(k)を調整することによって第一目的信号d1(k)に含まれるノイズn(k)を抑制し第一減算部121へ出力する第一ノイズ抑制部21と、第一ノイズ抑制部21で調整されたゲイン係数g(k)を用いて第一ノイズ抑制部21と同様のノイズ抑制処理を第一入力信号x1(k)に対して実施し、処理された第一入力信号x1(k)を第一フィルタ部111及び適応部13へ出力する第二ノイズ抑制部22と、を更に備えている。
第一ノイズ抑制部21は、第一目的信号d1(k)に含まれるノイズn(k)を推定し、そのノイズn(k)に応じて周波数ごとに減衰させる割合(ゲイン係数g(k))決定する一般的なものであり、時間的に変化するゲイン係数g(k)を有する時変フィルタである。第二ノイズ抑制部22は、第一ノイズ抑制部21で調整されたゲイン係数g(k)をそのまま用いる時変フィルタである。第二ノイズ抑制部22を設ける理由は、ノイズ抑制処理されたエコー信号y'(k)と同様のノイズ抑制処理を第一入力信号x1(k)にも施すことにより、ノイズ抑制処理されたエコー信号y'(k)に近い第一出力信号y1(k)を得るためである。第二ノイズ抑制部22は、自らはノイズn(k)を推定できないので、第一ノイズ抑制部21で調整されたゲイン係数g(k)を用いる。
第一ノイズ抑制部21及び第二ノイズ抑制部22の具体例としては、SNR(Speech to Noise Ratio)を推定し、そのSNRに応じて抑圧係数(ゲイン係数g(k))を補正し、その抑圧係数を用いてノイズ抑制を行うものが挙げられる(特許文献2参照)。
エコーキャンセラ装置20のその他の構成は、参考例1のエコーキャンセラ装置の構成と同様である。ただし、第一遅延部141及び第二遅延部142は省略してもよい。
次に、エコーキャンセラ装置20の作用及び効果について説明する。
ノイズn(k)が大きくなるほど、インパルス応答h'(k)の推定値であるフィルタ係数h(k)を求めることが難しくなる。そこで、第一減算部121の前段に第一ノイズ抑制部21を置き、第一フィルタ部111及び適応部13の前段に第二ノイズ抑制部22を置くことにより、第一目的信号d1(k)に含まれるノイズn(k)を抑制してフィルタ係数h(k)を求められるようにする。
一方、図5に示す比較例1のエコーキャンセラ装置80’及びナビゲーションシステム90’は、関連技術1のエコーキャンセラ装置及びナビゲーションシステムに、本参考例2における第一ノイズ抑制部21及び第二ノイズ抑制部22を設けたものである。この構成によれば、ノイズn(k)が大きくてもフィルタ係数h(k)を求めることができるものの、誤差信号e(k)に含まれる話者信号s(k)に歪が生じることにより、音声認識率が低下してしまう。なぜなら、目的信号d(k)に含まれる話者信号s(k)も、第一ノイズ抑制部21によってノイズ抑制処理が施されてしまうからである。
そこで、本参考例2では、ノイズ抑制処理された第一目的信号d1(k)を用いてフィルタ係数h(k)を求める第一フィルタ部111とは別に、ノイズ抑制処理されていない第二目的信号d2(k)を用いてエコーキャンセルする第二フィルタ部112を設けることにより、第二誤差信号e2(k)に含まれる話者信号s(k)に歪が生じないようにしている。
このように、エコーキャンセラ装置20によれば、第一ノイズ抑制部21及び第二ノイズ抑制部22を設けたことにより、ノイズn(k)が大きくてもフィルタ係数h(k)を求めることができるので、安定したエコーキャンセル性能を発揮できる。これに加え、ノイズ抑制処理された第一目的信号d1(k)を用いてフィルタ係数を求めるとともに、ノイズ抑制処理されていない第二目的信号d2(k)を用いてエコーキャンセルすることにより、第二目的信号d2(k)に含まれる話者信号s(k)の歪みを抑えつつ、安定したエコーキャンセル性能を発揮できる。本参考例2のエコーキャンセラ装置20のその他の作用及び効果は、参考例1のエコーキャンセラ装置のそれらと同様である。
次に、エコーキャンセラ装置20について、言葉を変えてもう一度説明する。
スピーカ91からのガイダンススピーチがマイクロホン92に入力するまでの系の推定において、大きな外乱雑音が発生しているとする。この場合、スピーカ91からのガイダンススピーチレベルが外乱雑音レベルより高ければ、伝達関数であるインパルス応答h'(k)は精度が劣化するものの推定が可能となるので、エコーキャンセルは機能する。このとき、エコーがキャンセルされた信号には外乱雑音成分を含んでいるが、ノイズ抑制部16により外乱雑音成分が減衰され、話者音声が音声認識部93へ伝送される。
しかし、外乱雑音がスピーカ91から出力されるガイダンススピーチよりも大きく、ガイダンススピーチがノイズの中に埋もれてしまっている場合、この音声信号がマイクロホン92に到達する伝達関数を推定することはほぼ不可能となる。
そこで、ガイダンススピーチが外部雑音に埋もれてしまっている状況を解決するため、エコーキャンセラ構成の前段に第一ノイズ抑制部21を置き、スピーカ91からのガイダンススピーチレベルよりも外部雑音レベルを低くして、伝達関数を求める。このとき、第二ノイズ抑制部22も設けることにより、第一ノイズ抑制部21の影響を打ち消すようにしている。
スピーカ91からガイダンススピーチが流れておりユーザ100からの発声が無い状態を「シングルトーク」、スピーカ91からガイダンススピーチが流れている最中にユーザ100からの発声が有る状態を「ダブルトーク」という。
ここで、図5に示す比較例1では、第一ノイズ抑制部21及び第二ノイズ抑制部22によるノイズ抑制処理が施された音声信号は、ノイズが除去されているものの、残った音声の品質がシングルトーク区間とダブルトーク区間とでは異なるものとなる。つまり、ダブルトーク区間では、正確にスペクトルが再現されず音声に劣化が生じ、そのエコーキャンセラ出力の音声品質も劣化するため、送話信号Soutを用いた音声認識率が低下する。
その劣化の原因は、次のとおりである。エコーキャンセラ処理では、エコー成分を除去する際に、システム同定によって得られた正確な(位相も含めて)伝達関数に基づき作成した予測信号を減算する。これに対し、ノイズ抑制処理では、信号の統計的性質を利用してノイズを推定してそれを減算するので、エコーキャンセラの予測ほどの精度はない。つまり、ノイズ抑制処理は、ダブルトーク状態の統計モデルは想定していない。そのため、ノイズ抑制処理された音声信号に対しエコーキャンセラ処理を行うと、ダブルトーク時の音質が劣化することにより、音声認識率が劣化する。
そこで、本参考例2では、エコーキャンセラの同定処理のみにノイズ抑制処理を施した信号を用い、エコーキャンセリング処理においてはノイズ抑制処理を施さない信号を用いることにより、ダブルトーク時のエコーキャンセラ出力音声の品質を確保し、音声認識率を向上させる。
以上説明したように、ノイズ抑制処理された音声信号に対しエコーキャンセラ処理を実施すると、ダブルトーク時の音質が劣化し、音声認識率が劣化するという問題がある。この問題を解決するため、本参考例2では、ノイズ抑制処理をして外部雑音を抑圧した信号を、適応フィルタ係数を算出する同定処理に用い、ノイズ抑制処理をしない元の信号を、エコーキャンセル処理に用いる構成にしたことにより、ダブルトーク時の音声品質の劣化を抑制することができる。なお、図3の構成は、参考例1のタイムシフト・エコーキャンル方式の構成に、本参考例2のダブルトーク時品質劣化抑圧方式を適用したものである。
図1は、実施形態1のエコーキャンセラ装置を示すブロック図である。以下、この図面に基づき説明する。
本実施形態1のエコーキャンセラ装置30は、自動車用のナビゲーションシステム43に組み込まれている。ナビゲーションシステム43は、エコーキャンセラ装置30を除き、参考例1又は2のナビゲーションシステムと同じ構成である。
エコーキャンセラ装置30は、第一減算部121及び第一遅延部141に入力される第一目的信号d1(k)に第一入力信号x1(k)を加える内部帰還部31を更に備えている。内部帰還部31は、第一入力信号x1(k)を一定のゲインで減衰又は増幅するアンプ32と、アンプ32で減衰又は増幅された第一入力信号x1(k)を第一目的信号d1(k)に加える加算器33と、を有する。
エコーキャンセラ装置30のその他の構成は、参考例2のエコーキャンセラ装置の構成と同様である。
また、第一遅延部141、第二遅延部142、第二フィルタ部112、第二減算部122、第一ノイズ抑制部21及び第二ノイズ抑制部22は省略してもよい。その場合のエコーキャンセラ装置30は、第一入力信号x1(k)をフィルタ係数h(k)によってフィルタ処理することにより第一出力信号y1(k)を生成する第一フィルタ部111と、第一目的信号d1(k)と第一出力信号y1(k)とを入力しこれらの差である第一誤差信号e1(k)を出力する第一減算部121と、第一誤差信号e1(k)が小さくなるようにフィルタ係数h(k)を適応アルゴリズムに基づいて修正する適応部13と、第一減算部121に入力される第一目的信号d1(k)に第一入力信号x1(k)を加える内部帰還部31と、を備えたものとなる。ここで、「第一入力信号x1(k)」、「第一目的信号d1(k)」、「第一出力信号y1(k)」、「第一誤差信号e1(k)」及び「第一減算部121」は、それぞれ特許請求の範囲における「入力信号」、「目的信号」、「出力信号」、「誤差信号」、「減算部」の一例に相当する。
次に、エコーキャンセラ装置30の作用及び効果について説明する。
エコーキャンセラ装置30によれば、第一減算部121及び第一遅延部141に入力される第一目的信号d1(k)に第一入力信号x1(k)を加える内部帰還部31を備えたことにより、ユーザ100がミュート操作をしたりスピーカ用ボリュームを大きく下げたりして、受話信号Routがスピーカ91から再生されなくなった場合でも、第一目的信号d1(k)に実質的に含まれるエコー信号y'(k)が極端に下がることはない。したがって、この場合のフィルタ係数h(k)の修正量を低減できるので、その収束に要する時間を短縮でき、安定したエコーキャンセル性能を発揮できる。本実施形態1のエコーキャンセラ装置30のその他の作用及び効果は、参考例2のエコーキャンセラ装置のそれらと同様である。
次に、エコーキャンセラ装置30について、言葉を変えてもう一度説明する。
車室内においてユーザ100がミュート操作又はボリューム絞り切りなどの操作を行った場合は、急激な伝達関数の変化が起こり、フィルタ係数h(k)の修正量は大きく、全く別物の収束処理になってしまう。この状態から復帰する場合も、フィルタ係数h(k)の修正量が大きいため収束に時間がかかり、この間のエコーキャンセル性能は大幅に低下する。そこで、本実施形態1は、例えばスピーカ91からのガイダンススピーチ発声中にスピーカ91の出力をミュートするなど、急激は音響環境の変化が起こった際にも、安定的にエコーキャンセラ出力を保つようにするものである。
本実施形態1では、内部帰還部31を設けることにより、エコー経路の変動に対してフィルタ係数h(k)の修正量を小さくし、その追従性能を向上させる。これにより、通常起こりうる操作であるミュートなどの特異な状態においても、エコーキャンセラの動作の安定を確保する。
内部帰還部31は、音響系によるエコーリーターンパスと並列に、内部で遅延時間調整後の参照信号(第一入力信号x1(k))を、マイクロホン92から入力した第一目的信号d1(k)に加算する。これにより、スピーカ91のミュート操作を行った場合でも、エコーリターンロスは−∞にはならず、数デシベル変化するだけに留まり、その場合のフィルタ係数h(k)の修正量は小さい。内部帰還により与えられた信号は、単純遅延であるのでエコーキャンセラで完全に除去されることから、出力に現れることはない。
以上、上記実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細については、当業者が理解し得るさまざまな変更を加えることができる。
上記の実施形態の一部又は全部は以下の付記のようにも記載され得るが、本発明は以下の構成に限定されるものではない。
(付記1)スピーカから再生された音声がマイクロホンで収音されることによって発生するエコー信号を除去するエコーキャンセラ装置であって、
前記スピーカで再生される信号を第一入力信号とし、前記エコー信号を含む信号を第一目的信号としたとき、
前記第一入力信号をフィルタ係数によってフィルタ処理することにより第一出力信号を生成する第一フィルタ部と、
前記第一目的信号と前記第一出力信号とを入力しこれらの差である第一誤差信号を出力する第一減算部と、
前記第一誤差信号が小さくなるように前記フィルタ係数を適応アルゴリズムに基づいて修正する適応部と、
前記第一目的信号を一定時間遅らせて第二目的信号として出力する第一遅延部と、
前記第一入力信号を前記一定時間遅らせて第二入力信号として出力する第二遅延部と、
前記適応部で修正された前記フィルタ係数によって前記入力信号をフィルタ処理することにより第二出力信号を生成する第二フィルタ部と、
前記第二目的信号と前記第二出力信号とを入力しこれらの差である第二誤差信号を出力する第二減算部と、
を備えたエコーキャンセラ装置。
(付記2)スピーカから再生された音声がマイクロホンで収音されることによって発生するエコー信号を除去するエコーキャンセラ装置であって、
前記スピーカで再生される信号を入力信号とし、前記エコー信号を含む信号を目的信号としたとき、
ゲイン係数を調整することによって前記目的信号に含まれるノイズを抑制する第一ノイズ抑制部と、
この第一ノイズ抑制部で調整された前記ゲイン係数を用いて前記第一ノイズ抑制部と同様のノイズ抑制処理を前記入力信号に対して実施する第二ノイズ抑制部と、
前記ノイズ抑制処理がされた前記入力信号をフィルタ係数によってフィルタ処理することにより第一出力信号を生成する第一フィルタ部と、
前記ノイズ抑制処理がされた前記目的信号と前記第一出力信号とを入力しこれらの差である第一誤差信号を出力する第一減算部と、
前記第一誤差信号が小さくなるように前記フィルタ係数を適応アルゴリズムに基づいて修正する適応部と、
前記適応部で修正された前記フィルタ係数によって、前記ノイズ抑制処理がされていない前記入力信号をフィルタ処理することにより第二出力信号を生成する第二フィルタ部と、
前記ノイズ抑制処理がされていない前記目的信号と前記第二出力信号とを入力しこれらの差である第二誤差信号を出力する第二減算部と、
を備えたエコーキャンセラ装置。
本発明に係るエコーキャンセラ装置は、前述のナビゲーションシステムの他、携帯電話や固定電話のハンズフリー使用、インターネットによるWeb会議システムなどで使われている、スピーカとマイクロホンを利用した双方向通信に利用可能である。
<参考例1>
10 エコーキャンセラ装置
111 第一フィルタ部
112 第二フィルタ部
121 第一減算部
122 第二減算部
13 適応部
141 第一遅延部
142 第二遅延部
15 遅延調整部
16 ノイズ抑制部
41 ナビゲーションシステム
91 スピーカ
92 マイクロホン
93 音声認識部
94 主制御部
95 ガイダンススピーチ生成部
100 ユーザ
y'(k) エコー信号
x1(k) 第一入力信号
x2(k) 第二入力信号
d1(k) 第一目的信号
d2(k) 第二目的信号
h(k) フィルタ係数
y1(k) 第一出力信号
y2(k) 第二出力信号
e1(k) 第一誤差信号
e2(k) 第二誤差信号
s(k) 話者信号
n(k) ノイズ
h'(k) インパルス応答
Sin,Sout 送話信号
Rin,Rout 受話信号
<参考例2>
20 エコーキャンセラ装置
21 第一ノイズ抑制部
22 第二ノイズ抑制部
42 ナビゲーションシステム
<実施形態1>
30 エコーキャンセラ装置
31 内部帰還部
32 アンプ
33 加算器
43 ナビゲーションシステム
<関連技術1>
80 エコーキャンセラ装置
81 フィルタ部
82 減算部
83 適応部
85 遅延調整部
86 ノイズ抑制部
90 ナビゲーションシステム
x(k) 入力信号
d(k) 目的信号
y(k) 出力信号
e(k) 誤差信号
<比較例1>
80’ エコーキャンセラ装置
90’ ナビゲーションシステム

Claims (2)

  1. スピーカから再生された音声がマイクロホンで収音されることによって発生するエコー信号を除去するエコーキャンセラ装置であって、
    前記スピーカで再生される信号を入力信号とし、前記エコー信号を含む信号を目的信号としたとき、
    前記入力信号をフィルタ係数によってフィルタ処理することにより出力信号を生成するフィルタ部と、
    前記目的信号と前記出力信号とを入力しこれらの差である誤差信号を出力する減算部と、
    前記誤差信号が小さくなるように前記フィルタ係数を適応アルゴリズムに基づいて修正する適応部と、
    前記減算部に入力される前記目的信号に前記入力信号を加える内部帰還部と、
    を備えたエコーキャンセラ装置。
  2. 請求項1記載のエコーキャンセラ装置を備えたナビゲーションシステムであって、
    前記スピーカからガイダンススピーチを再生する、
    ナビゲーションシステム。
JP2014150679A 2014-07-24 2014-07-24 エコーキャンセラ装置 Pending JP2016025619A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014150679A JP2016025619A (ja) 2014-07-24 2014-07-24 エコーキャンセラ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014150679A JP2016025619A (ja) 2014-07-24 2014-07-24 エコーキャンセラ装置

Publications (1)

Publication Number Publication Date
JP2016025619A true JP2016025619A (ja) 2016-02-08

Family

ID=55272000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014150679A Pending JP2016025619A (ja) 2014-07-24 2014-07-24 エコーキャンセラ装置

Country Status (1)

Country Link
JP (1) JP2016025619A (ja)

Similar Documents

Publication Publication Date Title
WO2016013667A1 (ja) エコーキャンセラ装置
US9807503B1 (en) Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device
JP5629372B2 (ja) 聴取者に対する環境雑音の効果を低減させる方法および装置
JP4283212B2 (ja) 雑音除去装置、雑音除去プログラム、及び雑音除去方法
US20190222691A1 (en) Data driven echo cancellation and suppression
KR100806769B1 (ko) 신호 처리 방법 및 장치
JP4913155B2 (ja) 音響エコーキャンセラ
US9286883B1 (en) Acoustic echo cancellation and automatic speech recognition with random noise
US20180190258A1 (en) Adaptations for active noise cancellation inside a vehicle
KR20170097732A (ko) 피드백 적응 잡음 소거의 성능 및 안정성 제어를 위한 회로 및 방법
CN111052767B (zh) 音频处理装置、音频处理方法以及信息处理装置
JP2007312364A (ja) 音響信号処理における均等化
JP2005323084A (ja) 音響エコー消去方法、音響エコー消去装置、音響エコー消去プログラム
US10129410B2 (en) Echo canceller device and echo cancel method
US8406430B2 (en) Simulated background noise enabled echo canceller
JP2003188776A (ja) 音響エコー消去方法、装置及び音響エコー消去プログラム
JP4920511B2 (ja) マルチチャンネルエコーキャンセラ
JP5373473B2 (ja) 音声抽出装置
JP2016025619A (ja) エコーキャンセラ装置
JP2016025618A (ja) エコーキャンセラ装置
KR102045953B1 (ko) 칼만필터 기반의 다채널 입출력 음향학적 반향 제거 방법
JP2008263441A (ja) 非線形エコーキャンセラ装置
JP4317526B2 (ja) 音響エコー消去方法、装置、プログラム、記録媒体
JP2014181988A (ja) オーディオ装置
JP4313294B2 (ja) 音声出力装置