JP4833343B2 - エコー及びノイズキャンセレーション - Google Patents

エコー及びノイズキャンセレーション Download PDF

Info

Publication number
JP4833343B2
JP4833343B2 JP2010019147A JP2010019147A JP4833343B2 JP 4833343 B2 JP4833343 B2 JP 4833343B2 JP 2010019147 A JP2010019147 A JP 2010019147A JP 2010019147 A JP2010019147 A JP 2010019147A JP 4833343 B2 JP4833343 B2 JP 4833343B2
Authority
JP
Japan
Prior art keywords
echo
signal
adaptive filter
filter
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010019147A
Other languages
English (en)
Other versions
JP2010171985A (ja
Inventor
マオ シャドン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Interactive Entertainment Inc
Sony Computer Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/418,988 external-priority patent/US8160269B2/en
Priority claimed from US11/381,728 external-priority patent/US7545926B2/en
Priority claimed from US11/381,724 external-priority patent/US8073157B2/en
Priority claimed from US11/381,729 external-priority patent/US7809145B2/en
Priority claimed from US11/429,047 external-priority patent/US8233642B2/en
Priority claimed from US11/418,989 external-priority patent/US8139793B2/en
Priority claimed from PCT/US2006/017483 external-priority patent/WO2006121896A2/en
Priority claimed from US11/381,727 external-priority patent/US7697700B2/en
Priority claimed from US11/381,725 external-priority patent/US7783061B2/en
Priority claimed from US11/381,721 external-priority patent/US8947347B2/en
Application filed by Sony Interactive Entertainment Inc, Sony Computer Entertainment Inc filed Critical Sony Interactive Entertainment Inc
Publication of JP2010171985A publication Critical patent/JP2010171985A/ja
Application granted granted Critical
Publication of JP4833343B2 publication Critical patent/JP4833343B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Description

[優先権の主張]
本出願は、本出願と譲受人が共通であって本出願と同時に係属する特許文献1の恩恵を主張し、その開示内容全体をここに援用する。本出願は、本出願と譲受人が共通であって本出願と同時に係属する特許文献2の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献3の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献4の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献5の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献6の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献7の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献8の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献9の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献10の恩恵を主張し、その開示内容全体をここに援用する。
米国特許出願 第11/381,728号,シャドン マオ, "ECHO AND NOISE CANCELATION", 2006年5月4日出願, (代理人整理番号SCEA05064US00) 米国特許出願 第11/381,729号,シャドン マオ, "ULTRA SMALL MICROPHONE ARRAY", 2006年5月4日出願, (代理人整理番号SCEA05062US00) 米国特許出願 第11/381,725号,シャドン マオ, "METHODS AND APPARATUS FOR TARGETED SOUND DETECTION", 2006年5月4日出願, (代理人整理番号SCEA05072US00), 米国特許出願 第11/381,727号,シャドン マオ, "NOISE REMOVAL FOR ELECTRONIC DEVICE WITH FAR FIELD MICROPHONE ON CONSOLE", 2006年5月4日出願, (代理人整理番号SCEA05073US00) 米国特許出願 第11/381,724号,シャドン マオ, "METHODS AND APPARATUS FOR TARGETED SOUND DETECTION AND CHARACTERIZATION", 2006年5月4日出願, (代理人整理番号SCEA05079US00) 米国特許出願 第11/381,721号,シャドン マオ, "SELECTIVE SOUND SOURCE LISTENING IN CONJUNCTION WITH COMPUTER INTERACTIVE PROCESSING", 2006年5月4日出願, (代理人整理番号SCEA04005 JUMBOUS) PCT出願 PCT/US06/17483号,シャドン マオ, "SELECTIVE SOUND SOURCE LISTENING IN CONJUNCTION WITH COMPUTER INTERACTIVE PROCESSING", 2006年5月4日出願, (代理人整理番号SCEA04005 JUMBOPCT) 米国特許出願 第11/418,988号,シャドン マオ, "METHODS AND APPARATUSES FOR ADJUSTING A LISTENING AREA FOR CAPTURING SOUNDS", 2006年5月4日出願, (代理人整理番号SCEA-00300) 米国特許出願 第11/418,989号,シャドン マオ, "METHODS AND APPARATUSES FOR CAPTURING AN AUDIO SIGNAL BASED ON VISUAL IMAGE", 2006年5月4日出願, (代理人整理番号SCEA-00400) 米国特許出願 第11/429,047号,シャドン マオ, "METHODS AND APPARATUSES FOR CAPTURING AN AUDIO SIGNAL BASED ON A LOCATION OF THE SIGNAL", 2006年5月4日出願, (代理人整理番号SCEA-00500)
[本発明の技術分野]
本発明は、音響信号処理に関し、とくに、音響信号処理におけるエコーおよびキャンセリングに関する。
インタラクティブテレビゲームコントローラなどのような多くの携帯電子装置は、双方向音響信号を扱うことができる。このような装置は、典型的にはその装置のユーザからのローカルスピーチ信号s(t)を受けるマイクロフォンと、ユーザが聞くことができるスピーカ信号x(t)を発信するスピーカとを備える。テレビゲームコントローラをより小型化するために、マイクロフォンとスピーカは、比較的近く(例えば20cm以内など)に設置することが望ましい。これに対してユーザは、マイクロフォンからより離れたところ(例えば3メートルから5メートルなど)に位置するかもしれない。マイクロフォンはローカルスピーチ信号s(t)とスピーカエコー信号x(t)との両方を含む信号d(t)を生成する。これに加えて、マイクロフォンはバックグランドノイズn(t)を受けるかもしれない。そのため、全体のマイクロフォン信号は、d(t)=s(t)+x(t)+n(t)となる。比較的スピーカの近傍にあるため、マイクロフォン信号d(t)は、スピーカエコー信号x(t)によって、占められるかもしれない。
電気通信の応用例において、スピーカエコーは広くみられる現象であり、エコーサプレッションとエコーキャンセレーションは比較的成熟した手法である。エコーサプレッサは、回線において1方向に向かう音声信号の存在を検出した場合に作動し、他の方向に大きな損失を挿入する。通常、回線の遠端にあるエコーサプレッサが回線の近端からの音声を検出した場合に、そのエコーサプレッサがこの損失を加える。この加えられた損失により、スピーカ信号x(t)が、ローカルスピーチ信号d(t)へと再送出されることを阻止することができる。
エコーサプレッションは効果的ではあるが、多くの場合、いくつかの問題につながる。例えば、ローカルスピーチ信号s(t)とリモートスピーカ信号x(t)は、少なくとも短時間に限れば、同時に生ずることがよくある。この状況はダブルトークとも呼ばれる。リモートスピーカ信号のみが存在するような状況は、リモートシングルトークとも呼ばれる。各エコーサプレッサが回路の遠端(far-end)からの音声エネルギを検出するため、その結果、通常、同時に双方向に損失が挿入されることとなり、両側の通話がブロックされる。これを防止するため、エコーサプレッサを、近端のスピーカからの音声アクティビティのみを検出するように設定することができる。これにより、近端話者と遠端話者が同時に話しているときには、損失が挿入されなくなる(または、より小さい損失のみ挿入される)。残念ながら、これは、当初のエコーサプレッサの効果まで、一時的にうち消してしまう。
さらに、エコーサプレッサは、交互に、損失を挿入し、除去するため、新たな話者が話し始めたときにしばしば小さな遅延が生じ、その話者のスピーチの初めの方の音がクリッピングされてしまう。さらに、遠端の相手方の周囲がうるさいときには、遠端話者が話しているときには、近端話者にそのバックグラウンド音が聞こえるが、近端話者が話し始めるとエコーサプレッサがそのバックグラウンド音を抑制する。これにより、バックグラウンド音が突然無くなるため、近端のユーザは回線が切れたかのような印象を受けることになる。
上述の問題に対処するため、エコーキャンセレーション手法が開発された。エコーキャンセレーションは、アナログまたはデジタルフィルタを用いて、望ましくないノイズやエコーを入力信号から取り除き、フィルタリング処理された信号e(t)を生成する。エコーキャンセレーションにおいては、スピーチモデルを計算するために複雑なアルゴリズム手順が用いられる。この手順は、マイクロフォン信号d(t)と、リモート信号x(t)の一部を、エコーキャンセレーションプロセッサに入力するステップと、スピーカエコー信号x(t)を予測するステップと、そしてこれをマイクロフォン信号d(t)から差し引ステップとを含む。エコー予測方式は、適用(adaptation)として知られるプロセスにおいて、エコーキャンセレーションプロセッサにより学習されなければならない。
このような手法の効果は、エコー抑制比(ESR:echo supression ratio)によって測定される。これは単に、マイクロフォンが受ける真のエコーエネルギと、フィルタリング処理された信号x(t)に残る残余エコーエネルギとの比である(典型的にはデシベルで表される)。国際電気通信ユニオン(ITC)が定めた基準によると、リモートシングルトークの場合、エコーレベルについて、少なくとも45デシベルの減衰が必要である。ダブルトークの最中(または強いバックグラウンドノイズの最中)には、この減衰レベルは30デシベルまで低くなってもよい。しかしながら、これらの推奨基準は、ローカルスピーチ信号を発生するユーザが、マイクロフォンに、より近いようなシステムにおいて開発されたものである。したがって録音されたSN比(ターゲット音声エネルギのエコーノイズエネルギに対する比)は、大抵、5デシベルよりも良い。例えばテレビゲームコントローラのような、ユーザが3メートルから5メートルも離れており、オープンマイクロフォンから0.5メートルよりも近傍にあるラウドスピーカが大きなエコーを発生するようなアプリケーションにおいては、これらの推奨基準はあてはまらない。このようなアプリケーションにおいては、SN比は−15デシベルから−30デシベル未満であろう。リモートシングルトークにおいては60デシベル以上のESR、ダブルトークについては35デシベル以上ESRが要求されるかもしれない。現存のエコーキャンセレーション手法ではこのような高いESRレベルを達成することができない。
したがって、当該技術分野においては前述の不利な点を克服するエコーキャンセレーションシステムおよび方法が必要とされている。
[発明の概要]
前述の不利な点を克服するため、本発明の実施形態は、スピーカとマイクロフォンを有するシステムにおけるエコーキャンセレーション方法および装置に照準を合わせる。スピーカはスピーカ信号x(t)を受信する。マイクロフォンは、ローカル信号s(t)とエコー信号x(t)を含むマイクロフォン信号d(t)を受け取る。エコー信号x(t)は、スピーカ信号x(t)に依存する。マイクロフォン信号d(t)は、互いに相補的なエコーキャンセレーション特性を有する第1適応フィルタ、および第2適応フィルタによって、パラレルにフィルタリング処理される。最小エコー出力e(t)は、第1適応フィルタからの出力e(t)と、第2適応フィルタからの出力e(t)か決定される。最小エコー出力のエネルギはより小さく、最小エコー出力とスピーカ信号x(t)との間の相関はより小さい。そして、マイクロフォン出力が、最小エコー出力e(t)を用いて生成される。オプションとして、残差エコーキャンセレーション、かつ/または、ノイズキャンセレーションが、最小エコー出力に適用されてもよい。
本発明の実施形態にかかるエコーキャンセレーション装置の概略図である。 図1Aのエコーキャンセレーション装置において用いられうる音声アクティビティ検出適応フィルタの概略図である。 図1Aのエコーキャンセレーション装置において用いられうる相互相関解析を伴う適応フィルタの概要図である。 本発明の実施形態にかかるエコーキャンセレーション方法を説明するフローチャートである。 本発明の実施形態にかかるエコーキャンセレーションのための別の方法を説明するフローチャートである。 本発明の別の実施形態にかかるエコーキャンセレーション装置の概略図である。
[具体的な実施形態の説明]
以下の詳細な説明は、説明の目的のため、具体的な細部を含むが、本発明の範囲内において、後述の細部について多くの変形や変更が可能であることは、当該技術分野において通常の知識を有する者に理解されるところである。したがって、以下に記述される本発明の実施例の説明により、特許請求の範囲に記載されている発明が一般性を失うことなく、また、以下の説明は、特許請求の範囲に記載されている発明について制限を課すものではない。
本発明の実施形態によると、機能的に同一である二つのフィルタを有する一体型のエコーおよびノイズキャンセラの新しい構成が提案される。これらのフィルタは、直交制御と表現(orthogonal controls and representations)を伴う。このような構成においては、雑音のあるハンドフリー音声通信において、システム全体のロバスト性(robustness)を引き上げるように、二つの直交フィルタは互いに補完し合う。
特に、一体型のエコーノイズキャンセラは、別個に制御される二つのサブシステムを並行に用いる。これらのサブシステムはそれぞれ、直行制御メカニズムを伴う。エコーノイズキャンセラは、フロント・エコーキャンセラと、バックアップ・エコーキャンセラとを含む。フロント・エコーキャンセラは、ダブルトーク検出を用いる。ローカル音声に対して確実にロバストであるようにするために、フロント・エコーキャンセラは、保守的な適応アプローチをとりながらも、提供するエコーサプレッションはより小さく、スピーチ、エコーの変化への適応は遅い。バックアップ・エコーキャンセラは、相互相関を用いて、エラー信号とエコー信号との間の類似性を測定する。バックアップ・エコーキャンセラは、フィルタが迅速に更新されるように、積極的な戦略をとる。バックアップ・エコーキャンセラは、大きなエコーサプレッションを提供しながらも、過剰に適応してしまう可能性があるため、ローカル音声/ノイズに対して不安定である。これらの二つのエコーキャンセラの出力の統合は、どちらのエコーキャンセラとエコー信号との差が大きいかを測定する相互相関解析に基づいて実行される。この統合においてはまた、両方のエコーキャンセラのフィルタ安定性がチェックされる。一のフィルタが過大予測または過小予測されている場合、そのフィルタは他方のフィルタによって補完される。このようなシステムは、いかなるときでも確実に一のフィルタが正しく動作するように設計される。
本システムはオプションで、同様のアプローチをとるエコー残差ノイズ予測部を含んでもよい。エコー残差ノイズ予測部は、直行制御を伴う二つの独立なサブ予測部を並行に用いる。第1予測部は、ロバストなダブルトーク検出部に依存するエコー距離ミスマッチ(echo−distance−mismatch)に基づく。第1予測部は、比較的正確でありながら、ダブルトーク検出エラーのために不安定である。第2予測部は相互スペクトル解析(cross−spectrum−analysis)に基づく。第2予測部の予測にはバイアスがかかっているが安定であり、ローカル音声検出に依存せず、一貫性がある。これらの二つの残差エコーの予測の統合においては、遠端通話のみの場合、またはダブルトークの場合にそれぞれ、最小/最大アプローチがとられる。
図1Aは、本発明の一実施形態にかかるエコーキャンセレーション装置100を用いたオーディオシステム99を示す図である。装置100の動作は、図2Aに示される方法200のフローチャート、および図2Bに示される方法220を参照することによって理解されるであろう。オーディオシステム99は一般的に、リモート信号x(t)を受け取るスピーカ102とマイクロフォン104とを含む。ローカル音源101は、ローカルスピーチ信号s(t)を発する。マイクロフォン104は、ローカルスピーチ信号s(t)と、スピーカ信号x(t)に関連するエコー信号x(t)の両方を受け取る。マイクロフォン104はまた、マイクロフォン104が位置する環境から発生するノイズn(t)をも受け取る。そして、マイクロフォン104は、マイクロフォン信号d(t)を生成する。マイクロフォン信号d(t)は、d(t)=s(t)+x(t)+n(t)によって与えられるだろう。
エコーキャンセレーション装置100は、一般的に、第1適応エコーキャンセレーションフィルタEC(1)と第2適応エコーキャンセレーションフィルタEC(2)とを含む。それぞれの適応フィルタは、マイクロフォン信号d(t)とスピーカ信号x(t)とを受け取る。図2A−2Bに示されるように、フィルタEC(1)はステップ202に示されるようにマイクロフォン信号d(t)を適応フィルタリング処理し、フィルタEC(2)は、ステップ204に示されるように、第1フィルタEC(1)と並行してマイクロフォン信号d(t)を適応フィルタリング処理する。ここで用いられているように、フィルタが「並行にオペレーションする」とは、実質的に同じ入力d(t)を受け取ることをいう。並行オペレーションは、一のフィルタの出力が、他方のフィルタの入力となるシリアルオペレーションとは、区別される。二つのフィルタEC(1)、EC(2)の状態によって、一のフィルタが、主要な「フロント」フィルタの役目を果たし、他方のフィルタが「バックアップ」フィルタの役目を果たす。一のフィルタは、エコーキャンセレーションに対して慎重なアプローチをとる一方、他方のフィルタはより積極的なアプローチをとる。
フィルタEC(1)、EC(2)の状態は、以下の信号モデルに関連して理解されるであろう。
y(t)=x(t)h(n)
d(t)=y(t)+s(t)
e(t)=d(t)−y(t)
ここで、y(t)は、エコーキャンセラフィルタによって合成されたエコーである。
x(t)は、ラウドスピーカにおいてプレイするエコーである。
h(n)は、エコーキャンセラフィルタの適応フィルタ関数である。
d(t)は、マイクロフォンが受けた雑音の多い信号である。
(t)は、マイクロフォンにおいて現れる、真のエコーである。
s(t)は、ローカル音声である。
そして、e(t)は、エコーキャンセラフィルタによって生成されたエコーキャンセル済み残差信号である。
二つのフィルタEC(1)、EC(2)は、相補的なエコーキャンセレーション特質を有する。ここで用いられるように、「相補的エコーキャンセレーションを有する」とは、同じ入力を受け取る二つの適応フィルタにおいて、一のフィルタが入力にうまく適応していないときに、他方のフィルタが入力にうまく適応しているような場合をいう。本アプリケーションの文脈において、フィルタ関数h(n)が、「うまく適応している」とは、そのフィルタ関数h(n)が安定であり、真のエコーパスフィルタ(echo−path−filter)に収束しており、過大予測でもなく過小予測でもないときをいう。
h(n)が真のエコーパスフィルタに収束している(y(t)〜=y(t))場合、すなわち、予測されたエコーが真のエコーと近似的に等しい場合、コヒーレンス関数αを用いて、エコーキャンセラフィルタEC(1)、EC(2)の状態が定量化されるだろう。αは、y(t)とe(t)の間の相互相関に関連し、式1が成り立つ。
(式1)
Figure 0004833343
ここで”E”は、統計的期待値である。
式2に示す演算子は、相互相関演算を表す。
(式2)
Figure 0004833343
離散的な関数fとgについて、相互相関は式3で定義される。
(式3)
Figure 0004833343
ここで、和は適切な値の整数jについてとられており、アスタリスクは、複数共役を表す。連続関数f(x)とg(x)について、相互相関は式4で定義される。
(式4)
Figure 0004833343
ここで積分は適切なtの値についてとられる。
コヒーレンス関数αにおいて、分子は、e(t)とy(t)の相互相関を表す。分母は、y(t)の自己相関を表し、正規化項の役目を果たす。
理想的には、h(n)が収束するならば、αは「0」に近いはずである(残差信号e(t)はy(t)を含まないからである)。h(n)が収束しないならば、αは「1」に近いはずである(e(t)はy(t)の強いエコーを含むからである)。h(n)がおかしな挙動をし、または発散するならば、αは負であるはずである(フィルタの発散のため、e(t)は、位相が180度シフトした強いエコーを含むからである)。
したがって、例えば、コヒーレンス関数αの値は、フィルタEC(1)、EC(2)の状態について、四つの可能な状態を定義するために用いられてもよい。ただしこれに制限されるものではない。
(1)フィルタh(n)が安定であり、収束し、過大予測でも過小予測でもない場合には、0<=α<=0.1
(2)フィルタh(n)が安定ではあるが、過小予測されているときには(まだ収束していない)α>0.2
(3)フィルタh(n)が過大予測されているときは、α<−0.1
(4)フィルタh(n)が発散するときには、α<−0.25
これらの異なる状態について、異なるαの値の範囲が決定されうることは当業者には理解されるであろう。
フィルタの状態がよいならば(例えば状態(1))、その後に発散したときのリカバリのために、その設定が保存されてもよい。フィルタが発散し、または過小予測され、または過大予測されている場合には、フロントおよびバックアップ・エコーキャンセラはその役割を交換する。フロントフィルタがバックアップとなる一方、バックアップフィルタがフロントフィルタの役割を担う。一のフィルタが慎重な適応アプローチをとり、他方が積極的な適応アプローチをとるため、この交換により、最終的には、両方のフィルタがより早く収束し、よりダイナミックに安定する。
さらにフィルタが過小予測または過大予測されている場合、より早い収束、またはトラッキングのよりよい安定のために、適応スピードを加速させ、または減速させるように、適応ステップサイズが小さなデルタ値で増加または減少されてもよい。通常、収束を速くするためにはより大きなステップサイズが必要である。これにより、細部に関するよいトラッキングは犠牲となり、エコーサプレッション比ESRは、低くなる。小さなステップサイズを用いてよりゆっくりと収束させる場合は、より安定的であり、わずかな変化もトラックする機能を有するが、エコーディスロケーションを速くトラッキングするには適さない。
動的なステップサイズと、フロント/バックアップでのフィルタ交換を組み合わせることにより、速いトラッキング対詳細なトラッキング、安定性対収束の観点において、システム全体のバランスが良くなる。この二つが、適応システム設計において本当に重要な双子の課題である。
フィルタの一が発散した場合において、他方のフィルタがよい状態にあるならば、発散したフィルタを再初期化するために、その他方のフィルタの設定が複製されてもよい。別の方法では、発散したフィルタは、以前に保存された、よい状態のフィルタ設定を用いて復旧されて(recovered)もよい。
例えば、エコーキャンセリング適応フィルタEC(1)とEC(2)は、周波数領域正規化最小二乗適応フィルタに基づいてもよい。ただし、これに制限されるものではない。各フィルタは、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアの組み合わせとして実装されうる。
図1Bと図1Cは、適切な相補適応フィルタの例を示す。具体的には、図1Bは、音声アクティビティ検出を伴う適応エコーキャンセレーションフィルタ120を示す。フィルタ120は、第1適応フィルタEC(1)として用いることができる。フィルタ120は、フィルタ係数wによって特徴付けられる有限インパルス応答(FIR)フィルタを有する可変フィルタ122を含む。可変フィルタ122は、マイクロフォン信号d(t)を受け取り、フィルタ係数wの値に従ってフィルタリング処理し、フィルタリング処理された信号d’(t)を生成する。可変フィルタ124は、入力信号を、係数wt1によって決定されるインパルス応答で畳み込むことにより、望ましい信号を予測する。各フィルタ係数wt1は、更新アルゴリズム124にしたがって、量Δwの規則的な間隔で更新される。一例として、フィルタ信号d’(t)が、望ましい信号としてスピーカエコー信号x(t)を予測しようと試みるように、フィルタ係数wが選択されてもよい。差分ユニット126は、マイクロフォン信号d(t)からフィルタリング処理された信号d’(t)を差し引いて、予測信号e(t)を供給する。予測信号e(t)は、ローカルスピーチ信号s(t)を予測する。フィルタリング処理された信号d’(t)をリモート信号x(t)から差し引いて、誤差信号e(t)を生成してもよい。誤差信号e(t)は、更新アルゴリズム124によってフィルタ係数wを調整するために用いられる。適応アルゴリズム124は、リモート信号x(t)と誤差信号に基づいて、補正因子(correction factor)を生成する。係数更新アルゴリズムの例には、最小2乗法(LMS)と再帰最小2乗法(RLS: recursive least squares)が含まれる。LMS更新アルゴリズムにおいては、例えば、フィルタ係数は、式wt1+1=wt1+μe(t)x(t)に基づいて更新される。ここで、μはステップサイズである。初めは、すべてのwt1について、wt1=0である。この例において、量μe(t)x(t)は、量Δwであることに注意されたい。上述のように、ステップサイズμは、適応フィルタの状態によって、動的に調整されてもよい。具体的には、フィルタが過小予測されている場合には、早く収束するように適応スピードを加速するために、ステップサイズμを、小さなデルタ量増加させてもよい。フィルタが過大予測されている場合には、この代わりに、トラッキングがよりよく安定するように適応スピードを減速させるために、適応ステップサイズμが、小さなデルタ量でそれぞれ引き下げられてもよい。
時間領域表現e(t)x(t)は、乗算である。この計算は、以下のように周波数領域において実装されてもよい。初めに、e(t)、x(t)、およびh(n)は、時間領域から周波数領域に、例えば高速フーリエ変換(FFT)によって変換されてもよい。
E(k)=fft(e(t))
X(k)=fft(x(t))
H(k)=fft(h(n))
実際の周波数領域におけるLMS更新アルゴリズムは、以下のようになる。
H(k)=H(k)+(μconj(X(k)).E(k))/(Δ+X(k)conj(X(k))
ここで、μはフィルタ適応ステップサイズであり、動的である。
conj(a)は、複素数aの複素共役を示す。
は、複素乗算(complex multiplication)を示す。
そして、Δは、分母が数量的に不安定になるのを防ぐレギュレータ(regulator)である。
上の方程式において、「conj(X(k)).E(k)」は、「e(t)x(t)」タスクを実行する。分母において、「X(k)conj(X(k))」は、安定性を高める目的で正規化する役割を果たす。
音声アクティブ化された検出VADは、更新アルゴリズム124を調整して、リモート信号x(t)が存在するときに(例えば所定の閾値以上であるならば)、可変フィルタ122が、マイクロフォン信号d(t)のみを適応的にフィルタリング処理するようにしてもよい。図1Bに示される音声アクティブ化された検出(ダブルトーク検出と呼ばれることもある)を用いる適応フィルタは、比較的ゆっくりと適応するフィルタである。しかし、このフィルタはまた、擬陽性をほとんど生じないという点において、非常に正確である。フィルタ120に対する相補適応フィルタは、例えば、比較的早く適応するが、しばしば擬陽性を生じる傾向があるフィルタであるかもしれない。
一例として、図1Cは、図1Bのフィルタ120に対して相補的な適応フィルタ130を示す。適応フィルタ130は、フィルタ係数wt2と更新アルゴリズム134(例えば上述のLMS更新アルゴリズム)によって特徴づけられる可変フィルタを含む。フィルタ132は、スピーカエコー信号x(t)を望ましい信号として予測しようと試みる。差分ユニット136は、フィルタリング処理された信号d’(t)をマイクロフォン信号d(t)から差し引いて、ローカルスピーチ信号s(t)を予測する予測信号e(t)を提供する。フィルタリング処理された信号d’(t)をリモート信号x(t)から差し引いて、誤差信号e(t)を発生させてもよい。誤差信号e(t)はフィルタ係数wt2を調整するために更新アルゴリズム134によって用いられる。フィルタ130において相互相関解析CCAは、可変フィルタ132が、予測信号e(t)とスピーカエコー信号x(t)との間の相互相関を低減させようとするように、更新アルゴリズム134を調整する。
(t)とx(t)が非常に強く相関しているとき、フィルタリング処理は過小予測されているといわれ、更新アルゴリズム134は、Δwt2を増加させるように調整される。e(t)とx(t)との間の相互相関が閾値未満であるとき、フィルタリング処理は過大予測されているといわれ、更新アルゴリズム134は、Δwt2を減少させるように調整される。
図1Cに示されるタイプの相互相関解析(クロススペクトラム解析ともいわれる)を用いる適応フィルタは、比較的速くフィルタを適応させる。しかし、このフィルタはまた、しばしば擬陽性を生じるという点において、不安定である。したがって、フィルタ120とフィルタ130は、相補フィルタの例となる。
再び図1Aを参照する。インテグレータ106は、第1適応フィルタEC(1)と第2適応フィルタEC(2)に接続される。インテグレータ106は、第1および第2適応フィルタのそれぞれの出力e(t)、e(t)から、最小エコー出力e(t)を決定するように構成されている。最小エコー出力e(t)は、e(t)とe(t)のいずれかであり、エネルギがより小さく、スピーカ信号x(t)との相関がより小さい方である。e(t)とe(t)のうちの一方のエネルギの方がより小さいが、x(t)との相関は、他方がより小さい場合には、相関がより小さい方を最小エコー出力e(t)として用いる。例えば、フィルタのうちの一が過大予測されている(すなわち目標音声をキャンセルしがちであるためにエネルギ出力が小さい)とき、エネルギにかかわらず相関が小さいほうがよい。最小エネルギは、E{e(t)}とE{e(t)}との最小値を決定することにより決定されてもよい。ここで、E{}はカッコ内の量の期待値を決定する演算を示す。再び図2A−2Bを参照する。ステップ206において、e(t)とe(t)のどちらがスピーカ信号x(t)との相互相関が小さいか決定するために、e(t)とe(t)について相互相関解析が実行されてもよい。相互相関解析は、下記の式5と式6の最小値を決定するステップを含んでもよい。
(式5)
Figure 0004833343
(式6)
Figure 0004833343
ここで、式7の演算子
(式7)
Figure 0004833343
は、例えば、上で定義されたように演算子の両側の量について、その間の相互相関をとる演算を表現する。最小エコー出力e(t)は、マイクロフォン104のフィルタリング処理された出力として用いられてもよい。
いくつかの状況においては、フィルタEC(1)、EC(2)のうちの一が、ローカル信号を過度にフィルタリング処理するかもしれない。そのような状況においては、そのフィルタは「発散した」といわれる。これは、特にEC(2)が、例えば図1Cに示されるようなタイプの相互相関フィルタであるときに実際に起こりうる。この可能性に対処するために、ステップ208においてEC(2)が発散するかどうか、決定される。一例としてインテグレータ106は、第2適応エコーキャンセレーションフィルタが、過度にフィルタリング処理することにより、ローカル信号s(t)を除去していないか、決定するように構成されてもよい。これはe(t)とスピーカエコー信号x(t)との間の相互相関の期待値を調べることにより実行することができる。すなわち、式8で表される。
(式8)
Figure 0004833343
典型的には、式9が成り立つ。
(式9)
Figure 0004833343
しかしながら、式10が、ある閾値(例えば約0.2)未満であるときには、EC(2)が過度にフィルタリング処理することにより、ローカル信号s(t)が除去されている。
(式10)
Figure 0004833343
このような状況において、インテグレータ106は、e(t)を最小エコー出力e(t)として選択してもよい。適応フィルタリング処理を安定させるために、ステップ212において、EC(2)のフィルタ係数wt2が、EC(1)のフィルタ係数wt1として設定されてもよい。そしてステップ215において、EC(2)は、0、または、以前のうまく適応したことが知られている状態に、再初期化されてもよい。例えば、フィルタ係数は、規則的な間隔で(例えば約10秒から20秒ごとに)保存されて、EC(2)が発散したときにこれを再初期化するために用いられてもよい。
通常、相互相関フィルタが発散しないときに、そのフィルタはうまく適応していると言われる。EC(2)とEC(1)は相補的なフィルタリング特性を有するため、EC(2)がうまく適応しているとき、EC(1)は過小予測されていることになる。適応フィルタリング処理を安定化させるため、ステップ214に示されるように、第1適応フィルタEC(1)のフィルタ係数wt1が、第2適応フィルタEC(2)のフィルタ係数wt2と交換される。フィルタをソフトウェアに実装する際には、係数wt1、wt2は、メモリにおいてポインタによって特定される位置に格納されてもよい。係数wt1、wt2は、例えば、wt1およびwt2へのポインタを切り替えることによって、交換されてもよい。
最小エコー出力e(t)は、いくばくかの、スピーカ信号x(t)からの残差エコーxe(t)を含むかもしれない。装置100は、オプションで、インテグレータ106に接続された第1および第2エコー残差予測部ER(1)とER(2)、および、エコー残差予測部ER(1)とER(2)に接続された残差エコーキャンセレーションモジュール108を含んでもよい。
第1エコー残差予測部ER(1)は、最小エコー出力e(t)とスピーカ信号x(t)との間の相互相関解析を含む第1残差エコー予測ER(t)を生成するように構成されてもよい。図2Bのステップ222に示されるように、最小エコー出力e(t)とスピーカ信号x(t)との間の相互相関解析から、例えば、式11の値を決定することにより、第1残差エコー予測ER(t)が決定されてもよい。
(式11)
Figure 0004833343
ここで、式11の値は、e(t)が式12の相互相関の期待値を最小化するときに、真である。
(式12)
Figure 0004833343
この最小化問題は、本質的に、適応により実現されるであろう。例えば、エコー残差予測部ER(1)が、初期状態においては単位フィルタ(すべて値”1”)であると仮定されたい。すべてのフレームにおいて、サーチサーフェス(search surphace)の接線方向(tangent direction)に向かうにつれて、第1残差エコー予測ER(t)は、増加するかもしれない。これは、ニュートンソルバ(Newton solver)アルゴリズムによって実現されてもよい。第2残差エコー予測部ER(2)は、最小エコー出力e(t)とスピーカ信号x(t)との間のエコー距離ミスマッチ(echo−distance mismatch)を含む第2残差エコー予測ER(t)を決定するように構成されてもよい。図2Bのステップ224に示されるように、最小エコー出力e(t)とスピーカ信号x(t)との間のエコー距離ミスマッチから、例えば、argmin(E{(e(t))/(x(t))})を決定することにより、第2残差エコー予測ER(t)が決定されてもよい。ここで、e(t)が商(e(t))/(x(t))の期待値を最小化するとき、argmin(E{(e(t))/(x(t))})は真である。ここでも再び、最小化は、ニュートンソルバアルゴリズムを用いて実現されてもよい。
残差エコーキャンセレーションモジュール108は、二つの残差エコー予測ER(t)とER(t)の最小残差エコー予測ER(t)を決定して、その最小値ER(t)に従ってフィルタリング処理された信号e(t)を調整してもよい。一例として、最小残差エコー予測ER(t)は、ER(t)とER(t)のうち、エネルギが最小であり、x(t)に対する相関が最小であるものであってもよい。例えば図2Bのステップ226に示されるように、ER(t)とER(t)のうちの最小値に設定され、ステップ228に示されるように、その結果であるERの値がe(t)から差しひかれて、残差エコーキャンセルフィルタリング処理された信号e’(t)が生成される。ERがER(t)に等しいならば、残差エコーxe(t)は、ローカルスピーチ信号s(t)の強度が0でないときに、最小限に除去される。ER(t)がER(t)に等しいならば、残差エコーxe(t)は、遠端のエコーx(t)のみが存在するとき(遠端発話のみの期間)最大限に除去される。
一例として、2次のノルムN(1)とN(2)が、二つのエコー残差予測部ER(1)とER(2)のためにそれぞれ計算されてもよい。
N(1)=‖ER(1)‖
N(2)=‖ER(2)‖
ダブルトーク状況下においては、より小さいノルムを有するエコー残差予測部が、エコー残差ノイズを取り除くために、e(t)に適用されてもよい。シングルトーク状況下においては、より大きいノルムを有するエコー残差予測部が、エコー残差ノイズを取り除くために、e(t)に適用されてもよい。
エコーキャンセレーションにおいては、フィルタリング処理された信号e(t)、または、残差エコーキャンセルフィルタリング処理された信号e’(t)から、ノイズn(t)が除去されてもよい。ただし、このようなノイズキャンセレーションは、望ましくないかもしれない。なぜならば、信号e(t)またはe’(t)のリモート受信者は、ノイズがない状態を、マイクロフォン104からのすべての通信が失われた徴候であると解釈するかもしれないからである。この問題に対処するために、装置100はオプションで、ノイズキャンセラユニット110を含んでもよい。ノイズキャンセレーションモジュール110は、例えば図2A−2Bのステップ217に示されるように、マイクロフォン信号d(t)から予測ノイズ信号n’(t)を計算するように構成されてもよい。予測ノイズ信号n’(t)は、減衰係数αで減衰されて、低減されたノイズ信号n”(t)=αn’(t)を形成してもよい。減衰されたノイズ信号n”(t)は、図2Aのステップ218に示されるようにe(t)に加算されることにより、または、図2Bのステップ230に示されるようにe’(t)に加算されることにより、マイクロフォン出力信号s’(t)に組み込まれてもよい。
本発明の実施形態においては、図1A−1Cに関連して説明された装置、および図2A−2Cに関連して説明された方法は、プログラマブルなプロセッサとメモリを有するシステム上のソフトウェアとして実装されてもよい。
本発明の実施形態によると、図1および図2A−Bに関連して説明されたタイプの、前述のように動作する信号処理方法は、図3に示されるように、信号処理装置300の一部として実装されてもよい。システム300は、プロセッサ301とメモリ302(例えば、RAM、DRAM、ROMなど)を含んでもよい。信号処理装置300はさらに、並行処理が実装される場合には、複数のプロセッサ301を有してもよい。メモリ302は前述のように構成されたデータおよびコードを含む。具体的には、メモリ302には、プログラムコード304と信号データ306が格納されてもよい。コード304は、上述の、エコーキャンセリング適応フィルタEC(1)、ER(2)、インテグレータ106、エコー残差フィルタER(1)、ER(2)、残差エコーキャンセレーションモジュール108、ノイズキャンセラ110を実装してもよい。信号データ306は、マイクロフォン信号d(t)、かつ/または、スピーカ信号x(t)のデジタル表現を含んでもよい。
装置300はまた、入出力(I/O)エレメント311、電源(P/S)312、クロック(CLK)313、キャッシュメモリ314といった、周知のサポート機能310を含んでもよい。装置300は、プログラム、かつ/または、データを格納するためのディスクドライブ、CD−ROMドライブ、テープドライブといった大容量記憶装置315をオプションで含んでもよい。コントローラは、また、オプションで、コントローラ300とユーザの間の対話を手助けするためのディスプレイユニット316と、ユーザインタフェイスユニット318を含んでもよい。ディスプレイユニット316は、ブラウン管型でもよく、またフラットパネルスクリーンでもよい。これらはテキスト、数値、グラフィックシンボル、画像を表示する。ユーザインタフェイス318は、キーボード、マウス、ジョイスティック、ライトペン(light pen)やそのほかの装置を含んでもよい。さらに、スピーカ322とマイクロフォン324は、入出力構成エレメント311を介してプロセッサ301に接続されていてもよい。プロセッサ301、メモリ302、そしてシステム300のほかの構成要素は、図3に示されるようにシステムバス320を介して互いに信号(例えば、コード・インストラクションとデータ)を交換してもよい。
ここで用いられるように、入出力という言葉は、一般的に、システム300への、またはシステム300からの、および周辺装置への、または周辺装置からのデータを転送する任意のプログラム、オペレーション、または装置を指す。すべてのデータ転送が、一の装置からの出力であり、他の一の装置への入力であると見なすことができるであろう。周辺装置は、キーボードやマウスなどの入力のみの装置や、プリンタなどの出力のみの装置、そして上書き可能CD−ROMなどの入力および出力装置として動作する装置を含む。周辺装置という言葉には、マウス、キーボード、プリンタ、モニタ、マイクロフォン、ゲームコントローラ、カメラ、外部Zipドライブ、スキャナなどの外部装置と、CD−ROMドライブ、CD−Rドライブ、内部モデムなどの内部装置、および、フラッシュメモリ用リーダ/ライタ、ハードドライブなどのそのほかの周辺装置を含む。
プロセッサ301は、信号データ306およびメモリ302によって格納され、獲得されプロセッサモジュール301によって実行されるプログラム304のプログラムコード命令に応えて、信号データ306にデジタル信号処理を実行する。プログラム304のコードの一部はアセンブリ、C++、Java(登録商標)またはそのほかの多くの言語のような様々な異なるプログラミング言語のうちの一であってよい。プロセッサモジュール301は、プログラムコード304のようなプログラムを実行するときには特別な目的のコンピュータとなる汎用コンピュータを構成する。プログラムコード304は、ここでは、汎用コンピューター上で実行されるソフトウェアとして実装されるものとして説明されたが、これに代えて、アプリケーション特定集積回路(ASIC)のようなハードウェアを用いて、タスク管理方法が実現されることは当業者には理解されるであろう。そのように、本発明の実施形態は、全体的にまたは部分的に、ソフトウェア、ハードウェア、またはこれらの組合せによって実現されることは理解されるであろう。
ある実施形態においては、とりわけプログラムコード304は、図2Aの方法200や図2Bの方法220に共通な特徴を有する方法を実現するためのプロセッサ可読命令のセットを含んでもよい。プログラムコード304は、一般的に、以下のような命令を含んでもよい。すなわち、プロセッサ301に、相補的エコーキャンセレーション特性を有する第1および第2適応フィルタによって並行にマイクロフォン信号d(t)をフィルタリング処理させ、エコーキャンセル処理された出力e(t)とe(t)を生成させる命令、e(t)とe(t)から最小エコー出力e(t)を決定する命令、最小エコー出力を用いてマイクロフォン出力を生成する命令である。
本発明の実施形態によると、相互相関解析のみ、または音声アクティビティ検出(ダブルトーク検出)のみで可能な、よりロバストでありながら正確なエコーキャンセレーションが可能となる。このような改良されたエコーキャンセレーションによると、スピーカエコーx(t)に大部分を占められているマイクロフォン信号d(t)からローカルスピーチをs(t)を抽出することが可能となる。
本発明の実施形態は、ここで提示されたように用いられてもよく、また他のユーザ入力メカニズムと共に用いられてもよい。方位角方向や音声のボリュームを追跡したり測定したりするメカニズム、かつ/または、能動的または受動的にオブジェクトの位置を追跡するメカニズム、マシン・ビジョンを用いるメカニズム、これらの組み合わせなどである。追跡されるオブジェクトは、システムへのフィードバックを操作する補助的なコントロール装置やボタンを含んでもよい。そのようなフィードバックには、光源からの光の放射、音質の歪曲手段、その他の適切な送信機、変調器、コントロール装置、ボタン、圧力パッドなどが含まれてもよいが、これらに制限されるものではない。それは、同じ符号化状態の転送や変調に影響を及ぼしてもよく、かつ/または、システムによって追跡されている装置への命令や、その装置からの命令を転送してもよい。そのような装置は、本発明の実施形態に関連して用いられるシステムの一部であったり、またはシステムと相互作用したり、またはシステムに影響を与えたりする。
上記は、本発明の好ましい実施形態の完全な記述であるが、他の様々な変形、変更、等価物への置換が可能である。それゆえ、本発明の範囲は、上記の記述によって決定されるのではなく、以下の請求項によって決定されるべきであり、その完全な等価物もその範囲に含まれる。ここで記述された特徴は、好ましいものであるか否かに関わらず、ここで述べたいずれの特徴と組み合わされてもよい。以下の請求項においては、特に明示的に断らない限りは、各要素の数量は一以上である。ここに、添付される請求項は、所与の請求項において、「〜ための手段」との語句を用いて明示的に示される場合の他は、ミーンズ・プラス・ファンクションの制限を含むと解されてはならない。

Claims (32)

  1. スピーカ信号x(t)を受け取るスピーカと、ローカル信号s(t)とエコー信号x(t)とを含むマイクロフォン信号d(t)を受け取るマイクロフォンとを有するシステムにおけるエコーキャンセレーション方法であって、エコー信号x(t)は、スピーカ信号x(t)に依存しており、
    前記マイクロフォン信号d(t)を、第2適応フィルタに対して相補的なキャンセレーション特性を有する第1適応フィルタと、前記第2適応フィルタとで並行にフィルタリング処理するステップとを備え、
    前記第1適応フィルタは、有限インパルス応答フィルタを含み、
    前記第2適応フィルタは、可変フィルタを含み、
    前記第1適応フィルタおよび前記第2適応フィルタは、係数を更新するための周波数領域正規化最小2乗適応フィルタを含み、
    前記第1および第2適応フィルタのフィルタリング特性は、該第1および第2適応フィルタのうちの一方がその入力にうまく適応していないときに、他方はその入力にうまく適応するような特性であり、
    前記第1および第2適応フィルタのうちの一方がうまく適応するのは、そのフィルタ関数h(n)が安定しており、真のエコーパスフィルタに収束し、過大予測も過小予測もされていないときであり、
    本方法はさらに、
    前記第1適応フィルタからの出力e(t)と、前記第2適応フィルタからの出力e(t)とから、前記スピーカ信号x(t)との相関がより小さい最小エコー出力e(t)を決定するステップと、
    前記最小エコー出力e(t)を用いてマイクロフォン出力を生成するステップと、
    を備える方法。
  2. 前記マイクロフォン信号d(t)を前記第1適応フィルタと前記第2適応フィルタとで並行にフィルタリング処理するステップは、
    x(t)の強度が閾値を超えた場合に、前記第1適応フィルタのフィルタ係数の組を適応させるステップと、
    前記第2適応フィルタで、e(t)とx(t)の相互相関を解析するステップを含む請求項1に記載の方法。
  3. 前記最小エコー出力e(t)を決定するステップは、前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去していないか決定するステップと、
    前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去している場合に、前記第1適応フィルタの出力を前記最小エコー出力として用いるステップとを含む請求項2に記載の方法。
  4. 前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去していないか決定するステップは、
    前記第2適応フィルタの出力e(t)と、前記スピーカ信号x(t)との間の相互相関をとるステップと、
    前記第2適応フィルタの出力e(t)と前記スピーカ信号x(t)との間の相互相関の期待値が所定の閾値未満であるか判定するステップと、
    前記相互相関の期待値が前記閾値未満である場合に、前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去していることを決定するステップとを含む請求項3に記載の方法。
  5. 前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去している場合に、前記第2適応フィルタのフィルタ係数の組を前記第1エコーキャンセレーションフィルタのフィルタ係数の組で置き換えるステップをさらに含む請求項3に記載の方法。
  6. 前記最小エコー出力e(t)を用いて前記マイクロフォン出力を生成するステップは、前記最小エコー出力e(t)と前記スピーカ信号x(t)との間の相互相関の解析を含む第1残差予測ER(t)を並行に決定するステップと、前記最小エコー出力e(t)と前記スピーカ信号x(t)との間のエコー距離ミスマッチを含む第2残差予測ER(t)を決定するステップとを含む請求項1に記載の方法。
  7. 前記相互相関解析は、e(t)とx(t)との間の相互相関の期待値を計算するステップを含む請求項6に記載の方法。
  8. 前記エコー距離ミスマッチは、{e (t)/x(t)}の期待値を計算するステップを含む請求項6に記載の方法。
  9. 前記第1残差予測ER(t)を決定するステップは、第1残差予測部ER(1)の2次ノルムN(1)を計算するステップを含み、
    前記第2残差予測ER(t)を決定するステップは、第2残差予測部ER(2)の2次ノルムN(2)を計算するステップを含み、
    本方法はさらに、ダブルトークの間、e(t)に、対応するノルムN(1)またはN(2)がより小さい前記エコー残差予測部ER(1)またはER(2)を適用するステップを含む請求項6に記載の方法。
  10. 前記第1残差予測ER(t)を決定するステップは、第1残差予測部ER(1)の2次ノルムN(1)を計算するステップを含み、
    前記第2残差予測ER(t)を決定するステップは、第2残差予測部ER(2)の2次ノルムN(2)を計算するステップを含み、
    本方法はさらに、シングルトークの間、e(t)に、対応するノルムN(1)またはN(2)がより大きい前記エコー残差予測部ER(1)またはER(2)を適用するステップを含む請求項6に記載の方法。
  11. 前記最小エコー出力e(t)を用いてマイクロフォン出力を生成するステップはさらに、最小残差エコー予測ER(t)を決定するステップを含み、
    前記最小残差エコー予測ER(t)は、ER(t)とER(t)のうちの一で、エネルギが最小でありx(t)との相関が最小である請求項6に記載の方法。
  12. 前記最小エコー出力e(t)からER(t)を選択的に除去するステップをさらに含む請求項11に記載の方法。
  13. 前記マイクロフォン出力からER(t)を選択的に除去するステップは、遠端通話のみの期間に、前記マイクロフォン出力からER(t)を最大限に除去するステップを含む請求項12に記載の方法。
  14. 前記マイクロフォン出力からER(t)を選択的に除去するステップは、前記ローカル信号s(t)の強度が0でないときに、前記マイクロフォン出力からER(t)を最小限に除去するステップを含む請求項12に記載の方法。
  15. 前記マイクロフォン信号d(t)から予測ノイズ信号n’(t)を計算するステップと、
    前記予測ノイズ信号n’(t)のレベルを低減させて、低減ノイズ信号n”(t)を形成するステップと、
    前記マイクロフォン出力信号に、前記低減ノイズ信号n”(t)を組み込むステップとをさらに含む請求項1に記載の方法。
  16. スピーカとマイクロフォンを有するシステムにおいて用いられるエコーキャンセレーション装置であって、スピーカは、スピーカ信号x(t)を受けるように適合され、マイクロフォンは、ローカル信号s(t)とエコー信号x(t)とを含むマイクロフォン信号d(t)を受け取るように適合され、エコー信号x(t)は、スピーカ信号x(t)に依存しており、
    本装置は、
    前記スピーカと前記マイクロフォンに接続され、有限インパルス応答フィルタを含む第1適応フィルタと、
    前記第1適応フィルタと並行に前記スピーカと前記マイクロフォンに接続され、可変フィルタを含む第2適応フィルタとを備え、
    前記第1適応フィルタおよび前記第2適応フィルタは、係数を更新するための周波数領域正規化最小2乗適応フィルタを含み、
    前記第2適応フィルタは、前記第1適応フィルタに対して相補的なエコーキャンセレーション特性を有し、
    前記第1および第2適応フィルタのフィルタリング特性は、該第1および第2適応フィルタのうちの一方がその入力にうまく適応していないときに、他方はうまく適応するような特性であり、
    前記第1および第2適応フィルタのうちの一方がうまく適応するのは、そのフィルタ関数h(n)が安定しており、真のエコーパスフィルタに収束し、過大予測も過小予測もされていないときであり、
    本装置はさらに、
    前記第1適応フィルタと前記第2適応フィルタに接続されたインテグレータとを備え、
    前記インテグレータは、前記第1適応フィルタからの出力e(t)と、前記第2適応フィルタからの出力e(t)から、最小エコー出力e(t)を決定するように構成されており、
    前記最小エコー出力e(t)と前記スピーカ信号x(t)との相関はより小さい装置。
  17. 前記インテグレータは、前記第2エコーキャンセレーションフィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去していないか決定するように構成され、前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去している場合に、インテグレータは、最小エコー出力e(t)として前記出力e(t)を選択する請求項16に記載の装置。
  18. 前記第1適応フィルタは、音声アクティビティ検出フィルタである請求項16に記載の装置。
  19. 前記第2適応フィルタは、相互相関解析フィルタである請求項16に記載の装置。
  20. 前記インテグレータに接続された第1エコー残差予測部ER(1)と、
    前記インテグレータに接続された第2エコー残差予測部ER(2)とをさらに備える請求項16に記載の装置。
  21. 前記第1エコー残差予測部ER(1)は、前記最小エコー出力e(t)と前記スピーカ信号x(t)との相互相関の解析を含む第1残差予測ER(t)を生成するように構成され、
    前記第2エコー残差予測部ER(2)は、前記最小エコー出力e(t)と前記スピーカ信号x(t)との間のエコー距離ミスマッチを含む第2残差予測ER(t)を決定するように構成されている請求項20に記載の装置。
  22. 前記相互相関解析は、e(t)とx(t)との相互相関の期待値の計算を含む請求項21に記載の装置。
  23. 前記エコー距離ミスマッチは、{e (t)/x(t)}の期待値の計算を含む請求項21に記載の装置。
  24. 前記第1および第2エコー残差予測部に接続された残差エコーキャンセレーションモジュールをさらに備える装置であって、
    前記残差エコーキャンセレーションモジュールは、
    第1残差予測部ER(1)の2次ノルムN(1)を計算し、第2残差予測ER(2)の2次ノルムN(2)を計算するように構成され、
    前記残差エコーキャンセレーションモジュールは、ダブルトークの間、対応するノルムN(1)またはN(2)がより小さい前記エコー残差予測部ER(1)またはER(2)を、e(t)に適用するように構成されている請求項21に記載の装置。
  25. 前記第1および第2エコー残差予測部に接続された残差エコーキャンセレーションモジュールをさらに備える装置であって、
    前記残差エコーキャンセレーションモジュールは、
    第1残差予測部ER(1)の2次ノルムN(1)を計算し、第2残差予測ER(2)の2次ノルムN(2)を計算するように構成され、
    前記残差エコーキャンセレーションモジュールは、シングルトークの間、対応するノルムN(1)またはN(2)がより大きい前記エコー残差予測部ER(1)またはER(2)を、e(t)に適用するように構成されている請求項21に記載の装置。
  26. 前記第1および第2エコー残差予測部に接続された残差エコーキャンセレーションモジュールをさらに備える装置であって、
    前記残差エコーキャンセレーションモジュールは、最小残差エコー予測ER(t)を決定するように構成されており、
    前記最小残差エコー予測ER(t)は、ER(t)とER(t)のうちの一で、エネルギが最小でありx(t)との相関が最小である請求項21に記載の装置。
  27. 前記残差エコーキャンセレーションモジュールは、前記最小エコー出力e(t)からER(t)を選択的に除去するように構成されている請求項26に記載の装置。
  28. 前記残差エコーキャンセレーションモジュールは、遠端通話のみの期間に、前記マイクロフォン出力からER(t)を最大限に除去するように構成されている請求項27に記載の装置。
  29. 前記残差エコーキャンセレーションモジュールは、前記ローカル信号s(t)の強度が0でない場合に、前記マイクロフォン出力からER(t)を最小限に除去するように構成されている請求項27に記載の装置。
  30. 前記マイクロフォンに接続されたノイズキャンセレーションモジュールをさらに備え、 前記ノイズキャンセレーションモジュールは、
    マイクロフォン信号d(t)から予測ノイズ信号n’(t)を計算し、
    予測ノイズ信号n’(t)レベルを減少させて、低減ノイズ信号n”(t)を形成し、
    マイクロフォン出力信号に、その低減ノイズ信号n”(t)を取り入れるように構成されている請求項16に記載の装置。
  31. マイクロフォンと、
    スピーカと、
    前記マイクロフォンとスピーカとに接続されているプロセッサと、
    前記プロセッサに接続されているメモリとを備える音響信号処理システムであって、
    前記メモリは、
    スピーカ信号x(t)を受け取るスピーカと、
    ローカル信号s(t)と、前記スピーカ信号x(t)に依存するエコー信号x(t)とを含むマイクロフォン信号d(t)を受け取るマイクロフォンを有するシステムにおけるエコーキャンセレーション方法を実装するためのプロセッサ可読命令の組を格納し、
    前記プロセッサ可読命令は、
    前記マイクロフォン信号d(t)を、第2適応フィルタに対して相補的なキャンセレーション特性を有する第1適応フィルタと、前記第2適応フィルタとで並行にフィルタリング処理するための命令を含み、
    前記第1適応フィルタは、有限インパルス応答フィルタを含み、
    前記第2適応フィルタは、可変フィルタを含み、
    前記第1適応フィルタおよび前記第2適応フィルタは、係数を更新するための周波数領域正規化最小2乗適応フィルタを含み、
    前記第1および第2適応フィルタのフィルタリング特性は、該第1および第2適応フィルタのうちの一方がその入力にうまく適応していないときに、他方はうまく適応するような特性であり、
    前記第1および第2適応フィルタのうちの一方がうまく適応するのは、そのフィルタ関数h(n)が安定しており、真のエコーパスフィルタに収束し、過大予測も過小予測もされていないときであり、
    前記プロセッサ可読命令はさらに、
    前記第1適応フィルタからの出力e(t)と前記第2適応フィルタからの出力e(t)から、スピーカ信号x(t)との相関がより少ない最小エコー出力e(t)を決定するための命令と、
    前記最小エコー出力e(t)を用いて、マイクロフォン出力を生成するための命令と、
    を含む音響信号処理システム。
  32. プロセッサに接続されているメモリを備えるプロセッサ可読媒体であって、
    前記メモリは、
    スピーカ信号x(t)を受け取るスピーカと、
    ローカル信号s(t)と、スピーカ信号x(t)に依存するエコー信号x(t)とを含むマイクロフォン信号d(t)を受け取るマイクロフォンを有するシステムにおけるエコーキャンセレーション方法を実装するためのプロセッサ可読命令の組を格納し、
    前記プロセッサ可読命令は、
    前記マイクロフォン信号d(t)を、第2適応フィルタに対して相補的なキャンセレーション特性を有する第1適応フィルタと、前記第2適応フィルタとで並行にフィルタリング処理するための命令を含み、
    前記第1適応フィルタは、有限インパルス応答フィルタを含み、
    前記第2適応フィルタは、可変フィルタを含み、
    前記第1適応フィルタおよび前記第2適応フィルタは、係数を更新するための周波数領域正規化最小2乗適応フィルタを含み、
    前記第1および第2適応フィルタのフィルタリング特性は、該第1および第2適応フィルタのうちの一方がその入力にうまく適応していないときに、他方はうまく適応するような特性であり、
    前記第1および第2適応フィルタのうちの一方がうまく適応するのは、そのフィルタ関数h(n)が安定しており、真のエコーパスフィルタに収束し、過大予測も過小予測もされていないときであり、
    前記プロセッサ可読命令はさらに、
    前記第1適応フィルタからの出力e(t)と前記第2適応フィルタからの出力e(t)から、スピーカ信号x(t)との相関がより小さい最小エコー出力e(t)を決定するための命令と、
    前記最小エコー出力e(t)を用いてマイクロフォン出力を生成するための命令と、
    を含む媒体。
JP2010019147A 2006-05-04 2010-01-29 エコー及びノイズキャンセレーション Expired - Fee Related JP4833343B2 (ja)

Applications Claiming Priority (20)

Application Number Priority Date Filing Date Title
US11/381,725 US7783061B2 (en) 2003-08-27 2006-05-04 Methods and apparatus for the targeted sound detection
US11/418,988 2006-05-04
US11/429,047 2006-05-04
US11/381,725 2006-05-04
US11/418,989 US8139793B2 (en) 2003-08-27 2006-05-04 Methods and apparatus for capturing audio signals based on a visual image
US11/381,727 US7697700B2 (en) 2006-05-04 2006-05-04 Noise removal for electronic device with far field microphone on console
PCT/US2006/017483 WO2006121896A2 (en) 2005-05-05 2006-05-04 Microphone array based selective sound source listening and video game control
US11/418,988 US8160269B2 (en) 2003-08-27 2006-05-04 Methods and apparatuses for adjusting a listening area for capturing sounds
US11/381,721 US8947347B2 (en) 2003-08-27 2006-05-04 Controlling actions in a video game unit
US11/381,728 US7545926B2 (en) 2006-05-04 2006-05-04 Echo and noise cancellation
US11/429,047 US8233642B2 (en) 2003-08-27 2006-05-04 Methods and apparatuses for capturing an audio signal based on a location of the signal
US11/381,728 2006-05-04
US11/381,729 2006-05-04
USPCT/US2006/017483 2006-05-04
US11/381,729 US7809145B2 (en) 2006-05-04 2006-05-04 Ultra small microphone array
US11/418,989 2006-05-04
US11/381,724 US8073157B2 (en) 2003-08-27 2006-05-04 Methods and apparatus for targeted sound detection and characterization
US11/381,721 2006-05-04
US11/381,724 2006-05-04
US11/381,727 2006-05-04

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009509908A Division JP4476355B2 (ja) 2006-05-04 2007-03-30 エコー及びノイズキャンセレーション

Publications (2)

Publication Number Publication Date
JP2010171985A JP2010171985A (ja) 2010-08-05
JP4833343B2 true JP4833343B2 (ja) 2011-12-07

Family

ID=56290936

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2009509908A Expired - Fee Related JP4476355B2 (ja) 2006-05-04 2007-03-30 エコー及びノイズキャンセレーション
JP2009509909A Expired - Fee Related JP4866958B2 (ja) 2006-05-04 2007-03-30 コンソール上にファーフィールドマイクロフォンを有する電子装置におけるノイズ除去
JP2010019147A Expired - Fee Related JP4833343B2 (ja) 2006-05-04 2010-01-29 エコー及びノイズキャンセレーション

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2009509908A Expired - Fee Related JP4476355B2 (ja) 2006-05-04 2007-03-30 エコー及びノイズキャンセレーション
JP2009509909A Expired - Fee Related JP4866958B2 (ja) 2006-05-04 2007-03-30 コンソール上にファーフィールドマイクロフォンを有する電子装置におけるノイズ除去

Country Status (3)

Country Link
EP (2) EP2012725A4 (ja)
JP (3) JP4476355B2 (ja)
WO (2) WO2007130765A2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8738367B2 (en) 2009-03-18 2014-05-27 Nec Corporation Speech signal processing device
JP4964267B2 (ja) * 2009-04-03 2012-06-27 有限会社ケプストラム 適応フィルタ及びこれを有するエコーキャンセラ
JP2010249939A (ja) * 2009-04-13 2010-11-04 Sony Corp ノイズ低減装置、ノイズ判定方法
JPWO2013179464A1 (ja) * 2012-05-31 2016-01-14 トヨタ自動車株式会社 音源検出装置、ノイズモデル生成装置、ノイズ抑圧装置、音源方位推定装置、接近車両検出装置及びノイズ抑圧方法
CN109166589A (zh) * 2018-08-13 2019-01-08 深圳市腾讯网络信息技术有限公司 应用声音抑制方法、装置、介质以及设备
EP4078577A1 (en) * 2019-12-18 2022-10-26 Dolby Laboratories Licensing Corp. Filter adaptation step size control for echo cancellation
CN113689871A (zh) * 2020-05-19 2021-11-23 阿里巴巴集团控股有限公司 回声消除方法和装置
CN112017679B (zh) * 2020-08-05 2024-01-26 海尔优家智能科技(北京)有限公司 用于自适应滤波器系数更新的方法及装置、设备

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4802227A (en) * 1987-04-03 1989-01-31 American Telephone And Telegraph Company Noise reduction processing arrangement for microphone arrays
JP3135937B2 (ja) * 1991-05-16 2001-02-19 株式会社リコー 雑音除去装置
JP3110201B2 (ja) * 1993-04-16 2000-11-20 沖電気工業株式会社 ノイズ除去装置
WO1995002288A1 (en) * 1993-07-07 1995-01-19 Picturetel Corporation Reduction of background noise for speech enhancement
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
FR2771542B1 (fr) * 1997-11-21 2000-02-11 Sextant Avionique Procede de filtrage frequentiel applique au debruitage de signaux sonores mettant en oeuvre un filtre de wiener
DE19806015C2 (de) * 1998-02-13 1999-12-23 Siemens Ag Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
US6263078B1 (en) * 1999-01-07 2001-07-17 Signalworks, Inc. Acoustic echo canceller with fast volume control compensation
WO2000049602A1 (en) * 1999-02-18 2000-08-24 Andrea Electronics Corporation System, method and apparatus for cancelling noise
US6426979B1 (en) * 1999-04-29 2002-07-30 Legerity, Inc. Adaptation control algorithm for echo cancellation using signal-value based analysis
AU1359601A (en) * 1999-11-03 2001-05-14 Tellabs Operations, Inc. Integrated voice processing system for packet networks
JP3358731B2 (ja) * 2000-04-24 2002-12-24 株式会社富建設 介護装置
US7139401B2 (en) * 2002-01-03 2006-11-21 Hitachi Global Storage Technologies B.V. Hard disk drive with self-contained active acoustic noise reduction
JP2003284181A (ja) * 2002-03-20 2003-10-03 Matsushita Electric Ind Co Ltd 集音装置
DE10305369B4 (de) * 2003-02-10 2005-05-19 Siemens Ag Benutzeradaptives Verfahren zur Geräuschmodellierung
US6947549B2 (en) * 2003-02-19 2005-09-20 The Hong Kong Polytechnic University Echo canceller
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
JP4227529B2 (ja) * 2004-01-06 2009-02-18 パナソニック株式会社 周期性雑音抑圧装置
US7254535B2 (en) * 2004-06-30 2007-08-07 Motorola, Inc. Method and apparatus for equalizing a speech signal generated within a pressurized air delivery system
KR101185820B1 (ko) * 2004-10-13 2012-10-02 코닌클리케 필립스 일렉트로닉스 엔.브이. 에코 소거

Also Published As

Publication number Publication date
JP2009535997A (ja) 2009-10-01
EP2014132A2 (en) 2009-01-14
EP2012725A2 (en) 2009-01-14
JP4476355B2 (ja) 2010-06-09
WO2007130766A3 (en) 2008-09-04
EP2012725A4 (en) 2011-10-12
WO2007130765A3 (en) 2008-12-18
WO2007130766A2 (en) 2007-11-15
JP2009535996A (ja) 2009-10-01
WO2007130765A2 (en) 2007-11-15
JP4866958B2 (ja) 2012-02-01
JP2010171985A (ja) 2010-08-05
EP2014132A4 (en) 2013-01-02

Similar Documents

Publication Publication Date Title
US7545926B2 (en) Echo and noise cancellation
JP4833343B2 (ja) エコー及びノイズキャンセレーション
US9870783B2 (en) Audio signal processing
US8503669B2 (en) Integrated latency detection and echo cancellation
US9264807B2 (en) Multichannel acoustic echo reduction
EP2783504B1 (en) Acoustic echo cancellation based on ultrasound motion detection
EP2845189B1 (en) A universal reconfigurable echo cancellation system
EP3114683B1 (en) Audio signal processing
US7536006B2 (en) Method and system for near-end detection
WO2018132465A1 (en) Post-mixing acoustic echo cancellation systems and methods
US20140355752A1 (en) Echo cancellation
EP2982101B1 (en) Noise reduction
KR20150008460A (ko) 적응형 잡음 제거 시스템에서 잡음 방지 생성기 응답 및 2차 경로 응답의 시퀀싱된 적응
JP2009246628A (ja) 音響エコー除去装置
WO2019068115A1 (en) ECHO CANCELLATION DEVICE AND METHOD THEREOF
US8064966B2 (en) Method of detecting a double talk situation for a “hands-free” telephone device
CN109215672B (zh) 一种声音信息的处理方法、装置及设备
JPH09289475A (ja) 2線式音声会議装置
US8406430B2 (en) Simulated background noise enabled echo canceller
JP2005533427A (ja) モデルミスマッチ補償をもつエコーキャンセラ
CN113241084B (zh) 回声消除的方法、装置及设备
JP2009021859A (ja) 通話状態判定装置および該通話状態判定装置を備えたエコーキャンセラ
WO2018087855A1 (ja) エコーキャンセラ装置、エコー消去方法、及びエコー消去プログラム
JP2006094355A (ja) 音声処理装置およびエコー除去方法

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20101126

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110920

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110921

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees