JP2022536801A

JP2022536801A - モジュール式エコーキャンセルユニット

Info

Publication number: JP2022536801A
Application number: JP2021575018A
Authority: JP
Inventors: クリスティアン・エム・ヘラ; エリー・ボウ・ダハー; ジェフリー・アール・ヴォーティン; ヴィグネイシュ・カタヴァラヤン; アンキタ・ディー・ジャイン; トーブ・ゼット・バークスデイル
Original assignee: Bose Corp
Current assignee: Bose Corp
Priority date: 2019-06-17
Filing date: 2020-06-17
Publication date: 2022-08-18
Anticipated expiration: 2040-06-17
Also published as: US11017792B2; JP7259092B2; CN114175606A; EP3984030A1; WO2020257262A1; CN114175606B; US20200395030A1

Abstract

音響トランスデューサによって車両キャビン内の音響信号に変換される複数のプログラムコンテンツ信号を生成するためのヘッドユニットと、マイクロフォンであって、マイクロフォンが、音響信号を受信し、複数のエコー信号を含むマイクロフォン信号を生成するように車両キャビン内に配置され、各エコー信号が、少なくとも１つのプログラムコンテンツ信号と相関するマイクロフォン信号の成分である、マイクロフォンと、マルチチャネルエコーキャンセルユニットであって、マルチチャネルエコーキャンセルユニットが、複数の参照信号であって、複数の参照信号の各々が、複数のプログラムコンテンツ信号のうちの少なくとも１つと相関する、複数の参照信号と、マイクロフォン信号と、を受信することと、複数の参照信号に従って、複数のエコー信号を最小化することと、推定音声信号を生成することと、推定音声信号をヘッドユニットに提供することと、を行うように構成されている、マルチチャネルエコーキャンセルユニットと、を備える、オーディオシステム。

Description

本発明はモジュール式エコーキャンセルユニットに関する。

本開示は、概して、モジュール式エコーキャンセルのためのシステム及び方法、具体的には、車両内でモジュール式エコーキャンセルを提供するためのシステム及び方法に関する。

下記で言及される全ての実施例及び特徴は、任意の技術的に可能な方式で組み合わせることができる。

一態様によれば、オーディオシステムは、少なくとも第１のプロセッサを備えるヘッドユニットであって、ヘッドユニットが、複数のプログラムコンテンツ信号を生成するように構成されており、複数のプログラムコンテンツ信号のうちの１つが、電話から受信される電話プログラムコンテンツ信号であり、複数のプログラムコンテンツ信号が、音響トランスデューサによって車両キャビン内の音響信号に変換される、ヘッドユニットと、マイクロフォンであって、マイクロフォンが、音響信号を受信し、複数のエコー信号を含むマイクロフォン信号を生成するように車両キャビン内に配置されており、複数のエコー信号のうちの各エコー信号が、複数のプログラムコンテンツ信号のうちの少なくとも１つのプログラムコンテンツ信号と相関するマイクロフォン信号の成分である、マイクロフォンと、第２のプロセッサによって実装されているマルチチャネルエコーキャンセルユニットであって、マルチチャネルエコーキャンセルユニットが、複数の参照信号であって、複数の参照信号の各々が、複数のプログラムコンテンツ信号のうちの少なくとも１つと相関する、複数の参照信号と、マイクロフォン信号と、を受信することと、複数の参照信号に従って、複数のエコー信号を最小化することと、推定音声信号を生成することと、推定音声信号をヘッドユニットに提供することと、を行うように構成されている、マルチチャネルエコーキャンセルユニットと、を備える。

一実施例では、マルチチャネルエコーキャンセルユニットは、複数のエコー信号の推定値を提供するように構成されているマルチチャネルエコーキャンセルフィルタを備え、複数のエコー信号の推定値が、マイクロフォン信号から差し引かれて、推定音声信号を生成し、電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号が、推定音声信号に追加され、これによって、推定音声信号及び推定電話プログラムコンテンツエコー信号が、ヘッドユニットに提供される。

一実施例では、オーディオシステムは、推定音声信号を受信し、複数のプログラムコンテンツ信号のうちの少なくとも１つと相関する少なくとも１つの残留成分を抑制して、エコー抑制された推定音声信号を生成するように構成されている、ポストフィルタを更に含む。

一実施例では、推定電話プログラムコンテンツエコー信号は、エコー抑制された推定音声信号に追加される。

一実施例では、ポストフィルタは、推定音声信号及び推定電話プログラムコンテンツエコー信号を受信し、エコー抑制された推定音声信号及び推定電話プログラムコンテンツエコー信号を出力するように構成されており、推定電話プログラムコンテンツエコー信号が、抑制されないままである。

一実施例では、ポストフィルタは、スペクトルミスマッチ合計から推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない推定電話プログラムコンテンツエコー信号を出力するように構成されている。

一実施例では、複数の参照信号は、複数のプログラムコンテンツ信号を含む。

別の態様によれば、第１のプロセッサ上に実装されているマルチチャネルエコーキャンセルユニットは、複数の参照信号を受信するための少なくとも１つのプログラムコンテンツ入力であって、複数の参照信号の各々が、第２のプロセッサを含むヘッドユニットから出力された複数のプログラムコンテンツ信号のうちの少なくとも１つと相関し、複数のプログラムコンテンツ信号のうちの１つが、電話プログラムコンテンツ信号である、少なくとも１つのプログラムコンテンツ入力と、複数のエコー信号を含むマイクロフォン信号を受信するためのマイクロフォン入力であって、複数のエコー信号のうちの各エコー信号が、複数のプログラムコンテンツ信号のうちの少なくとも１つのプログラムコンテンツ信号と相関するマイクロフォン信号の成分である、マイクロフォン入力と、複数の参照信号に従って、複数のエコー信号を最小化し、推定音声信号を生成し、かつ推定音声信号をヘッドユニットに提供するように構成されている、エコーキャンセラと、を含む。

一実施例では、エコーキャンセラは、複数のエコー信号の推定値を提供するように構成されているマルチチャネルエコーキャンセルフィルタを備え、複数のエコー信号の推定値が、マイクロフォン信号から差し引かれて、推定音声信号を生成し、電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号が、推定音声信号に追加され、これによって、推定音声信号及び推定電話プログラムコンテンツエコー信号が、ヘッドユニットに提供される。

一実施例では、マルチチャネルエコーキャンセルユニットは、推定音声信号を受信し、複数のプログラムコンテンツ信号と相関する少なくとも１つの残留成分を抑制して、エコー抑制された推定音声信号を生成するように構成されている、ポストフィルタを更に備える。

一例では、推定電話プログラムコンテンツエコー信号は、エコー抑制された推定音声信号に追加される。

一例では、ポストフィルタは、推定音声信号及び推定電話プログラムコンテンツエコー信号を受信し、エコー抑制された推定音声信号及び推定電話プログラムコンテンツエコー信号を出力するように構成されており、推定電話プログラムコンテンツエコー信号が、抑制されないままである。

一例では、ポストフィルタは、スペクトルミスマッチ合計から推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない推定電話プログラムコンテンツエコー信号を出力するように構成されている。

別の態様によれば、マルチチャネルエコーキャンセルを実行するための方法は、第１のプロセッサにおいて、複数の参照信号を受信することであって、複数の参照信号の各々が、第２のプロセッサを含むヘッドユニットから出力された複数のプログラムコンテンツ信号のうちの少なくとも１つと相関し、複数のプログラムコンテンツ信号のうちの１つが、電話プログラムコンテンツ信号である、受信することと、複数のエコー信号を含むマイクロフォン信号を受信することであって、複数のエコー信号のうちの各エコー信号が、複数のプログラムコンテンツ信号のうちの少なくとも１つのプログラムコンテンツ信号と相関するマイクロフォン信号の成分である、受信することと、第１のプロセッサによって定義されるエコーキャンセラを用いて、複数の参照信号に従って、複数のエコー信号を最小化して、推定音声信号を生成することと、推定音声信号をヘッドユニットに提供することと、を含む。

一実施例では、複数のエコー信号を最小化する工程は、第１のプロセッサによって定義されるマルチチャネルエコーキャンセルフィルタを用いて、複数のエコー信号の推定値を生成して、複数のエコー信号の推定値が、マイクロフォン信号から差し引かれて、推定音声信号を生成することを含む。

一実施例では、方法は、推定音声信号及び電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号がヘッドユニットに提供されるように、推定電話プログラムコンテンツエコー信号を推定音声信号に追加することを更に含む。

一実施例では、方法は、第１のプロセッサによって実装されるポストフィルタにおいて、推定音声信号を受信することと、ポストフィルタを用いて、複数のプログラムコンテンツ信号と相関する少なくとも１つの残留成分に、抑制を適用して、エコー抑制された推定音声信号を生成することと、を更に含む。

一実施例では、方法は、ポストフィルタにおいて推定電話プログラムコンテンツエコー信号を受信することと、ポストフィルタから、抑制されていない推定電話プログラムコンテンツエコー信号を出力することと、を更に含む。

１つ以上の実装形態の詳細が、添付図面及び以下の説明において述べられる。他の特徴、目的、及び利点は、本明細書及び図面から、並びに特許請求の範囲から明らかになるであろう。

一実施例による、ヘッドユニット及び増幅器ユニットの概略図である。一実施例による、オーディオ提示処理ユニット及びマルチチャネルエコーキャンセルユニットの概略図である。一実施例による、オーディオ提示処理ユニット及びマルチチャネルエコーキャンセルユニットの概略図である。一実施例による、オーディオ提示処理ユニット及びマルチチャネルエコーキャンセルユニットの概略図である。一実施例による、オーディオ提示処理ユニット及びマルチチャネルエコーキャンセルユニットの概略図である。

車両ヘッドユニットは、典型的には、音楽、ナビゲーション、及びハンズフリー電話信号などのプログラムコンテンツ信号を増幅器ユニットに供給するための複数のサブシステムを含み、これは、車両キャビン内のスピーカによってオーディオ信号に変換するためのプログラムコンテンツ信号を増幅する（多くの場合に何らかの関連付けられた処理とともに）。ハンズフリー電話サブシステムを利用するコール中、車両キャビン内に位置付けられたマイクロフォンは、ユーザの音声信号を受信し、それはハンズフリー電話サブシステムに送信され、そこでモバイルデバイスにルーティングされる。しかしながら、スピーカが、コール中に車両内のプログラムコンテンツ信号を再生している場合、マイクロフォン信号は、キャビン内の音響プログラム信号を受信した結果として、プログラムコンテンツ信号と相関する成分を含むことになる。これは、一般にエコー信号として知られており、マイクロフォンにおいて音声信号の品質を劣化させる。

エコー信号をキャンセルするために、エコーキャンセルシステムをハンズフリー電話サブシステムに含めることができる。しかしながら、電話信号エコーに加えて信号のエコーをキャンセルするために、増幅器ユニットからの参照信号をハンズフリー電話サブシステムに送信する必要がある。増幅器ユニットにおいて典型的には多数のチャネルを考慮すると、これは、増幅器ユニットからハンズフリー電話サブシステムにプログラムコンテンツ参照信号を送信するための追加の高価なバスを必要とし得る。更に、そのようなバスを介して信号を送信することに関連付けられた時間遅延は、エコーキャンセルの性能を劣化させる有意な遅延を導入する可能性がある。したがって、当該技術分野では、増幅器ユニットにおいて、又は参照信号を受信するのに便利な何らかの他の位置において、マイクロフォン信号にエコーキャンセルを導入することができる、モジュール式エコーキャンセルユニットの必要性が存在する。

本明細書に開示される様々な実施例は、ヘッドユニットから受信したプログラムコンテンツ信号に関連するエコー信号をキャンセルし得るモジュール式エコーキャンセルサブシステムを対象とする。図１には、車両に実装されたオーディオシステム１００のブロック図が示されている。示されるように、オーディオシステム１００は、ヘッドユニット１０２及び増幅器ユニット１０４を含み得る。ヘッドユニット１０２は、増幅器ユニット１０４によって処理及び増幅されるプログラムコンテンツを生成するためのサブシステムのセットを含み得る。いくつかのサブシステムは、例えば、ハンズフリー電話サブシステム１０６、アナウンスサブシステム１０８及びエンターテイメントサブシステム１１０を含み得る。ハンズフリー電話サブシステム１０６は、例えば、Ｂｌｕｅｔｏｏｔｈ接続された携帯電話から受信された電話信号ｕ_ｐ（ｎ）を提供し得る。ハンズフリー電話サブシステム１０６はまた、増幅器ユニット１０４からマイクロフォン信号を受信し、ユーザから音声信号を提供し、例えば、Ｂｌｕｅｔｏｏｔｈモジュール１０７を介して携帯電話に送信され得る。（本開示の目的のために、「電話」は、携帯電話及びＶＯＩＰを含む任意のタイプの電話通信を含む。）アナウンスサブシステム１０８は、ターンバイターンナビゲーション又はデジタルアシスタントの音声などのアナウンス信号ｕ_ａ（ｎ）を介して、増幅器ユニット１０４にアナウンスを提供し得る。エンターテイメントサブシステム１１０は、エンターテイメントオーディオ信号ｕ_ｅ（ｎ）を介して、音楽又は他のエンターテイメントオーディオを増幅器ユニット１０４に提供し得る。説明されるサブシステムの動作は、既知であり、本開示の範囲を超えている。ハンズフリー電話サブシステム１０６から離れて、上述のサブシステムに加えて、又はその代わりに、任意の他のタイプのサブシステムが提供され得ることを理解されたい。実際、アナウンスサブシステム１０８及びエンターテイメントサブシステム１１０は、単に、プログラムコンテンツ信号ｕ（ｎ）を増幅器ユニット１０４に提供し得るヘッドユニット１０２サブシステムの実施例として提供される。

プログラムコンテンツ信号ｕ（ｎ）は、アナログ信号又はデジタル信号であり得、圧縮及び／又はパケット化されたストリームとして提供され得、追加情報は、マルチチャネルエコーキャンセルユニット１１２などの処理構成要素又は他の構成要素の制御及び／又は構成のための、別のシステムからの命令、コマンド、又はパラメータなどの、そのようなストリームの一部として受信され得る。

プロセッサによって実行されるとき、ヘッドユニット１０２の様々なサブシステムを定義するために必要な様々な機能を実行するプログラムコードを記憶するように構成されている非一時的な記憶媒体と一緒に、ヘッドユニット１０２は、プロセッサ、又はプロセッサの集合によって実装され得る。

増幅器ユニット１０４は、オーディオ提示処理サブシステム１１４、マルチチャネルエコーキャンセルユニット１１２、及び増幅器１１６を含み得る。概して、オーディオ提示処理サブシステム１１４は、１つ以上の音響トランスデューサ１１８によって変換されるように、混合及び拡声器ルーティングなどの受信されたプログラムコンテンツ信号ｕ（ｎ）に様々なオーディオ処理動作を提供し得る。この機能性は、一般に、音声ステージ演出２０６によって図２～５に実装されるが、様々な実施例では、音声提示処理サブシステム１１４は、音声ステージ演出２０６に加えて、オーディオ処理（例えば、アップミキシング、ダウンミキシング、ルーティングなど）を含み得ることを理解されたい。実際、音声ステージ演出２０６として図２～図５に示される提示処理サブシステム１１４のオーディオ処理は、単に一実施例として提供される。

プロセッサによって実行されるとき、提示処理サブシステム１１４の様々な機能を実行するプログラムコードを記憶するように構成されている非一時的な記憶媒体と一緒に、提示処理サブシステム１１４は、プロセッサ、又はプロセッサの集合によって実装され得る。一般に、提示処理サブシステム１１４は、ヘッドユニット１０２を実装するプロセッサとは別個のプロセッサ上に実装される。

増幅器１１６は、音声提示処理サブシステム１１４の出力を増幅し、音響トランスデューサ１１８を駆動して、音響信号を生成し得る。増幅器１１６は、オーディオ提示処理サブシステム１１４を定義する同じプロセッサによって、又は別個のプロセッサによって、実装され得る。代替実施例では、増幅器１１６は、ハードウェア、又はハードウェアとファームウェアとの組み合わせによって実装され得る。

マルチチャネルエコーキャンセルユニット１１２は、増幅器ユニット１０４内に実装されて示されているが、様々な代替例では、マルチチャネルエコーキャンセルユニット１１２は、増幅器１１６又はオーディオ提示処理サブシステム１１４とは別個のプロセッサ又はプロセッサの組み合わせ内に実装され得ることを理解されたい。実際、マルチチャネルエコーキャンセラが参照信号としてプログラムコンテンツチャネルｕ（ｎ）を受信する限り、マルチチャネルエコーキャンセルユニット１１２は、専用プロセッサ、又は他の場所に位置され得る。したがって、本明細書に記載されるマルチチャネルエコーキャンセルユニット１１２は、完全にモジュール式であり、したがって、任意の好適なプロセッサに含まれ得る。

音響トランスデューサ１１８によって出力される音響信号は、望ましくなく、１つ以上のマイクロフォン１２０によって拾い上げられ得る。一般に、マイクロフォン１２０に入力される音響トランスデューサ１１８の音響生成の任意の態様は、本明細書ではエコーと称される。

マルチチャネルエコーキャンセルユニット１１２は、一般に、プログラムコンテンツ（例えば、電話信号ｕ_ｐ（ｎ）、アナウンス信号ｕ_ａ（ｎ）、エンターテイメントオーディオ信号ｕ_ｅ（ｎ）など）を参照信号として使用して、マイクロフォン信号からエコーの任意の態様を除去するように機能し、そのため、推定ユーザの音声信号

（及びエコーと相関しないノイズ）のみを含むマイクロフォン信号は、ヘッドユニット１０２のハンズフリー電話サブシステム１０６に戻されて提供される。したがって、マルチチャネルエコーキャンセルユニット１１２は、マイクロフォン信号ｙ（ｎ）のマルチチャネルエコーキャンセル（すなわち、プログラムコンテンツｕ（ｎ）のいくつかのチャネル）を提供する。様々な実施例では、マルチチャネルエコーキャンセルユニット１１２は、ハンズフリー電話サブシステム１０６に提供されたエコーキャンセラによってキャンセルされることになる出力推定音声信号

に戻して、電話信号ｕ_ｐ（ｎ）のエコーｄ_ｐ（ｎ）の推定値を人工的に追加し得る。以下でより詳細に説明するように、様々な実施例では、マルチチャネルエコーキャンセルユニット１１２によって受信された参照信号は、必ずしも、ヘッドユニット１０２によって出力されたプログラムコンテンツ信号ｕ（ｎ）ではないことを理解されたい。むしろ、いくつかの追加のオーディオ処理は、信号が参照信号としてマルチチャネルエコーキャンセルユニット１１２に送信される前に、例えば、オーディオ提示処理１１４によって、プログラムコンテンツ信号ｕ（ｎ）に適用され得る。

オーディオ提示処理サブシステム１１４及びマルチチャネルエコーキャンセルユニット１１２は、図２～図５により詳細に示されている。示されるように、マルチチャネルエコーキャンセルユニット１１２は、エコーキャンセラ２００を含み得る。エコーキャンセラ２００は、エコー信号ｄ（ｎ）をマイクロフォン信号ｙ（ｎ）から除去しようとするように機能して、残留信号ｅ（ｎ）を提供する。エコーキャンセラ２００は、エコーキャンセルフィルタ２０４（マルチチャネルエコーキャンセルフィルタを一緒に形成する複数のエコーキャンセルフィルタ）を介してチャネル２０２上に提供されるコンテンツ信号ｕ（ｎ）を処理することによって、エコー信号ｄ（ｎ）を最小化して、マイクロフォン１２０によって提供される信号ｙ（ｎ）から差し引かれる推定エコー信号

を生成するように機能する。上述のように、様々な代替の実施形態では、プログラムコンテンツ信号ｕ（ｎ）ではなく、音声ステージ演出２０６、ｂ（ｎ）の出力は、エコーキャンセラ２００のための参照信号として使用され得る。実際、少なくとも１つのプログラムコンテンツ信号ｕ（ｎ）と相関し、かつマイクロフォン信号ｙ（ｎ）におけるエコー信号ｄ（ｎ）の存在を最小化するのに好適な任意の信号は、エコーキャンセラ２００のための参照信号として使用され得る。

エコーキャンセラ２００は、推定エコー信号

を改善するために、間隔でエコーキャンセルフィルタ２０４を更新するための適合アルゴリズムを含み得る。経時的に、適合アルゴリズムは、エコーキャンセルフィルタ２０４を、十分に正確な推定エコー信号

を生成する満足のいくパラメータに収束させる。一般に、適合アルゴリズムは、ユーザが発話していない時間中にエコーキャンセルフィルタ２０４を更新するが、いくつかの実施例では、適合アルゴリズムは、任意の時点で更新を行い得る。ユーザが発話すると、そのようなものは「ダブルトーク」と見なされ、マイクロフォン１２０は、音響エコー信号ｄ（ｎ）及び音響音声信号ｓ（ｎ）．の両方を拾い上げる。ダブルトークは、任意の好適な方法に従って、ダブルトーク検出器２０８によって検出され得る。

エコーキャンセルフィルタ２０４は、フィルタ係数のセットをコンテンツ信号２０２に適用して、推定エコー信号

を生成し得る。適合アルゴリズムは、様々な技術のいずれかを使用して、フィルタ係数を決定し、フィルタ係数を更新又は変更して、エコーキャンセルフィルタ２０４の性能を改善し得る。そのような適合アルゴリズムは、アクティブフィルタ又はバックグラウンドフィルタで動作するかにかかわらず、例えば、最小平均二乗（least mean squares、ＬＭＳ）アルゴリズム、正規化最小二乗法（normalized least mean squares、ＮＬＭＳ）アルゴリズム、再帰的最小二乗（recursive least square、ＲＬＳ）アルゴリズム、又はこれら又は他のアルゴリズムの任意の組み合わせ若しくは変動を含み得る。エコーキャンセルフィルタ２０４は、適合アルゴリズムによって適合されるように、音響トランスデューサ１１８とマイクロフォン１２０との間のエコーパスを表す推定伝達関数

を音響トランスデューサ１１８の出力に適用するように収束する。

一般的に言えば、図２～図５に示されるように、各適合エコーキャンセルフィルタ２０４は、参照信号として、プログラムコンテンツ信号ｕ（ｎ）のうちの１つを受信する。例えば、エコーキャンセルフィルタ２０４は、プログラムコンテンツチャネル２０２ａからの信号ｕ_ａ（ｎ）と関連付けられ、信号ｕ_ａ（ｎ）を受信し、１つ以上のエコーパスｈ（ｎ）（音声ステージ演出２０６の後にｕ_ａ（ｎ）にいくらかの点で相関する）を表すそれぞれの伝達関数

及び任意の追加の処理の応答（以下に記載されるように）を適用し得る。同様に、残りの適合エコーキャンセルフィルタ１２４は、プログラムコンテンツチャネル２０２からの信号ｕ（ｎ）と関連付けられ、それを受信し、それぞれの伝達関数

を適用し得る。各適合エコーキャンセルフィルタ２０４のそれぞれの伝達関数は、エコーキャンセル、残留信号ｅ（ｎ）としてここに示されるエラー信号を最小化するように調整される。

適合エコーキャンセルフィルタ２０４の数が、一般に、受信された参照信号の数に依存することを理解されたい。したがって、プログラムコンテンツ信号ｕ（ｎ）が参照信号として使用される場合、プログラムコンテンツ信号ｕ（ｎ）の数に等しいいくつかの数のエコーキャンセルフィルタ２０４が実装され得、各エコーキャンセルフィルタ２０４は、プログラムコンテンツ信号ｕ（ｎ）のうちの１つとそれぞれ関連付けられている。一方、音声ステージ演出出力ｂ（ｎ）が使用される場合、いくつかのＮ個のエコーキャンセルフィルタ２０４が実装され得、各エコーキャンセルフィルタ２０４は、Ｎ個の音声ステージ演出出力ｂ（ｎ）のうちの１つとそれぞれ関連付けられている。いくつかの実施例では、例えば、プログラムコンテンツ信号ｕ（ｎ）又は音声ステージ演出出力ｂ（ｎ）よりも少ない数の適合エコーキャンセルフィルタ２０４が、使用され得ることも理解されたい。例えば、ウーファー左、ツイドラー左、及びツイドラー左プログラムコンテンツ信号ｕ（ｎ）のセットなどの特定のプログラムコンテンツ信号ｕ（ｎ）が一緒に合計され、単一のエコーキャンセルフィルタ２０４に参照信号として提供され得るか、又は参照信号のサブセットのみが、有効エコーキャンセルを達成するために使用される必要がある場合に、より少ないエコーキャンセルフィルタ２０４は使用され得る。

エコーパスｈ（ｎ）を推定することに加えて、推定伝達関数

は、参照信号（例えば、プログラムコンテンツ信号ｕ（ｎ））が取られる位置とエコーキャンセラ２００との間に配置された任意の処理の推定値を表し得る。したがって、図１Ａに示されるように、参照信号は、プログラムコンテンツ信号ｕ（ｎ）であり、推定伝達関数

は、エコーパスｈ（ｎ）の応答に加えて、音声ステージ演出２０６、音響トランスデューサ１１８、マイクロフォン１２０、及びマイクロフォン１２０に関連付けられた任意の処理（アレイ処理など）の応答を表すことになる。したがって、推定伝達関数

は、プログラムコンテンツ信号ｕ（ｎ）が、マイクロフォン１２０で実行される応答及び任意の処理と併せて、その受信された形態からエコー信号ｄ（ｎ）にどのように変換されるかについての表現である。しかしながら、参照信号が、音声ステージ演出２０６、ｂ（ｎ）の出力で取られる場合、推定伝達関数

は、音響トランスデューサ１１８、エコーパスｈ（ｎ）、マイクロフォン１２０、及びマイクロフォン１２０に関連付けられた任意の処理の応答を集合的に表す。したがって、図１及び図２は、Ｎ個の推定エコー信号

ではなく３つの推定エコー信号

を示すが、音声ステージ演出２０６の応答が推定伝達関数

に含まれるため、推定エコー信号

の各々は、音声ステージ演出２０６による関連付けられたプログラムコンテンツ信号ｕ（ｎ）の処理を含む。したがって、推定エコー信号

の合計は、Ｎエコー信号ｄ（ｎ）の合計を推定することになる。

加えて、図３に示されるように、マルチチャネルエコーキャンセルユニット１１２は、改善された推定音声信号

を生成するためにスペクトルフィルタリングを適用することによって、残留信号ｅ（ｎ）に存在する残留エコーを抑制するように構成されているポストフィルタサブシステム２１０を更に含み得る。

エコーキャンセラ２００は、プログラムコンテンツチャネルと相関するマイクロフォン信号ｙ（ｎ）の線形態様をキャンセルするが、エコーパスにおける急速な変更及び／又は非線形性は、エコーキャンセラ２００が正確な推定エコー信号ｄ（ｎ）を提供することを防止し、したがって、残留エコーは、残留信号ｅ（ｎ）内に残ることになる。したがって、ポストフィルタサブシステム２１０は、スペクトルフィルタリングで残留エコー成分を抑制して、改善された推定音声信号

を生成するように動作する。そのようなポストフィルタは、一般に、当該技術分野で既知であるが、一実施例の簡単な説明を以下に提供する。

ポストフィルタサブシステム２１０は、ポストフィルタ２１２及び係数算出器２１４を備える。ポストフィルタ２１２は、いくつかの実施例では、周波数ビンによって、全信号パワー（例えば、発話及び残留エコー）に対する残留エコー信号パワーの可能性の高い比に関連する量だけ、残留信号ｅ（ｎ）のスペクトルコンテンツを低減することによって、（エコーキャンセラ２００からの）残留信号における残留エコーを抑制する。一実施例では、ポストフィルタ２１２は、以下の実施例の方程式に従って、係数計算器２１４によって計算される、フィルタ係数Ｈ_ｐｆ（ｋ）によって、残留信号ｅ（ｎ）の各周波数ビン（インデックス「ｋ」で表される）を乗算し得る。

式（１）中、ΔＨ_ｉ（ｋ）は、スペクトルミスマッチであり、Ｓ_ｅｅ（ｋ）は、残留信号のパワースペクトル密度であり、

は、ｉ番目のコンテンツチャネル上のプログラムコンテンツ信号ｕ（ｎ）のパワースペクトル密度である。合計が、全てのプログラムコンテンツ信号２０２にわたることに留意されたい。最小乗数Ｈ_ｍｉｎは、全ての周波数ビンに適用され、それにより、周波数ビンが最小値よりも小さく乗算されないことを確実にする。より低い値による乗算が、より大きな減衰と等価であることを理解されたい。方程式（１）の実施例では、各周波数ビンが、最大でも１で乗算されるが、他の例が、フィルタ係数を計算するために異なるアプローチを使用し得ることにも留意されたい。β因子は、ポストフィルタ２１２が信号コンテンツを抑制する方法を調整するために使用され得るスケーリング又は過剰推定因子であるか、又はいくつかの実施例では、１に等しいことによって効果的に除去され得る。ρ因子は、ゼロによる分割を避けるための正則化因子である。

スペクトルミスマッチΔＨ_ｉ（ｋ）は、実際のエコーパスと音響エコーキャンセラ２００との間のスペクトルミスマッチを表す。実際のエコーパスは、例えば、音声ステージ演出２０６、音響トランスデューサ１１８、音響環境を介して、及びマイクロフォン１２０を介してエコーキャンセラ２００に提供される場所から、プログラムコンテンツ信号ｕ（ｎ）によって取られたパス全体である。実際のエコーパスは、例えばアレイ処理などの、マイクロフォン１２０、又は他の支援構成要素による処理を更に含み得る。スペクトルミスマッチΔＨ_ｉ（ｋ）は、ｉ番目のコンテンツチャネル２０２上のプログラムコンテンツ信号ｕ（ｎ）、及び残留信号ｅ（ｎ）のクロスパワースペクトル密度

と、ｉ番目のコンテンツチャネル２０２上のプログラムコンテンツ信号ｕ（ｎ）のパワースペクトル密度

との比として計算され得る。

いくつかの実施例では、使用されるパワースペクトル密度は、計算されたスペクトルミスマッチにおいて突然の変更（例えば、迅速又は有意な変更）を防止するために、時間平均化され得るか、又は別様に平滑化若しくはローパスフィルタリングされ得る。

式（１）及び（２）は、一般に、参照信号が相関していない場合に関することを理解されたい。参照信号が必ずしも相関していない（例えば、左及び右のチャネル対がいくらかの共通のコンテンツを共有する）場合、係数計算器２１４は、以下の式に従ってフィルタ係数Ｈ_ｐｆ（ｋ）を計算し得る。

式（３）中、ΔＨ^Ｈは、ΔＨのエルミートを表し、これは、ΔＨの複素共役転置であり、式中、ΔＨは以下によって与えられる。

Ｓ_ｕｕは、プログラムコンテンツチャネルのパワースペクトル密度及びクロスパワースペクトル密度のマトリックスである。ΔＨは、全てのチャネルのスペクトルミスマッチを含むベクトルでありＳ_ｕｅ、は、エラー信号を有する各参照チャネルのクロスパワースペクトル密度を含むベクトルである。

上記の式は、複数のコンテンツチャネル２０２からの残留エコーを抑制するように構成されているポストフィルタ２１２のために提供されているが、代替実施例では、ポストフィルタ２１２は、１つのコンテンツチャネル２０２のみからの残留エコーを抑制するように構成され得る。

様々な実施例では、ポストフィルタ２１２は、周波数ドメイン又は時間ドメインで動作するように構成され得る。したがって、「フィルタ係数」という用語の使用は、ポストフィルタ２１２を時間ドメインにおける動作に限定することを意図するものではない。「フィルタ係数」という用語又は他の同等の用語は、所望の応答若しくは所望の伝達関数を引き起こすためにフィルタに適用されるか、又はフィルタに組み込まれた任意の値のセットを指し得る。特定の実施例では、ポストフィルタ２１２は、推定音声信号のデジタル版で動作して、一般に１以下の別個の値によって、個々の周波数ビン内の信号コンテンツを乗算するデジタル周波数ドメインフィルタであり得る。別個の値のセットは、フィルタ係数と見なされ得る。

エコーキャンセラ２００及びポストフィルタサブシステム２１０の両方は、ダブルトーク条件が、例えば、ダブルトーク検出器２０８によって検出されない期間中にのみ、エコーキャンセルフィルタ２０４係数及びポストフィルタ２１２の係数をそれぞれ計算するように構成され得る。上述のように、ユーザがオーディオシステム１００の音響環境内で発話されるとき、マイクロフォン信号ｙ（ｎ）は、ユーザの発話である成分を含む。この場合、合成信号ｙ（ｎ）は、音響トランスデューサ１１８からのエコーのみを表すものではなく、残留信号ｅ（ｎ）は、残留エコー、例えば、実際のエコーパスに対するエコーキャンセラ２００のミスマッチを表すものではない（ユーザが発話しているため）。したがって、ダブルトーク検出器２０８は、いつダブルトークが検出されるのかを示すように動作し、新しい係数は、この期間中に計算されない場合があり、開始時又はユーザがトークする前において有効な係数は、ユーザがトークしている間に使用され得る。ダブルトーク検出器２０８は、任意の好適なシステム、構成要素、アルゴリズム、又はそれらの組み合わせであり得る。

したがって、図１に関連して説明される増幅器ユニット１０４は、ヘッドユニット１０２のプロセッサと分離した別個のプロセッサにおいて、マルチチャネルエコーキャンセルを提供する。したがって、ヘッドユニット１０２に入力された推定音声信号

は、参照信号をヘッドユニット１０２に送信し戻すことなく、かつヘッドユニット１０２自体への変更を必要とせずに、マルチチャネルエコーキャンセルを受信し得る。

しかしながら、上述のように、多くのハンズフリー電話サブシステムはまた、電話信号ｕ_ｐ（ｎ）と相関するエコー信号に関してある程度のエコーキャンセルを実行するであろう。したがって、エコー信号が存在することが見出されない場合、いくつかのハンズフリー電話サブシステムはエラーを登録し、機能不全マイクロフォンなどのより大きな機能不全を示すエコーの欠如を解釈し得る。したがって、電話エコー信号ｄ_ｐ（ｎ）を詐称し、かつハンズフリー電話サブシステム１０６にそれを提供することが有利である。

これは、いくつかの方法、例えば、第１の方法で達成され得、例えば、エコーキャンセルフィルタ２０４ｂ（すなわち、電話信号ｕ_ｐ（ｎ）を参照信号として受信するエコーキャンセルフィルタ２０４）によって計算されるように、推定電話エコー信号

は、係数計算に含まれ、推定エコー信号

の一部として合計され、マイクロフォン信号ｙ（ｎ）から差し引かれる（以下に記載されるように）が、次いで、図２及び図３に示されるように、少なくとも２つの位置のうちの１つにおいて出力信号に追加され得る。

図２に示されるように、推定電話エコー信号

は、ポストフィルタ２１２の後の位置において追加されて、マルチチャネルエコーキャンセルユニット１１２の出力において、推定発話

及び推定電話エコー信号

を提供することをもたらし得る。ポストフィルタ２１２が、残留信号ｅ（ｎ）において電話エコー信号

の存在を抑制するので、ポストフィルタ２１２の下流の位置に信号を追加することは、推定電話エコー信号

を抑制することを防止する。

あるいは、図３に示されるように、推定電話エコー信号

は、ポストフィルタ２１２の前の場所において追加され得る。この実施例では、ポストフィルタサブシステム２１０は、抑制なしで推定電話エコー信号

を通過させるように構成され得る。例えば、フィルタ後係数計算は、式（５）に従って、スペクトルミスマッチ合計における電話プログラムコンテンツ信号ｕ_ｐ（ｎ）を除いて、係数を計算するように修正され得る。

（ここでは、

は、コンテンツチャネル２０２ｂを合計から除外することを表し、これは、電話プログラムコンテンツ信号ｕ_ｐ（ｎ）を含む。）したがって、ポストフィルタ２１２は、電話プログラムコンテンツ信号ｕ_ｐ（ｎ）と相関する残留信号の成分をフィルタリングすることなく、残留信号ｅ（ｎ）をフィルタリングする。言い換えれば、ポストフィルタ２１２は、フィルタリングされてない状態で推定電話エコー信号

を通過することになる一方で、残留信号の残りの成分のスペクトルミスマッチは、通常としてフィルタリングされ、再び、マルチチャネルエコーキャンセルユニット１１２の出力において、推定音声

及び推定電話エコー信号

をもたらす。

式（５）は、一般に、参照信号が相関していない場合に関することを理解されたい。参照信号が必ずしも相関していない（例えば、左及び右のチャネル対がいくらかの共通のコンテンツを共有する）場合、係数計算器１２６は、以下の式に従ってフィルタ係数Ｈ_ｐｆ（ｋ）を計算し得る。

式（６）において、チルドで示される変数は、電話信号に対応する用語を除外する。

は、ΔＨであり、電話チャネルのスペクトルミスマッチΔＨ_{ｐｈｏｎｅ}を除外した。同様に、

は、電話チャネルＰＳＤ及びクロスＰＳＤが除去された、すなわち、１行及び１列少ないＳ_ｕｕである。

別の実施例では、図４に示されるように、エコーキャンセラ２００は、係数計算における電話信号ｕ_ｐ（ｎ）からの参照信号を含むが、エコーキャンセルフィルタ２０４の合計から推定電話エコー信号ｄ_ｐ（ｎ）を除外する（別様に生成しない）（したがって、図４に示されるように、２０４ｂの出力は、合計に含まれない）、各適合エコーキャンセルフィルタ２０４のための適合フィルタ係数を計算し得る。したがって、エコーキャンセルフィルタ２０４の合計出力は、

として表され得る。これにより、残留信号ｅ（ｎ）に残る電話プログラムコンテンツ信号ｕ_ｐ（ｎ）と相関する推定エコー

が生じることになる。これは、

として図４に表される。電話プログラムコンテンツ信号ｕ_ｐ（ｎ）と相関する推定エコー

がエコーキャンセルフィルタ２０４の適合を歪めることを防止するために、推定エコー

は、エコーキャンセルフィルタ２０４のエラー信号から差し引かれ得る。

図５に示される別の実施例では、エコーキャンセラ２００は、電話プログラムコンテンツ信号ｕ_ｐ（ｎ）を受信するエコーキャンセルフィルタ２０４ｂを除外し得る。図４の実施例と同様に、エコーキャンセルフィルタ２０４の合計出力は、

として表され得る。これにより、同様に、

として表される、残留信号に残る電話プログラムコンテンツ信号ｕ_ｐ（ｎ）と相関する推定エコー

が生じることになる。しかしながら、推定エコー

がエコーキャンセルフィルタ２０４の適合を歪めるのを防止するために、ダブルトーク検出器２０８を使用して、電話プログラムコンテンツチャネル２０２ｂ上に信号が存在するときに、エコーキャンセルフィルタ２０４の適合を一時停止し得る。言い換えれば、エコーキャンセルフィルタ２０４は、いくつかの電話プログラムコンテンツ信号ｕ_ｐ（ｎ）がある間は更新されない。

図４及び図５に関連して説明される実施例は、図３に関連して説明したように、ポストフィルタ２１２が、推定電話エコー信号

を再度通過させることを必要とする。図４及び図５に関連して説明される実施例は、マルチチャネルエコーキャンセルユニット１１２の出力において、推定発話

及び推定電話エコー信号

を提供することをもたらすであろう。

したがって、上記の２～５の実施例は、マルチチャネルエコーキャンセルユニット１１２の出力において、推定電話エコー信号

を提供する方法を示し、それは、ハンズフリー電話サブシステム１０６のハンズフリー電話サブシステムによってキャンセルされ得る。

本開示において、識別子として、又は下付き文字として使用される大文字は、下付き文字又は識別子が使用される任意の数の構造又は信号を表すことを理解されたい。したがって、音響トランスデューサ１１８Ｎは、様々な実施例では、任意の数の音響トランスデューサ１１８が実装され得るという概念を表す。実際、いくつかの実施例では、１つの音響トランスデューサのみが実装され得る。同様に、音声ステージ演出出力信号ｂ_Ｎ（ｎ）は、任意の数の音声ステージ演出出力信号ｂ（ｎ）が使用され得るという概念を表す。異なる信号又は構造のために使用される同じ文字、例えば、音声ステージ演出出力ｂ_Ｎ（ｎ）及びエコー信号

は、同じ数の特定の信号又は構造が存在する一般的な場合を表すことを理解されたい。したがって、一般的な場合、同じ数の音声ステージ演出出力ｂ_Ｎ（ｎ）及びエコー信号

が存在することになる。しかしながら、一般的な場合は限定的であると見なされるべきではない。当業者は、本開示の検討と併せて、特定の実施例では、異なる数のそのような信号又は構造が使用され得ることを理解するであろう。

本明細書に記載される機能又はその部分、及びその様々な修正（以下「機能」）は、少なくとも部分的にコンピュータプログラム製品（例えば、１つ以上のデータ処理装置、例えば、プログラム可能プロセッサ、コンピュータ、複数のコンピュータ、及び／若しくはプログラム可能論理構成要素、による実行のための、又はその動作を制御するための、１つ以上の非一時的機械可読媒体又は記憶デバイスなどの情報担体において有形に具現化されたコンピュータプログラム）を介して実装され得る。

コンピュータプログラムは、コンパイラ型言語又はインタープリタ型言語を含む任意の形態のプログラム言語で書くことができ、それは、スタンドアローンプログラムとして、又はコンピューティング環境での使用に好適なモジュール、構成要素、サブルーチン、若しくは他のユニットとして含む任意の形態で配備され得る。コンピュータプログラムは、１つのコンピュータ上で、若しくは１つのサイトにおける複数のコンピュータ上で実行されるように配備されるか、又は複数のサイトにわたって配信されて、ネットワークによって相互接続され得る。

機能の全部又は一部を実装することと関連した動作は、較正プロセスの機能を実施するために１つ以上のコンピュータプログラムを実行する１つ以上のプログラム可能なプロセッサによって実施され得る。機能の全部又は一部は、特殊目的論理回路、例えば、ＦＰＧＡ及び／又はＡＳＩＣ（application-specific integrated circuit、特定用途向け集積回路）として実装され得る。

コンピュータプログラムの実行に好適なプロセッサとしてはまた、例として、一般的及び特殊目的マイクロプロセッサの両方、並びに任意の種類のデジタルコンピュータの任意の１つ以上のプロセッサが挙げられる。一般的に、プロセッサは、読み出し専用メモリ、ランダムアクセスメモリ、又はそれらの両方から命令及びデータを受信することになる。コンピュータの構成要素は、命令を実行するためのプロセッサ、並びに命令及びデータを記憶するための１つ以上のメモリデバイスを含む。

本明細書において、いくつかの発明実施形態について記述し説明してきたが、当業者であれば、様々な他の手段、及び／又は、機能を実施し及び／若しくは結果を得るための構造、及び／又は、本明細書に記載の１つ以上の利点を容易に思いつくことができ、並びに、こうした変更形態及び／又は変形形態の各々は、本明細書に記載の発明実施形態の範囲内にあると見なすことができる。より一般的には、当業者であれば、本明細書に記載のパラメータ、寸法、材料、及び構成の全てが例示的であること、実際のパラメータ、寸法、材料、及び／又は構成は、特定のアプリケーション又は本発明の教示が使用されるアプリケーションに依存するであろうことを容易に理解するであろう。当業者であれば、わずかなありふれた実験を行うだけで、本発明に記載されている特定の発明実施形態に相当する多くの等価物を認識又は確認することができるであろう。したがって、前述の実施形態は、単なる例として提示されたものであり、添付の特許請求の範囲及びその等価物の範囲内で、明確に記載され特許請求された以外の別のやり方で発明実施形態を実践することができるということを理解されたい。本開示の発明実施形態は、本明細書に記載の各個々の特徴、システム、物品、材料、及び／又は方法を対象とする。更に、２つ以上のこうした特徴、システム、物品、材料、及び／又は方法のいかなる組む合わせも、こうした特徴、システム、物品、材料、及び／又は方法が相互に矛盾しない場合、本開示の発明の範囲内に含まれる。

１０２ヘッドユニット
１０６ハンズフリー電話サブシステム
１０７Ｂｌｕｅｔｏｏｔｈモジュール
１０８アナウンスサブシステム
１１０エンターテイメントサブシステム
１１２マルチチャネルエコーキャンセルユニット
１１４オーディオ提示処理サブシステム
１１６増幅器
１１８音響トランスデューサ
１２０マイクロフォン

Claims

オーディオシステムであって、
少なくとも第１のプロセッサを備えるヘッドユニットであって、前記ヘッドユニットが、複数のプログラムコンテンツ信号を生成するように構成されており、前記複数のプログラムコンテンツ信号のうちの１つが、電話から受信される電話プログラムコンテンツ信号であり、前記複数のプログラムコンテンツ信号が、音響トランスデューサによって車両キャビン内の音響信号に変換される、ヘッドユニットと、
マイクロフォンであって、前記マイクロフォンが、前記音響信号を受信し、複数のエコー信号を含むマイクロフォン信号を生成するように前記車両キャビン内に配置されており、前記複数のエコー信号のうちの各エコー信号が、前記複数のプログラムコンテンツ信号のうちの少なくとも１つのプログラムコンテンツ信号と相関する前記マイクロフォン信号の成分である、マイクロフォンと、
第２のプロセッサによって実装されているマルチチャネルエコーキャンセルユニットであって、前記マルチチャネルエコーキャンセルユニットが、複数の参照信号であって、前記複数の参照信号の各々が、前記複数のプログラムコンテンツ信号のうちの少なくとも１つと相関する、複数の参照信号と、マイクロフォン信号と、を受信することと、前記複数の参照信号に従って、前記複数のエコー信号を最小化することと、推定音声信号を生成することと、前記推定音声信号を前記ヘッドユニットに提供することと、を行うように構成されている、マルチチャネルエコーキャンセルユニットと、を備える、オーディオシステム。
前記マルチチャネルエコーキャンセルユニットが、前記複数のエコー信号の推定値を提供するように構成されているマルチチャネルエコーキャンセルフィルタを備え、前記複数のエコー信号の前記推定値が、前記マイクロフォン信号から差し引かれて、前記推定音声信号を生成し、前記電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号が、前記推定音声信号に追加され、これによって、前記推定音声信号及び前記推定電話プログラムコンテンツエコー信号が、前記ヘッドユニットに提供される、請求項１に記載のオーディオシステム。
前記推定音声信号を受信し、前記複数のプログラムコンテンツ信号のうちの少なくとも１つと相関する少なくとも１つの残留成分を抑制して、エコー抑制された推定音声信号を生成するように構成されている、ポストフィルタを更に備える、請求項２に記載のオーディオシステム。
前記推定電話プログラムコンテンツエコー信号が、前記エコー抑制された推定音声信号に追加される、請求項３に記載のオーディオシステム。
前記ポストフィルタが、前記推定音声信号及び前記推定電話プログラムコンテンツエコー信号を受信し、前記エコー抑制された推定音声信号及び前記推定電話プログラムコンテンツエコー信号を出力するように構成されており、前記推定電話プログラムコンテンツエコー信号が、抑制されないままである、請求項３に記載のオーディオシステム。
前記ポストフィルタが、スペクトルミスマッチ合計から前記推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない前記推定電話プログラムコンテンツエコー信号を出力するように構成されている、請求項５に記載のオーディオシステム。
前記複数の参照信号が、前記複数のプログラムコンテンツ信号を含む、請求項１に記載のオーディオシステム。
第１のプロセッサ上に実装されているマルチチャネルエコーキャンセルユニットであって、
複数の参照信号を受信するための少なくとも１つのプログラムコンテンツ入力であって、前記複数の参照信号の各々が、第２のプロセッサを含むヘッドユニットから出力された複数のプログラムコンテンツ信号のうちの少なくとも１つと相関し、前記複数のプログラムコンテンツ信号のうちの１つが、電話プログラムコンテンツ信号である、少なくとも１つのプログラムコンテンツ入力と、
複数のエコー信号を含むマイクロフォン信号を受信するためのマイクロフォン入力であって、前記複数のエコー信号のうちの各エコー信号が、前記複数のプログラムコンテンツ信号のうちの少なくとも１つのプログラムコンテンツ信号と相関する前記マイクロフォン信号の成分である、マイクロフォン入力と、
前記複数の参照信号に従って、前記複数のエコー信号を最小化し、推定音声信号を生成し、かつ前記推定音声信号を前記ヘッドユニットに提供するように構成されている、エコーキャンセラと、を備える、マルチチャネルエコーキャンセルユニット。
前記エコーキャンセラが、前記複数のエコー信号の推定値を提供するように構成されているマルチチャネルエコーキャンセルフィルタを備え、前記複数のエコー信号の前記推定値が、前記マイクロフォン信号から差し引かれて、前記推定音声信号を生成し、前記電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号が、前記推定音声信号に追加され、これによって、前記推定音声信号及び前記推定電話プログラムコンテンツエコー信号が、前記ヘッドユニットに提供される、請求項８に記載のマルチチャネルエコーキャンセルユニット。
前記推定音声信号を受信し、前記複数のプログラムコンテンツ信号と相関する少なくとも１つの残留成分を抑制して、エコー抑制された推定音声信号を生成するように構成されている、ポストフィルタを更に備える、請求項９に記載のマルチチャネルエコーキャンセルユニット。
前記推定電話プログラムコンテンツエコー信号が、前記エコー抑制された推定音声信号に追加される、請求項１０に記載のマルチチャネルエコーキャンセルユニット。
前記ポストフィルタが、前記推定音声信号及び前記推定電話プログラムコンテンツエコー信号を受信し、前記エコー抑制された推定音声信号及び前記推定電話プログラムコンテンツエコー信号を出力するように構成されており、前記推定電話プログラムコンテンツエコー信号が、抑制されないままである、請求項１０に記載のマルチチャネルエコーキャンセルユニット。
前記ポストフィルタが、スペクトルミスマッチ合計から前記推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない前記推定電話プログラムコンテンツエコー信号を出力するように構成されている、請求項１２に記載のマルチチャネルエコーキャンセルユニット。
マルチチャネルエコーキャンセルを実行するための方法であって、
第１のプロセッサにおいて、複数の参照信号を受信することであって、前記複数の参照信号の各々が、第２のプロセッサを含むヘッドユニットから出力された複数のプログラムコンテンツ信号のうちの少なくとも１つと相関し、前記複数のプログラムコンテンツ信号のうちの１つが、電話プログラムコンテンツ信号である、受信することと、
複数のエコー信号を含むマイクロフォン信号を受信することであって、前記複数のエコー信号のうちの各エコー信号が、前記複数のプログラムコンテンツ信号のうちの少なくとも１つのプログラムコンテンツ信号と相関する前記マイクロフォン信号の成分である、受信することと、
第１のプロセッサによって定義されるエコーキャンセラを用いて、複数の参照信号に従って、前記複数のエコー信号を最小化して、推定音声信号を生成することと、
前記推定音声信号を前記ヘッドユニットに提供することと、を含む、方法。
前記複数のエコー信号を最小化する工程が、
前記第１のプロセッサによって定義されるマルチチャネルエコーキャンセルフィルタを用いて、前記複数のエコー信号の推定値を生成して、前記複数のエコー信号の前記推定値が、前記マイクロフォン信号から差し引かれて、前記推定音声信号を生成することを含む、請求項１４に記載の方法。
前記推定音声信号及び前記電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号が前記ヘッドユニットに提供されるように、前記推定電話プログラムコンテンツエコー信号を前記推定音声信号に追加することを更に含む、請求項１５に記載の方法。
前記第１のプロセッサによって実装されるポストフィルタにおいて、前記推定音声信号を受信することと、
前記ポストフィルタを用いて、前記複数のプログラムコンテンツ信号と相関する少なくとも１つの残留成分に、抑制を適用して、エコー抑制された推定音声信号を生成することと、を更に含む、請求項１６に記載の方法。
前記推定電話プログラムコンテンツエコー信号が、前記エコー抑制された推定音声信号に追加される、請求項１７に記載の方法。
前記ポストフィルタにおいて前記推定電話プログラムコンテンツエコー信号を受信することと、
前記ポストフィルタから、抑制されていない前記推定電話プログラムコンテンツエコー信号を出力することと、を更に含む、請求項１７に記載の方法。
前記ポストフィルタが、スペクトルミスマッチ合計から前記推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない前記推定電話プログラムコンテンツエコー信号を出力するように構成されている、請求項１９に記載の方法。