JP2022536801A - モジュール式エコーキャンセルユニット - Google Patents

モジュール式エコーキャンセルユニット Download PDF

Info

Publication number
JP2022536801A
JP2022536801A JP2021575018A JP2021575018A JP2022536801A JP 2022536801 A JP2022536801 A JP 2022536801A JP 2021575018 A JP2021575018 A JP 2021575018A JP 2021575018 A JP2021575018 A JP 2021575018A JP 2022536801 A JP2022536801 A JP 2022536801A
Authority
JP
Japan
Prior art keywords
signal
echo
program content
estimated
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021575018A
Other languages
English (en)
Other versions
JP7259092B2 (ja
Inventor
クリスティアン・エム・ヘラ
エリー・ボウ・ダハー
ジェフリー・アール・ヴォーティン
ヴィグネイシュ・カタヴァラヤン
アンキタ・ディー・ジャイン
トーブ・ゼット・バークスデイル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bose Corp
Original Assignee
Bose Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bose Corp filed Critical Bose Corp
Publication of JP2022536801A publication Critical patent/JP2022536801A/ja
Application granted granted Critical
Publication of JP7259092B2 publication Critical patent/JP7259092B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/19Arrangements of transmitters, receivers, or complete sets to prevent eavesdropping, to attenuate local noise or to prevent undesired transmission; Mouthpieces or receivers specially adapted therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17813Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the acoustic paths, e.g. estimating, calibrating or testing of transfer functions or cross-terms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17821Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
    • G10K11/17823Reference signals, e.g. ambient acoustic environment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1785Methods, e.g. algorithms; Devices
    • G10K11/17853Methods, e.g. algorithms; Devices of the filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Figure 2022536801000001
音響トランスデューサによって車両キャビン内の音響信号に変換される複数のプログラムコンテンツ信号を生成するためのヘッドユニットと、マイクロフォンであって、マイクロフォンが、音響信号を受信し、複数のエコー信号を含むマイクロフォン信号を生成するように車両キャビン内に配置され、各エコー信号が、少なくとも1つのプログラムコンテンツ信号と相関するマイクロフォン信号の成分である、マイクロフォンと、マルチチャネルエコーキャンセルユニットであって、マルチチャネルエコーキャンセルユニットが、複数の参照信号であって、複数の参照信号の各々が、複数のプログラムコンテンツ信号のうちの少なくとも1つと相関する、複数の参照信号と、マイクロフォン信号と、を受信することと、複数の参照信号に従って、複数のエコー信号を最小化することと、推定音声信号を生成することと、推定音声信号をヘッドユニットに提供することと、を行うように構成されている、マルチチャネルエコーキャンセルユニットと、を備える、オーディオシステム。

Description

本発明はモジュール式エコーキャンセルユニットに関する。
本開示は、概して、モジュール式エコーキャンセルのためのシステム及び方法、具体的には、車両内でモジュール式エコーキャンセルを提供するためのシステム及び方法に関する。
下記で言及される全ての実施例及び特徴は、任意の技術的に可能な方式で組み合わせることができる。
一態様によれば、オーディオシステムは、少なくとも第1のプロセッサを備えるヘッドユニットであって、ヘッドユニットが、複数のプログラムコンテンツ信号を生成するように構成されており、複数のプログラムコンテンツ信号のうちの1つが、電話から受信される電話プログラムコンテンツ信号であり、複数のプログラムコンテンツ信号が、音響トランスデューサによって車両キャビン内の音響信号に変換される、ヘッドユニットと、マイクロフォンであって、マイクロフォンが、音響信号を受信し、複数のエコー信号を含むマイクロフォン信号を生成するように車両キャビン内に配置されており、複数のエコー信号のうちの各エコー信号が、複数のプログラムコンテンツ信号のうちの少なくとも1つのプログラムコンテンツ信号と相関するマイクロフォン信号の成分である、マイクロフォンと、第2のプロセッサによって実装されているマルチチャネルエコーキャンセルユニットであって、マルチチャネルエコーキャンセルユニットが、複数の参照信号であって、複数の参照信号の各々が、複数のプログラムコンテンツ信号のうちの少なくとも1つと相関する、複数の参照信号と、マイクロフォン信号と、を受信することと、複数の参照信号に従って、複数のエコー信号を最小化することと、推定音声信号を生成することと、推定音声信号をヘッドユニットに提供することと、を行うように構成されている、マルチチャネルエコーキャンセルユニットと、を備える。
一実施例では、マルチチャネルエコーキャンセルユニットは、複数のエコー信号の推定値を提供するように構成されているマルチチャネルエコーキャンセルフィルタを備え、複数のエコー信号の推定値が、マイクロフォン信号から差し引かれて、推定音声信号を生成し、電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号が、推定音声信号に追加され、これによって、推定音声信号及び推定電話プログラムコンテンツエコー信号が、ヘッドユニットに提供される。
一実施例では、オーディオシステムは、推定音声信号を受信し、複数のプログラムコンテンツ信号のうちの少なくとも1つと相関する少なくとも1つの残留成分を抑制して、エコー抑制された推定音声信号を生成するように構成されている、ポストフィルタを更に含む。
一実施例では、推定電話プログラムコンテンツエコー信号は、エコー抑制された推定音声信号に追加される。
一実施例では、ポストフィルタは、推定音声信号及び推定電話プログラムコンテンツエコー信号を受信し、エコー抑制された推定音声信号及び推定電話プログラムコンテンツエコー信号を出力するように構成されており、推定電話プログラムコンテンツエコー信号が、抑制されないままである。
一実施例では、ポストフィルタは、スペクトルミスマッチ合計から推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない推定電話プログラムコンテンツエコー信号を出力するように構成されている。
一実施例では、複数の参照信号は、複数のプログラムコンテンツ信号を含む。
別の態様によれば、第1のプロセッサ上に実装されているマルチチャネルエコーキャンセルユニットは、複数の参照信号を受信するための少なくとも1つのプログラムコンテンツ入力であって、複数の参照信号の各々が、第2のプロセッサを含むヘッドユニットから出力された複数のプログラムコンテンツ信号のうちの少なくとも1つと相関し、複数のプログラムコンテンツ信号のうちの1つが、電話プログラムコンテンツ信号である、少なくとも1つのプログラムコンテンツ入力と、複数のエコー信号を含むマイクロフォン信号を受信するためのマイクロフォン入力であって、複数のエコー信号のうちの各エコー信号が、複数のプログラムコンテンツ信号のうちの少なくとも1つのプログラムコンテンツ信号と相関するマイクロフォン信号の成分である、マイクロフォン入力と、複数の参照信号に従って、複数のエコー信号を最小化し、推定音声信号を生成し、かつ推定音声信号をヘッドユニットに提供するように構成されている、エコーキャンセラと、を含む。
一実施例では、エコーキャンセラは、複数のエコー信号の推定値を提供するように構成されているマルチチャネルエコーキャンセルフィルタを備え、複数のエコー信号の推定値が、マイクロフォン信号から差し引かれて、推定音声信号を生成し、電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号が、推定音声信号に追加され、これによって、推定音声信号及び推定電話プログラムコンテンツエコー信号が、ヘッドユニットに提供される。
一実施例では、マルチチャネルエコーキャンセルユニットは、推定音声信号を受信し、複数のプログラムコンテンツ信号と相関する少なくとも1つの残留成分を抑制して、エコー抑制された推定音声信号を生成するように構成されている、ポストフィルタを更に備える。
一例では、推定電話プログラムコンテンツエコー信号は、エコー抑制された推定音声信号に追加される。
一例では、ポストフィルタは、推定音声信号及び推定電話プログラムコンテンツエコー信号を受信し、エコー抑制された推定音声信号及び推定電話プログラムコンテンツエコー信号を出力するように構成されており、推定電話プログラムコンテンツエコー信号が、抑制されないままである。
一例では、ポストフィルタは、スペクトルミスマッチ合計から推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない推定電話プログラムコンテンツエコー信号を出力するように構成されている。
別の態様によれば、マルチチャネルエコーキャンセルを実行するための方法は、第1のプロセッサにおいて、複数の参照信号を受信することであって、複数の参照信号の各々が、第2のプロセッサを含むヘッドユニットから出力された複数のプログラムコンテンツ信号のうちの少なくとも1つと相関し、複数のプログラムコンテンツ信号のうちの1つが、電話プログラムコンテンツ信号である、受信することと、複数のエコー信号を含むマイクロフォン信号を受信することであって、複数のエコー信号のうちの各エコー信号が、複数のプログラムコンテンツ信号のうちの少なくとも1つのプログラムコンテンツ信号と相関するマイクロフォン信号の成分である、受信することと、第1のプロセッサによって定義されるエコーキャンセラを用いて、複数の参照信号に従って、複数のエコー信号を最小化して、推定音声信号を生成することと、推定音声信号をヘッドユニットに提供することと、を含む。
一実施例では、複数のエコー信号を最小化する工程は、第1のプロセッサによって定義されるマルチチャネルエコーキャンセルフィルタを用いて、複数のエコー信号の推定値を生成して、複数のエコー信号の推定値が、マイクロフォン信号から差し引かれて、推定音声信号を生成することを含む。
一実施例では、方法は、推定音声信号及び電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号がヘッドユニットに提供されるように、推定電話プログラムコンテンツエコー信号を推定音声信号に追加することを更に含む。
一実施例では、方法は、第1のプロセッサによって実装されるポストフィルタにおいて、推定音声信号を受信することと、ポストフィルタを用いて、複数のプログラムコンテンツ信号と相関する少なくとも1つの残留成分に、抑制を適用して、エコー抑制された推定音声信号を生成することと、を更に含む。
一実施例では、推定電話プログラムコンテンツエコー信号は、エコー抑制された推定音声信号に追加される。
一実施例では、方法は、ポストフィルタにおいて推定電話プログラムコンテンツエコー信号を受信することと、ポストフィルタから、抑制されていない推定電話プログラムコンテンツエコー信号を出力することと、を更に含む。
一実施例では、ポストフィルタは、スペクトルミスマッチ合計から推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない推定電話プログラムコンテンツエコー信号を出力するように構成されている。
1つ以上の実装形態の詳細が、添付図面及び以下の説明において述べられる。他の特徴、目的、及び利点は、本明細書及び図面から、並びに特許請求の範囲から明らかになるであろう。
一実施例による、ヘッドユニット及び増幅器ユニットの概略図である。 一実施例による、オーディオ提示処理ユニット及びマルチチャネルエコーキャンセルユニットの概略図である。 一実施例による、オーディオ提示処理ユニット及びマルチチャネルエコーキャンセルユニットの概略図である。 一実施例による、オーディオ提示処理ユニット及びマルチチャネルエコーキャンセルユニットの概略図である。 一実施例による、オーディオ提示処理ユニット及びマルチチャネルエコーキャンセルユニットの概略図である。
車両ヘッドユニットは、典型的には、音楽、ナビゲーション、及びハンズフリー電話信号などのプログラムコンテンツ信号を増幅器ユニットに供給するための複数のサブシステムを含み、これは、車両キャビン内のスピーカによってオーディオ信号に変換するためのプログラムコンテンツ信号を増幅する(多くの場合に何らかの関連付けられた処理とともに)。ハンズフリー電話サブシステムを利用するコール中、車両キャビン内に位置付けられたマイクロフォンは、ユーザの音声信号を受信し、それはハンズフリー電話サブシステムに送信され、そこでモバイルデバイスにルーティングされる。しかしながら、スピーカが、コール中に車両内のプログラムコンテンツ信号を再生している場合、マイクロフォン信号は、キャビン内の音響プログラム信号を受信した結果として、プログラムコンテンツ信号と相関する成分を含むことになる。これは、一般にエコー信号として知られており、マイクロフォンにおいて音声信号の品質を劣化させる。
エコー信号をキャンセルするために、エコーキャンセルシステムをハンズフリー電話サブシステムに含めることができる。しかしながら、電話信号エコーに加えて信号のエコーをキャンセルするために、増幅器ユニットからの参照信号をハンズフリー電話サブシステムに送信する必要がある。増幅器ユニットにおいて典型的には多数のチャネルを考慮すると、これは、増幅器ユニットからハンズフリー電話サブシステムにプログラムコンテンツ参照信号を送信するための追加の高価なバスを必要とし得る。更に、そのようなバスを介して信号を送信することに関連付けられた時間遅延は、エコーキャンセルの性能を劣化させる有意な遅延を導入する可能性がある。したがって、当該技術分野では、増幅器ユニットにおいて、又は参照信号を受信するのに便利な何らかの他の位置において、マイクロフォン信号にエコーキャンセルを導入することができる、モジュール式エコーキャンセルユニットの必要性が存在する。
本明細書に開示される様々な実施例は、ヘッドユニットから受信したプログラムコンテンツ信号に関連するエコー信号をキャンセルし得るモジュール式エコーキャンセルサブシステムを対象とする。図1には、車両に実装されたオーディオシステム100のブロック図が示されている。示されるように、オーディオシステム100は、ヘッドユニット102及び増幅器ユニット104を含み得る。ヘッドユニット102は、増幅器ユニット104によって処理及び増幅されるプログラムコンテンツを生成するためのサブシステムのセットを含み得る。いくつかのサブシステムは、例えば、ハンズフリー電話サブシステム106、アナウンスサブシステム108及びエンターテイメントサブシステム110を含み得る。ハンズフリー電話サブシステム106は、例えば、Bluetooth接続された携帯電話から受信された電話信号u(n)を提供し得る。ハンズフリー電話サブシステム106はまた、増幅器ユニット104からマイクロフォン信号を受信し、ユーザから音声信号を提供し、例えば、Bluetoothモジュール107を介して携帯電話に送信され得る。(本開示の目的のために、「電話」は、携帯電話及びVOIPを含む任意のタイプの電話通信を含む。)アナウンスサブシステム108は、ターンバイターンナビゲーション又はデジタルアシスタントの音声などのアナウンス信号u(n)を介して、増幅器ユニット104にアナウンスを提供し得る。エンターテイメントサブシステム110は、エンターテイメントオーディオ信号u(n)を介して、音楽又は他のエンターテイメントオーディオを増幅器ユニット104に提供し得る。説明されるサブシステムの動作は、既知であり、本開示の範囲を超えている。ハンズフリー電話サブシステム106から離れて、上述のサブシステムに加えて、又はその代わりに、任意の他のタイプのサブシステムが提供され得ることを理解されたい。実際、アナウンスサブシステム108及びエンターテイメントサブシステム110は、単に、プログラムコンテンツ信号u(n)を増幅器ユニット104に提供し得るヘッドユニット102サブシステムの実施例として提供される。
プログラムコンテンツ信号u(n)は、アナログ信号又はデジタル信号であり得、圧縮及び/又はパケット化されたストリームとして提供され得、追加情報は、マルチチャネルエコーキャンセルユニット112などの処理構成要素又は他の構成要素の制御及び/又は構成のための、別のシステムからの命令、コマンド、又はパラメータなどの、そのようなストリームの一部として受信され得る。
プロセッサによって実行されるとき、ヘッドユニット102の様々なサブシステムを定義するために必要な様々な機能を実行するプログラムコードを記憶するように構成されている非一時的な記憶媒体と一緒に、ヘッドユニット102は、プロセッサ、又はプロセッサの集合によって実装され得る。
増幅器ユニット104は、オーディオ提示処理サブシステム114、マルチチャネルエコーキャンセルユニット112、及び増幅器116を含み得る。概して、オーディオ提示処理サブシステム114は、1つ以上の音響トランスデューサ118によって変換されるように、混合及び拡声器ルーティングなどの受信されたプログラムコンテンツ信号u(n)に様々なオーディオ処理動作を提供し得る。この機能性は、一般に、音声ステージ演出206によって図2~5に実装されるが、様々な実施例では、音声提示処理サブシステム114は、音声ステージ演出206に加えて、オーディオ処理(例えば、アップミキシング、ダウンミキシング、ルーティングなど)を含み得ることを理解されたい。実際、音声ステージ演出206として図2~図5に示される提示処理サブシステム114のオーディオ処理は、単に一実施例として提供される。
プロセッサによって実行されるとき、提示処理サブシステム114の様々な機能を実行するプログラムコードを記憶するように構成されている非一時的な記憶媒体と一緒に、提示処理サブシステム114は、プロセッサ、又はプロセッサの集合によって実装され得る。一般に、提示処理サブシステム114は、ヘッドユニット102を実装するプロセッサとは別個のプロセッサ上に実装される。
増幅器116は、音声提示処理サブシステム114の出力を増幅し、音響トランスデューサ118を駆動して、音響信号を生成し得る。増幅器116は、オーディオ提示処理サブシステム114を定義する同じプロセッサによって、又は別個のプロセッサによって、実装され得る。代替実施例では、増幅器116は、ハードウェア、又はハードウェアとファームウェアとの組み合わせによって実装され得る。
マルチチャネルエコーキャンセルユニット112は、増幅器ユニット104内に実装されて示されているが、様々な代替例では、マルチチャネルエコーキャンセルユニット112は、増幅器116又はオーディオ提示処理サブシステム114とは別個のプロセッサ又はプロセッサの組み合わせ内に実装され得ることを理解されたい。実際、マルチチャネルエコーキャンセラが参照信号としてプログラムコンテンツチャネルu(n)を受信する限り、マルチチャネルエコーキャンセルユニット112は、専用プロセッサ、又は他の場所に位置され得る。したがって、本明細書に記載されるマルチチャネルエコーキャンセルユニット112は、完全にモジュール式であり、したがって、任意の好適なプロセッサに含まれ得る。
音響トランスデューサ118によって出力される音響信号は、望ましくなく、1つ以上のマイクロフォン120によって拾い上げられ得る。一般に、マイクロフォン120に入力される音響トランスデューサ118の音響生成の任意の態様は、本明細書ではエコーと称される。
マルチチャネルエコーキャンセルユニット112は、一般に、プログラムコンテンツ(例えば、電話信号u(n)、アナウンス信号u(n)、エンターテイメントオーディオ信号u(n)など)を参照信号として使用して、マイクロフォン信号からエコーの任意の態様を除去するように機能し、そのため、推定ユーザの音声信号
Figure 2022536801000002
(及びエコーと相関しないノイズ)のみを含むマイクロフォン信号は、ヘッドユニット102のハンズフリー電話サブシステム106に戻されて提供される。したがって、マルチチャネルエコーキャンセルユニット112は、マイクロフォン信号y(n)のマルチチャネルエコーキャンセル(すなわち、プログラムコンテンツu(n)のいくつかのチャネル)を提供する。様々な実施例では、マルチチャネルエコーキャンセルユニット112は、ハンズフリー電話サブシステム106に提供されたエコーキャンセラによってキャンセルされることになる出力推定音声信号
Figure 2022536801000003
に戻して、電話信号u(n)のエコーd(n)の推定値を人工的に追加し得る。以下でより詳細に説明するように、様々な実施例では、マルチチャネルエコーキャンセルユニット112によって受信された参照信号は、必ずしも、ヘッドユニット102によって出力されたプログラムコンテンツ信号u(n)ではないことを理解されたい。むしろ、いくつかの追加のオーディオ処理は、信号が参照信号としてマルチチャネルエコーキャンセルユニット112に送信される前に、例えば、オーディオ提示処理114によって、プログラムコンテンツ信号u(n)に適用され得る。
オーディオ提示処理サブシステム114及びマルチチャネルエコーキャンセルユニット112は、図2~図5により詳細に示されている。示されるように、マルチチャネルエコーキャンセルユニット112は、エコーキャンセラ200を含み得る。エコーキャンセラ200は、エコー信号d(n)をマイクロフォン信号y(n)から除去しようとするように機能して、残留信号e(n)を提供する。エコーキャンセラ200は、エコーキャンセルフィルタ204(マルチチャネルエコーキャンセルフィルタを一緒に形成する複数のエコーキャンセルフィルタ)を介してチャネル202上に提供されるコンテンツ信号u(n)を処理することによって、エコー信号d(n)を最小化して、マイクロフォン120によって提供される信号y(n)から差し引かれる推定エコー信号
Figure 2022536801000004
を生成するように機能する。上述のように、様々な代替の実施形態では、プログラムコンテンツ信号u(n)ではなく、音声ステージ演出206、b(n)の出力は、エコーキャンセラ200のための参照信号として使用され得る。実際、少なくとも1つのプログラムコンテンツ信号u(n)と相関し、かつマイクロフォン信号y(n)におけるエコー信号d(n)の存在を最小化するのに好適な任意の信号は、エコーキャンセラ200のための参照信号として使用され得る。
エコーキャンセラ200は、推定エコー信号
Figure 2022536801000005
を改善するために、間隔でエコーキャンセルフィルタ204を更新するための適合アルゴリズムを含み得る。経時的に、適合アルゴリズムは、エコーキャンセルフィルタ204を、十分に正確な推定エコー信号
Figure 2022536801000006
を生成する満足のいくパラメータに収束させる。一般に、適合アルゴリズムは、ユーザが発話していない時間中にエコーキャンセルフィルタ204を更新するが、いくつかの実施例では、適合アルゴリズムは、任意の時点で更新を行い得る。ユーザが発話すると、そのようなものは「ダブルトーク」と見なされ、マイクロフォン120は、音響エコー信号d(n)及び音響音声信号s(n).の両方を拾い上げる。ダブルトークは、任意の好適な方法に従って、ダブルトーク検出器208によって検出され得る。
エコーキャンセルフィルタ204は、フィルタ係数のセットをコンテンツ信号202に適用して、推定エコー信号
Figure 2022536801000007
を生成し得る。適合アルゴリズムは、様々な技術のいずれかを使用して、フィルタ係数を決定し、フィルタ係数を更新又は変更して、エコーキャンセルフィルタ204の性能を改善し得る。そのような適合アルゴリズムは、アクティブフィルタ又はバックグラウンドフィルタで動作するかにかかわらず、例えば、最小平均二乗(least mean squares、LMS)アルゴリズム、正規化最小二乗法(normalized least mean squares、NLMS)アルゴリズム、再帰的最小二乗(recursive least square、RLS)アルゴリズム、又はこれら又は他のアルゴリズムの任意の組み合わせ若しくは変動を含み得る。エコーキャンセルフィルタ204は、適合アルゴリズムによって適合されるように、音響トランスデューサ118とマイクロフォン120との間のエコーパスを表す推定伝達関数
Figure 2022536801000008
を音響トランスデューサ118の出力に適用するように収束する。
一般的に言えば、図2~図5に示されるように、各適合エコーキャンセルフィルタ204は、参照信号として、プログラムコンテンツ信号u(n)のうちの1つを受信する。例えば、エコーキャンセルフィルタ204は、プログラムコンテンツチャネル202aからの信号u(n)と関連付けられ、信号u(n)を受信し、1つ以上のエコーパスh(n)(音声ステージ演出206の後にu(n)にいくらかの点で相関する)を表すそれぞれの伝達関数
Figure 2022536801000009
及び任意の追加の処理の応答(以下に記載されるように)を適用し得る。同様に、残りの適合エコーキャンセルフィルタ124は、プログラムコンテンツチャネル202からの信号u(n)と関連付けられ、それを受信し、それぞれの伝達関数
Figure 2022536801000010
を適用し得る。各適合エコーキャンセルフィルタ204のそれぞれの伝達関数は、エコーキャンセル、残留信号e(n)としてここに示されるエラー信号を最小化するように調整される。
適合エコーキャンセルフィルタ204の数が、一般に、受信された参照信号の数に依存することを理解されたい。したがって、プログラムコンテンツ信号u(n)が参照信号として使用される場合、プログラムコンテンツ信号u(n)の数に等しいいくつかの数のエコーキャンセルフィルタ204が実装され得、各エコーキャンセルフィルタ204は、プログラムコンテンツ信号u(n)のうちの1つとそれぞれ関連付けられている。一方、音声ステージ演出出力b(n)が使用される場合、いくつかのN個のエコーキャンセルフィルタ204が実装され得、各エコーキャンセルフィルタ204は、N個の音声ステージ演出出力b(n)のうちの1つとそれぞれ関連付けられている。いくつかの実施例では、例えば、プログラムコンテンツ信号u(n)又は音声ステージ演出出力b(n)よりも少ない数の適合エコーキャンセルフィルタ204が、使用され得ることも理解されたい。例えば、ウーファー左、ツイドラー左、及びツイドラー左プログラムコンテンツ信号u(n)のセットなどの特定のプログラムコンテンツ信号u(n)が一緒に合計され、単一のエコーキャンセルフィルタ204に参照信号として提供され得るか、又は参照信号のサブセットのみが、有効エコーキャンセルを達成するために使用される必要がある場合に、より少ないエコーキャンセルフィルタ204は使用され得る。
エコーパスh(n)を推定することに加えて、推定伝達関数
Figure 2022536801000011
は、参照信号(例えば、プログラムコンテンツ信号u(n))が取られる位置とエコーキャンセラ200との間に配置された任意の処理の推定値を表し得る。したがって、図1Aに示されるように、参照信号は、プログラムコンテンツ信号u(n)であり、推定伝達関数
Figure 2022536801000012
は、エコーパスh(n)の応答に加えて、音声ステージ演出206、音響トランスデューサ118、マイクロフォン120、及びマイクロフォン120に関連付けられた任意の処理(アレイ処理など)の応答を表すことになる。したがって、推定伝達関数
Figure 2022536801000013
は、プログラムコンテンツ信号u(n)が、マイクロフォン120で実行される応答及び任意の処理と併せて、その受信された形態からエコー信号d(n)にどのように変換されるかについての表現である。しかしながら、参照信号が、音声ステージ演出206、b(n)の出力で取られる場合、推定伝達関数
Figure 2022536801000014
は、音響トランスデューサ118、エコーパスh(n)、マイクロフォン120、及びマイクロフォン120に関連付けられた任意の処理の応答を集合的に表す。したがって、図1及び図2は、N個の推定エコー信号
Figure 2022536801000015
ではなく3つの推定エコー信号
Figure 2022536801000016
を示すが、音声ステージ演出206の応答が推定伝達関数
Figure 2022536801000017
に含まれるため、推定エコー信号
Figure 2022536801000018
の各々は、音声ステージ演出206による関連付けられたプログラムコンテンツ信号u(n)の処理を含む。したがって、推定エコー信号
Figure 2022536801000019
の合計は、Nエコー信号d(n)の合計を推定することになる。
加えて、図3に示されるように、マルチチャネルエコーキャンセルユニット112は、改善された推定音声信号
Figure 2022536801000020
を生成するためにスペクトルフィルタリングを適用することによって、残留信号e(n)に存在する残留エコーを抑制するように構成されているポストフィルタサブシステム210を更に含み得る。
エコーキャンセラ200は、プログラムコンテンツチャネルと相関するマイクロフォン信号y(n)の線形態様をキャンセルするが、エコーパスにおける急速な変更及び/又は非線形性は、エコーキャンセラ200が正確な推定エコー信号d(n)を提供することを防止し、したがって、残留エコーは、残留信号e(n)内に残ることになる。したがって、ポストフィルタサブシステム210は、スペクトルフィルタリングで残留エコー成分を抑制して、改善された推定音声信号
Figure 2022536801000021
を生成するように動作する。そのようなポストフィルタは、一般に、当該技術分野で既知であるが、一実施例の簡単な説明を以下に提供する。
ポストフィルタサブシステム210は、ポストフィルタ212及び係数算出器214を備える。ポストフィルタ212は、いくつかの実施例では、周波数ビンによって、全信号パワー(例えば、発話及び残留エコー)に対する残留エコー信号パワーの可能性の高い比に関連する量だけ、残留信号e(n)のスペクトルコンテンツを低減することによって、(エコーキャンセラ200からの)残留信号における残留エコーを抑制する。一実施例では、ポストフィルタ212は、以下の実施例の方程式に従って、係数計算器214によって計算される、フィルタ係数Hpf(k)によって、残留信号e(n)の各周波数ビン(インデックス「k」で表される)を乗算し得る。
Figure 2022536801000022
式(1)中、ΔH(k)は、スペクトルミスマッチであり、See(k)は、残留信号のパワースペクトル密度であり、
Figure 2022536801000023
は、i番目のコンテンツチャネル上のプログラムコンテンツ信号u(n)のパワースペクトル密度である。合計が、全てのプログラムコンテンツ信号202にわたることに留意されたい。最小乗数Hminは、全ての周波数ビンに適用され、それにより、周波数ビンが最小値よりも小さく乗算されないことを確実にする。より低い値による乗算が、より大きな減衰と等価であることを理解されたい。方程式(1)の実施例では、各周波数ビンが、最大でも1で乗算されるが、他の例が、フィルタ係数を計算するために異なるアプローチを使用し得ることにも留意されたい。β因子は、ポストフィルタ212が信号コンテンツを抑制する方法を調整するために使用され得るスケーリング又は過剰推定因子であるか、又はいくつかの実施例では、1に等しいことによって効果的に除去され得る。ρ因子は、ゼロによる分割を避けるための正則化因子である。
スペクトルミスマッチΔH(k)は、実際のエコーパスと音響エコーキャンセラ200との間のスペクトルミスマッチを表す。実際のエコーパスは、例えば、音声ステージ演出206、音響トランスデューサ118、音響環境を介して、及びマイクロフォン120を介してエコーキャンセラ200に提供される場所から、プログラムコンテンツ信号u(n)によって取られたパス全体である。実際のエコーパスは、例えばアレイ処理などの、マイクロフォン120、又は他の支援構成要素による処理を更に含み得る。スペクトルミスマッチΔH(k)は、i番目のコンテンツチャネル202上のプログラムコンテンツ信号u(n)、及び残留信号e(n)のクロスパワースペクトル密度
Figure 2022536801000024
と、i番目のコンテンツチャネル202上のプログラムコンテンツ信号u(n)のパワースペクトル密度
Figure 2022536801000025
との比として計算され得る。
Figure 2022536801000026
いくつかの実施例では、使用されるパワースペクトル密度は、計算されたスペクトルミスマッチにおいて突然の変更(例えば、迅速又は有意な変更)を防止するために、時間平均化され得るか、又は別様に平滑化若しくはローパスフィルタリングされ得る。
式(1)及び(2)は、一般に、参照信号が相関していない場合に関することを理解されたい。参照信号が必ずしも相関していない(例えば、左及び右のチャネル対がいくらかの共通のコンテンツを共有する)場合、係数計算器214は、以下の式に従ってフィルタ係数Hpf(k)を計算し得る。
Figure 2022536801000027
式(3)中、ΔHは、ΔHのエルミートを表し、これは、ΔHの複素共役転置であり、式中、ΔHは以下によって与えられる。
Figure 2022536801000028
uuは、プログラムコンテンツチャネルのパワースペクトル密度及びクロスパワースペクトル密度のマトリックスである。ΔHは、全てのチャネルのスペクトルミスマッチを含むベクトルでありSue、は、エラー信号を有する各参照チャネルのクロスパワースペクトル密度を含むベクトルである。
上記の式は、複数のコンテンツチャネル202からの残留エコーを抑制するように構成されているポストフィルタ212のために提供されているが、代替実施例では、ポストフィルタ212は、1つのコンテンツチャネル202のみからの残留エコーを抑制するように構成され得る。
様々な実施例では、ポストフィルタ212は、周波数ドメイン又は時間ドメインで動作するように構成され得る。したがって、「フィルタ係数」という用語の使用は、ポストフィルタ212を時間ドメインにおける動作に限定することを意図するものではない。「フィルタ係数」という用語又は他の同等の用語は、所望の応答若しくは所望の伝達関数を引き起こすためにフィルタに適用されるか、又はフィルタに組み込まれた任意の値のセットを指し得る。特定の実施例では、ポストフィルタ212は、推定音声信号のデジタル版で動作して、一般に1以下の別個の値によって、個々の周波数ビン内の信号コンテンツを乗算するデジタル周波数ドメインフィルタであり得る。別個の値のセットは、フィルタ係数と見なされ得る。
エコーキャンセラ200及びポストフィルタサブシステム210の両方は、ダブルトーク条件が、例えば、ダブルトーク検出器208によって検出されない期間中にのみ、エコーキャンセルフィルタ204係数及びポストフィルタ212の係数をそれぞれ計算するように構成され得る。上述のように、ユーザがオーディオシステム100の音響環境内で発話されるとき、マイクロフォン信号y(n)は、ユーザの発話である成分を含む。この場合、合成信号y(n)は、音響トランスデューサ118からのエコーのみを表すものではなく、残留信号e(n)は、残留エコー、例えば、実際のエコーパスに対するエコーキャンセラ200のミスマッチを表すものではない(ユーザが発話しているため)。したがって、ダブルトーク検出器208は、いつダブルトークが検出されるのかを示すように動作し、新しい係数は、この期間中に計算されない場合があり、開始時又はユーザがトークする前において有効な係数は、ユーザがトークしている間に使用され得る。ダブルトーク検出器208は、任意の好適なシステム、構成要素、アルゴリズム、又はそれらの組み合わせであり得る。
したがって、図1に関連して説明される増幅器ユニット104は、ヘッドユニット102のプロセッサと分離した別個のプロセッサにおいて、マルチチャネルエコーキャンセルを提供する。したがって、ヘッドユニット102に入力された推定音声信号
Figure 2022536801000029
は、参照信号をヘッドユニット102に送信し戻すことなく、かつヘッドユニット102自体への変更を必要とせずに、マルチチャネルエコーキャンセルを受信し得る。
しかしながら、上述のように、多くのハンズフリー電話サブシステムはまた、電話信号u(n)と相関するエコー信号に関してある程度のエコーキャンセルを実行するであろう。したがって、エコー信号が存在することが見出されない場合、いくつかのハンズフリー電話サブシステムはエラーを登録し、機能不全マイクロフォンなどのより大きな機能不全を示すエコーの欠如を解釈し得る。したがって、電話エコー信号d(n)を詐称し、かつハンズフリー電話サブシステム106にそれを提供することが有利である。
これは、いくつかの方法、例えば、第1の方法で達成され得、例えば、エコーキャンセルフィルタ204b(すなわち、電話信号u(n)を参照信号として受信するエコーキャンセルフィルタ204)によって計算されるように、推定電話エコー信号
Figure 2022536801000030
は、係数計算に含まれ、推定エコー信号
Figure 2022536801000031
の一部として合計され、マイクロフォン信号y(n)から差し引かれる(以下に記載されるように)が、次いで、図2及び図3に示されるように、少なくとも2つの位置のうちの1つにおいて出力信号に追加され得る。
図2に示されるように、推定電話エコー信号
Figure 2022536801000032
は、ポストフィルタ212の後の位置において追加されて、マルチチャネルエコーキャンセルユニット112の出力において、推定発話
Figure 2022536801000033
及び推定電話エコー信号
Figure 2022536801000034
を提供することをもたらし得る。ポストフィルタ212が、残留信号e(n)において電話エコー信号
Figure 2022536801000035
の存在を抑制するので、ポストフィルタ212の下流の位置に信号を追加することは、推定電話エコー信号
Figure 2022536801000036
を抑制することを防止する。
あるいは、図3に示されるように、推定電話エコー信号
Figure 2022536801000037
は、ポストフィルタ212の前の場所において追加され得る。この実施例では、ポストフィルタサブシステム210は、抑制なしで推定電話エコー信号
Figure 2022536801000038
を通過させるように構成され得る。例えば、フィルタ後係数計算は、式(5)に従って、スペクトルミスマッチ合計における電話プログラムコンテンツ信号u(n)を除いて、係数を計算するように修正され得る。
Figure 2022536801000039
(ここでは、
Figure 2022536801000040
は、コンテンツチャネル202bを合計から除外することを表し、これは、電話プログラムコンテンツ信号u(n)を含む。)したがって、ポストフィルタ212は、電話プログラムコンテンツ信号u(n)と相関する残留信号の成分をフィルタリングすることなく、残留信号e(n)をフィルタリングする。言い換えれば、ポストフィルタ212は、フィルタリングされてない状態で推定電話エコー信号
Figure 2022536801000041
を通過することになる一方で、残留信号の残りの成分のスペクトルミスマッチは、通常としてフィルタリングされ、再び、マルチチャネルエコーキャンセルユニット112の出力において、推定音声
Figure 2022536801000042
及び推定電話エコー信号
Figure 2022536801000043
をもたらす。
式(5)は、一般に、参照信号が相関していない場合に関することを理解されたい。参照信号が必ずしも相関していない(例えば、左及び右のチャネル対がいくらかの共通のコンテンツを共有する)場合、係数計算器126は、以下の式に従ってフィルタ係数Hpf(k)を計算し得る。
Figure 2022536801000044
式(6)において、チルドで示される変数は、電話信号に対応する用語を除外する。
Figure 2022536801000045
は、ΔHであり、電話チャネルのスペクトルミスマッチΔHphoneを除外した。同様に、
Figure 2022536801000046
は、電話チャネルPSD及びクロスPSDが除去された、すなわち、1行及び1列少ないSuuである。
別の実施例では、図4に示されるように、エコーキャンセラ200は、係数計算における電話信号u(n)からの参照信号を含むが、エコーキャンセルフィルタ204の合計から推定電話エコー信号d(n)を除外する(別様に生成しない)(したがって、図4に示されるように、204bの出力は、合計に含まれない)、各適合エコーキャンセルフィルタ204のための適合フィルタ係数を計算し得る。したがって、エコーキャンセルフィルタ204の合計出力は、
Figure 2022536801000047
として表され得る。これにより、残留信号e(n)に残る電話プログラムコンテンツ信号u(n)と相関する推定エコー
Figure 2022536801000048
が生じることになる。これは、
Figure 2022536801000049
として図4に表される。電話プログラムコンテンツ信号u(n)と相関する推定エコー
Figure 2022536801000050
がエコーキャンセルフィルタ204の適合を歪めることを防止するために、推定エコー
Figure 2022536801000051
は、エコーキャンセルフィルタ204のエラー信号から差し引かれ得る。
図5に示される別の実施例では、エコーキャンセラ200は、電話プログラムコンテンツ信号u(n)を受信するエコーキャンセルフィルタ204bを除外し得る。図4の実施例と同様に、エコーキャンセルフィルタ204の合計出力は、
Figure 2022536801000052
として表され得る。これにより、同様に、
Figure 2022536801000053
として表される、残留信号に残る電話プログラムコンテンツ信号u(n)と相関する推定エコー
Figure 2022536801000054
が生じることになる。しかしながら、推定エコー
Figure 2022536801000055
がエコーキャンセルフィルタ204の適合を歪めるのを防止するために、ダブルトーク検出器208を使用して、電話プログラムコンテンツチャネル202b上に信号が存在するときに、エコーキャンセルフィルタ204の適合を一時停止し得る。言い換えれば、エコーキャンセルフィルタ204は、いくつかの電話プログラムコンテンツ信号u(n)がある間は更新されない。
図4及び図5に関連して説明される実施例は、図3に関連して説明したように、ポストフィルタ212が、推定電話エコー信号
Figure 2022536801000056
を再度通過させることを必要とする。図4及び図5に関連して説明される実施例は、マルチチャネルエコーキャンセルユニット112の出力において、推定発話
Figure 2022536801000057
及び推定電話エコー信号
Figure 2022536801000058
を提供することをもたらすであろう。
したがって、上記の2~5の実施例は、マルチチャネルエコーキャンセルユニット112の出力において、推定電話エコー信号
Figure 2022536801000059
を提供する方法を示し、それは、ハンズフリー電話サブシステム106のハンズフリー電話サブシステムによってキャンセルされ得る。
本開示において、識別子として、又は下付き文字として使用される大文字は、下付き文字又は識別子が使用される任意の数の構造又は信号を表すことを理解されたい。したがって、音響トランスデューサ118Nは、様々な実施例では、任意の数の音響トランスデューサ118が実装され得るという概念を表す。実際、いくつかの実施例では、1つの音響トランスデューサのみが実装され得る。同様に、音声ステージ演出出力信号b(n)は、任意の数の音声ステージ演出出力信号b(n)が使用され得るという概念を表す。異なる信号又は構造のために使用される同じ文字、例えば、音声ステージ演出出力b(n)及びエコー信号
Figure 2022536801000060
は、同じ数の特定の信号又は構造が存在する一般的な場合を表すことを理解されたい。したがって、一般的な場合、同じ数の音声ステージ演出出力b(n)及びエコー信号
Figure 2022536801000061
が存在することになる。しかしながら、一般的な場合は限定的であると見なされるべきではない。当業者は、本開示の検討と併せて、特定の実施例では、異なる数のそのような信号又は構造が使用され得ることを理解するであろう。
本明細書に記載される機能又はその部分、及びその様々な修正(以下「機能」)は、少なくとも部分的にコンピュータプログラム製品(例えば、1つ以上のデータ処理装置、例えば、プログラム可能プロセッサ、コンピュータ、複数のコンピュータ、及び/若しくはプログラム可能論理構成要素、による実行のための、又はその動作を制御するための、1つ以上の非一時的機械可読媒体又は記憶デバイスなどの情報担体において有形に具現化されたコンピュータプログラム)を介して実装され得る。
コンピュータプログラムは、コンパイラ型言語又はインタープリタ型言語を含む任意の形態のプログラム言語で書くことができ、それは、スタンドアローンプログラムとして、又はコンピューティング環境での使用に好適なモジュール、構成要素、サブルーチン、若しくは他のユニットとして含む任意の形態で配備され得る。コンピュータプログラムは、1つのコンピュータ上で、若しくは1つのサイトにおける複数のコンピュータ上で実行されるように配備されるか、又は複数のサイトにわたって配信されて、ネットワークによって相互接続され得る。
機能の全部又は一部を実装することと関連した動作は、較正プロセスの機能を実施するために1つ以上のコンピュータプログラムを実行する1つ以上のプログラム可能なプロセッサによって実施され得る。機能の全部又は一部は、特殊目的論理回路、例えば、FPGA及び/又はASIC(application-specific integrated circuit、特定用途向け集積回路)として実装され得る。
コンピュータプログラムの実行に好適なプロセッサとしてはまた、例として、一般的及び特殊目的マイクロプロセッサの両方、並びに任意の種類のデジタルコンピュータの任意の1つ以上のプロセッサが挙げられる。一般的に、プロセッサは、読み出し専用メモリ、ランダムアクセスメモリ、又はそれらの両方から命令及びデータを受信することになる。コンピュータの構成要素は、命令を実行するためのプロセッサ、並びに命令及びデータを記憶するための1つ以上のメモリデバイスを含む。
本明細書において、いくつかの発明実施形態について記述し説明してきたが、当業者であれば、様々な他の手段、及び/又は、機能を実施し及び/若しくは結果を得るための構造、及び/又は、本明細書に記載の1つ以上の利点を容易に思いつくことができ、並びに、こうした変更形態及び/又は変形形態の各々は、本明細書に記載の発明実施形態の範囲内にあると見なすことができる。より一般的には、当業者であれば、本明細書に記載のパラメータ、寸法、材料、及び構成の全てが例示的であること、実際のパラメータ、寸法、材料、及び/又は構成は、特定のアプリケーション又は本発明の教示が使用されるアプリケーションに依存するであろうことを容易に理解するであろう。当業者であれば、わずかなありふれた実験を行うだけで、本発明に記載されている特定の発明実施形態に相当する多くの等価物を認識又は確認することができるであろう。したがって、前述の実施形態は、単なる例として提示されたものであり、添付の特許請求の範囲及びその等価物の範囲内で、明確に記載され特許請求された以外の別のやり方で発明実施形態を実践することができるということを理解されたい。本開示の発明実施形態は、本明細書に記載の各個々の特徴、システム、物品、材料、及び/又は方法を対象とする。更に、2つ以上のこうした特徴、システム、物品、材料、及び/又は方法のいかなる組む合わせも、こうした特徴、システム、物品、材料、及び/又は方法が相互に矛盾しない場合、本開示の発明の範囲内に含まれる。
102 ヘッドユニット
106 ハンズフリー電話サブシステム
107 Bluetoothモジュール
108 アナウンスサブシステム
110 エンターテイメントサブシステム
112 マルチチャネルエコーキャンセルユニット
114 オーディオ提示処理サブシステム
116 増幅器
118 音響トランスデューサ
120 マイクロフォン

Claims (20)

  1. オーディオシステムであって、
    少なくとも第1のプロセッサを備えるヘッドユニットであって、前記ヘッドユニットが、複数のプログラムコンテンツ信号を生成するように構成されており、前記複数のプログラムコンテンツ信号のうちの1つが、電話から受信される電話プログラムコンテンツ信号であり、前記複数のプログラムコンテンツ信号が、音響トランスデューサによって車両キャビン内の音響信号に変換される、ヘッドユニットと、
    マイクロフォンであって、前記マイクロフォンが、前記音響信号を受信し、複数のエコー信号を含むマイクロフォン信号を生成するように前記車両キャビン内に配置されており、前記複数のエコー信号のうちの各エコー信号が、前記複数のプログラムコンテンツ信号のうちの少なくとも1つのプログラムコンテンツ信号と相関する前記マイクロフォン信号の成分である、マイクロフォンと、
    第2のプロセッサによって実装されているマルチチャネルエコーキャンセルユニットであって、前記マルチチャネルエコーキャンセルユニットが、複数の参照信号であって、前記複数の参照信号の各々が、前記複数のプログラムコンテンツ信号のうちの少なくとも1つと相関する、複数の参照信号と、マイクロフォン信号と、を受信することと、前記複数の参照信号に従って、前記複数のエコー信号を最小化することと、推定音声信号を生成することと、前記推定音声信号を前記ヘッドユニットに提供することと、を行うように構成されている、マルチチャネルエコーキャンセルユニットと、を備える、オーディオシステム。
  2. 前記マルチチャネルエコーキャンセルユニットが、前記複数のエコー信号の推定値を提供するように構成されているマルチチャネルエコーキャンセルフィルタを備え、前記複数のエコー信号の前記推定値が、前記マイクロフォン信号から差し引かれて、前記推定音声信号を生成し、前記電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号が、前記推定音声信号に追加され、これによって、前記推定音声信号及び前記推定電話プログラムコンテンツエコー信号が、前記ヘッドユニットに提供される、請求項1に記載のオーディオシステム。
  3. 前記推定音声信号を受信し、前記複数のプログラムコンテンツ信号のうちの少なくとも1つと相関する少なくとも1つの残留成分を抑制して、エコー抑制された推定音声信号を生成するように構成されている、ポストフィルタを更に備える、請求項2に記載のオーディオシステム。
  4. 前記推定電話プログラムコンテンツエコー信号が、前記エコー抑制された推定音声信号に追加される、請求項3に記載のオーディオシステム。
  5. 前記ポストフィルタが、前記推定音声信号及び前記推定電話プログラムコンテンツエコー信号を受信し、前記エコー抑制された推定音声信号及び前記推定電話プログラムコンテンツエコー信号を出力するように構成されており、前記推定電話プログラムコンテンツエコー信号が、抑制されないままである、請求項3に記載のオーディオシステム。
  6. 前記ポストフィルタが、スペクトルミスマッチ合計から前記推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない前記推定電話プログラムコンテンツエコー信号を出力するように構成されている、請求項5に記載のオーディオシステム。
  7. 前記複数の参照信号が、前記複数のプログラムコンテンツ信号を含む、請求項1に記載のオーディオシステム。
  8. 第1のプロセッサ上に実装されているマルチチャネルエコーキャンセルユニットであって、
    複数の参照信号を受信するための少なくとも1つのプログラムコンテンツ入力であって、前記複数の参照信号の各々が、第2のプロセッサを含むヘッドユニットから出力された複数のプログラムコンテンツ信号のうちの少なくとも1つと相関し、前記複数のプログラムコンテンツ信号のうちの1つが、電話プログラムコンテンツ信号である、少なくとも1つのプログラムコンテンツ入力と、
    複数のエコー信号を含むマイクロフォン信号を受信するためのマイクロフォン入力であって、前記複数のエコー信号のうちの各エコー信号が、前記複数のプログラムコンテンツ信号のうちの少なくとも1つのプログラムコンテンツ信号と相関する前記マイクロフォン信号の成分である、マイクロフォン入力と、
    前記複数の参照信号に従って、前記複数のエコー信号を最小化し、推定音声信号を生成し、かつ前記推定音声信号を前記ヘッドユニットに提供するように構成されている、エコーキャンセラと、を備える、マルチチャネルエコーキャンセルユニット。
  9. 前記エコーキャンセラが、前記複数のエコー信号の推定値を提供するように構成されているマルチチャネルエコーキャンセルフィルタを備え、前記複数のエコー信号の前記推定値が、前記マイクロフォン信号から差し引かれて、前記推定音声信号を生成し、前記電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号が、前記推定音声信号に追加され、これによって、前記推定音声信号及び前記推定電話プログラムコンテンツエコー信号が、前記ヘッドユニットに提供される、請求項8に記載のマルチチャネルエコーキャンセルユニット。
  10. 前記推定音声信号を受信し、前記複数のプログラムコンテンツ信号と相関する少なくとも1つの残留成分を抑制して、エコー抑制された推定音声信号を生成するように構成されている、ポストフィルタを更に備える、請求項9に記載のマルチチャネルエコーキャンセルユニット。
  11. 前記推定電話プログラムコンテンツエコー信号が、前記エコー抑制された推定音声信号に追加される、請求項10に記載のマルチチャネルエコーキャンセルユニット。
  12. 前記ポストフィルタが、前記推定音声信号及び前記推定電話プログラムコンテンツエコー信号を受信し、前記エコー抑制された推定音声信号及び前記推定電話プログラムコンテンツエコー信号を出力するように構成されており、前記推定電話プログラムコンテンツエコー信号が、抑制されないままである、請求項10に記載のマルチチャネルエコーキャンセルユニット。
  13. 前記ポストフィルタが、スペクトルミスマッチ合計から前記推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない前記推定電話プログラムコンテンツエコー信号を出力するように構成されている、請求項12に記載のマルチチャネルエコーキャンセルユニット。
  14. マルチチャネルエコーキャンセルを実行するための方法であって、
    第1のプロセッサにおいて、複数の参照信号を受信することであって、前記複数の参照信号の各々が、第2のプロセッサを含むヘッドユニットから出力された複数のプログラムコンテンツ信号のうちの少なくとも1つと相関し、前記複数のプログラムコンテンツ信号のうちの1つが、電話プログラムコンテンツ信号である、受信することと、
    複数のエコー信号を含むマイクロフォン信号を受信することであって、前記複数のエコー信号のうちの各エコー信号が、前記複数のプログラムコンテンツ信号のうちの少なくとも1つのプログラムコンテンツ信号と相関する前記マイクロフォン信号の成分である、受信することと、
    第1のプロセッサによって定義されるエコーキャンセラを用いて、複数の参照信号に従って、前記複数のエコー信号を最小化して、推定音声信号を生成することと、
    前記推定音声信号を前記ヘッドユニットに提供することと、を含む、方法。
  15. 前記複数のエコー信号を最小化する工程が、
    前記第1のプロセッサによって定義されるマルチチャネルエコーキャンセルフィルタを用いて、前記複数のエコー信号の推定値を生成して、前記複数のエコー信号の前記推定値が、前記マイクロフォン信号から差し引かれて、前記推定音声信号を生成することを含む、請求項14に記載の方法。
  16. 前記推定音声信号及び前記電話プログラムコンテンツ信号と相関する推定電話プログラムコンテンツエコー信号が前記ヘッドユニットに提供されるように、前記推定電話プログラムコンテンツエコー信号を前記推定音声信号に追加することを更に含む、請求項15に記載の方法。
  17. 前記第1のプロセッサによって実装されるポストフィルタにおいて、前記推定音声信号を受信することと、
    前記ポストフィルタを用いて、前記複数のプログラムコンテンツ信号と相関する少なくとも1つの残留成分に、抑制を適用して、エコー抑制された推定音声信号を生成することと、を更に含む、請求項16に記載の方法。
  18. 前記推定電話プログラムコンテンツエコー信号が、前記エコー抑制された推定音声信号に追加される、請求項17に記載の方法。
  19. 前記ポストフィルタにおいて前記推定電話プログラムコンテンツエコー信号を受信することと、
    前記ポストフィルタから、抑制されていない前記推定電話プログラムコンテンツエコー信号を出力することと、を更に含む、請求項17に記載の方法。
  20. 前記ポストフィルタが、スペクトルミスマッチ合計から前記推定電話プログラムコンテンツエコー信号を除外することによって、抑制されていない前記推定電話プログラムコンテンツエコー信号を出力するように構成されている、請求項19に記載の方法。
JP2021575018A 2019-06-17 2020-06-17 モジュール式エコーキャンセルユニット Active JP7259092B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/443,292 2019-06-17
US16/443,292 US11017792B2 (en) 2019-06-17 2019-06-17 Modular echo cancellation unit
PCT/US2020/038105 WO2020257262A1 (en) 2019-06-17 2020-06-17 Modular echo cancellation unit

Publications (2)

Publication Number Publication Date
JP2022536801A true JP2022536801A (ja) 2022-08-18
JP7259092B2 JP7259092B2 (ja) 2023-04-17

Family

ID=71409594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021575018A Active JP7259092B2 (ja) 2019-06-17 2020-06-17 モジュール式エコーキャンセルユニット

Country Status (5)

Country Link
US (1) US11017792B2 (ja)
EP (1) EP3984030A1 (ja)
JP (1) JP7259092B2 (ja)
CN (1) CN114175606B (ja)
WO (1) WO2020257262A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11457304B1 (en) * 2021-12-27 2022-09-27 Bose Corporation Headphone audio controller

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003249996A (ja) * 2002-02-25 2003-09-05 Kobe Steel Ltd 音声信号入出力装置
JP2009522904A (ja) * 2006-01-06 2009-06-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響エコーキャンセラ
JP2012204997A (ja) * 2011-03-24 2012-10-22 Panasonic Corp 自動車電話装置
JP2018170564A (ja) * 2017-03-29 2018-11-01 パナソニックIpマネジメント株式会社 エコーキャンセル方法、エコーキャンセル装置、音声処理装置、およびプログラム

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7117145B1 (en) * 2000-10-19 2006-10-03 Lear Corporation Adaptive filter for speech enhancement in a noisy environment
US20020172350A1 (en) * 2001-05-15 2002-11-21 Edwards Brent W. Method for generating a final signal from a near-end signal and a far-end signal
US7672445B1 (en) * 2002-11-15 2010-03-02 Fortemedia, Inc. Method and system for nonlinear echo suppression
JP4333369B2 (ja) * 2004-01-07 2009-09-16 株式会社デンソー 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
WO2009070073A1 (en) * 2007-11-29 2009-06-04 Telefonaktiebolaget Lm Ericssom (Publ) A method and arrangement for echo cancellation of voice signals
EP2257082A1 (en) * 2009-05-28 2010-12-01 Harman Becker Automotive Systems GmbH Background noise estimation in a loudspeaker-room-microphone system
US9275625B2 (en) * 2013-03-06 2016-03-01 Qualcomm Incorporated Content based noise suppression
US9936290B2 (en) * 2013-05-03 2018-04-03 Qualcomm Incorporated Multi-channel echo cancellation and noise suppression
WO2015017680A2 (en) * 2013-07-31 2015-02-05 Vidyo, Inc. Systems and methods for split echo cancellation
US9373320B1 (en) * 2013-08-21 2016-06-21 Google Inc. Systems and methods facilitating selective removal of content from a mixed audio recording
US9286883B1 (en) * 2013-09-26 2016-03-15 Amazon Technologies, Inc. Acoustic echo cancellation and automatic speech recognition with random noise
US9854358B2 (en) * 2014-07-25 2017-12-26 2236008 Ontario Inc. System and method for mitigating audio feedback
US9712915B2 (en) * 2014-11-25 2017-07-18 Knowles Electronics, Llc Reference microphone for non-linear and time variant echo cancellation
CN105825864B (zh) * 2016-05-19 2019-10-25 深圳永顺智信息科技有限公司 基于过零率指标的双端说话检测与回声消除方法
CN107123430B (zh) * 2017-04-12 2019-06-04 广州视源电子科技股份有限公司 回声消除方法、装置、会议平板及计算机存储介质
CN107017004A (zh) * 2017-05-24 2017-08-04 建荣半导体(深圳)有限公司 噪声抑制方法、音频处理芯片、处理模组及蓝牙设备
US10594869B2 (en) 2017-08-03 2020-03-17 Bose Corporation Mitigating impact of double talk for residual echo suppressors
US10542153B2 (en) * 2017-08-03 2020-01-21 Bose Corporation Multi-channel residual echo suppression
US10090000B1 (en) * 2017-11-01 2018-10-02 GM Global Technology Operations LLC Efficient echo cancellation using transfer function estimation
CN108322859A (zh) * 2018-02-05 2018-07-24 北京百度网讯科技有限公司 用于回声消除的设备、方法和计算机可读存储介质
US11031026B2 (en) * 2018-12-13 2021-06-08 Qualcomm Incorporated Acoustic echo cancellation during playback of encoded audio
CN109727604B (zh) * 2018-12-14 2023-11-10 上海蔚来汽车有限公司 用于语音识别前端的频域回声消除方法及计算机储存介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003249996A (ja) * 2002-02-25 2003-09-05 Kobe Steel Ltd 音声信号入出力装置
JP2009522904A (ja) * 2006-01-06 2009-06-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響エコーキャンセラ
JP2012204997A (ja) * 2011-03-24 2012-10-22 Panasonic Corp 自動車電話装置
JP2018170564A (ja) * 2017-03-29 2018-11-01 パナソニックIpマネジメント株式会社 エコーキャンセル方法、エコーキャンセル装置、音声処理装置、およびプログラム

Also Published As

Publication number Publication date
US11017792B2 (en) 2021-05-25
JP7259092B2 (ja) 2023-04-17
CN114175606A (zh) 2022-03-11
EP3984030A1 (en) 2022-04-20
WO2020257262A1 (en) 2020-12-24
CN114175606B (zh) 2024-02-06
US20200395030A1 (en) 2020-12-17

Similar Documents

Publication Publication Date Title
JP6311136B2 (ja) 双方向会話補助装置及び双方向会話補助方法
EP3754654B1 (en) Cancellation of road-noise in a microphone signal
US8385557B2 (en) Multichannel acoustic echo reduction
US10904396B2 (en) Multi-channel residual echo suppression
JP4957810B2 (ja) 音処理装置、音処理方法及び音処理プログラム
JP7487235B2 (ja) マイクロフォン信号における交通ノイズを除去するためのシステム及び方法
JP2023090971A (ja) フィードフォワードアクティブノイズコントロール
JP2012195801A (ja) 会話支援装置
JP7259092B2 (ja) モジュール式エコーキャンセルユニット
US11044556B2 (en) Systems and methods for canceling echo in a microphone signal
JP2009510503A (ja) 活性ノイズの減少のための方法及び該方法を動作させるための装置
US11122366B2 (en) Method and apparatus for attenuation of audio howling
JP5474712B2 (ja) 能動型振動騒音制御装置
JP2023124023A (ja) コミュニケーション支援システム
JP2023165528A (ja) ビームフォーミング方法、ビームフォーミングシステム
JP2019165276A (ja) エコーキャンセル装置、エコーキャンセル方法およびエコーキャンセルプログラム
JP2010134344A (ja) 適応信号処理システム及びその伝達特性設定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230306

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230405

R150 Certificate of patent or registration of utility model

Ref document number: 7259092

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150