JP6670014B2 - モバイルデバイスにおける非線形エコーキャンセルのための二方式振幅処理フレームワーク - Google Patents

モバイルデバイスにおける非線形エコーキャンセルのための二方式振幅処理フレームワーク Download PDF

Info

Publication number
JP6670014B2
JP6670014B2 JP2018548021A JP2018548021A JP6670014B2 JP 6670014 B2 JP6670014 B2 JP 6670014B2 JP 2018548021 A JP2018548021 A JP 2018548021A JP 2018548021 A JP2018548021 A JP 2018548021A JP 6670014 B2 JP6670014 B2 JP 6670014B2
Authority
JP
Japan
Prior art keywords
signal
input signal
impulse response
audio signal
response function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018548021A
Other languages
English (en)
Other versions
JP2019512947A (ja
Inventor
スコグランド、ジャン
ホアン、イテン
レーブス、アレハンドロ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of JP2019512947A publication Critical patent/JP2019512947A/ja
Application granted granted Critical
Publication of JP6670014B2 publication Critical patent/JP6670014B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N29/00Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object
    • G01N29/44Processing the detected response signal, e.g. electronic circuits specially adapted therefor
    • G01N29/4409Processing the detected response signal, e.g. electronic circuits specially adapted therefor by comparison
    • G01N29/4427Processing the detected response signal, e.g. electronic circuits specially adapted therefor by comparison with stored values, e.g. threshold values
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • H04B3/237Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers using two adaptive filters, e.g. for near end and for end echo cancelling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Signal Processing (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Otolaryngology (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本明細書は、モバイルデバイスにおける音響エコーキャンセルに関する。
いくつかの音声通信システムでは、スピーカとマイクロフォンが連結されるときに音響エコーが発生する。そのような音声通信システムの一例は、ウェブブラウザ対応通信システムであるウェブリアルタイム通信(WebRTC)である。このようなウェブブラウザ対応通信システムは、音響エコーを低減または除去するためのソフトウェアベースの音響エコーキャンセル(AEC)処理を提供する。従来のAEC処理は、適応フィルタを使用してスピーカからのオーディオ出力におけるエコーのエコー経路を識別し、エコーの複製を合成し、エコーの複製をマイクロフォンへの入力から差し引くことを含む。
1つの包括的な態様において、方法は、スピーカおよびマイクロフォンを含むオーディオシステムにおける音響エコーを低減するように構成された処理回路が、オーディオシステムから離れたソース位置からのオーディオ信号をオーディオシステムのスピーカにおいて受信するステップを含むことができる。方法は、処理回路が、オーディオ信号の振幅と閾値振幅との比較処理を実行して比較結果を生成するステップを含むことができる。方法は、オーディオ信号の振幅が閾値振幅よりも小さいことを示す比較結果に応答して、処理回路が、オーディオシステムのマイクロフォンへの入力信号に対して第1のフィルタリング処理を実行して、第1のフィルタリングされた入力信号を生成するステップと、処理回路が、第1のフィルタリングされた入力信号をソース位置まで送信するステップとを含むことができる。方法は、オーディオ信号の振幅が閾値振幅よりも大きいことを示す比較結果に応答して、処理回路が、オーディオシステムのマイクロフォンへの入力信号に対して第2のフィルタリング処理を実行して、第1のフィルタリングされた入力信号とは異なる第2のフィルタリングされた入力信号を生成するステップと、処理回路が、第2のフィルタリングされた入力信号をソース位置まで送信するステップとを含むことができる。
1つまたは複数の実施形態の詳細は、添付の図面および以下の詳細な説明に記載されている。他の特徴は、明細書、図面および特許請求の範囲から明らかになるであろう。
本明細書に記載の改良された技術を実施するための例示的な電子環境を示す図である。 図1に示される電子環境内で改良された技術を実行する例示的な方法を示すフローチャートである。 図1に示される電子環境内で改良された技術を実行する例示的な方法を示す概略図である。 本明細書で説明する回路と共に使用することができるコンピューティングデバイスおよびモバイルコンピューティングデバイスの例を示す。
上述の従来の音響エコーキャンセル(AEC)処理は、エコー経路が線形であると仮定している。この仮定は、デスクトップおよびラップトップコンピュータに接続されたオーディオシステムには当てはまるが、入力と出力が非常に近い低品質のオーディオコンポーネントを持つモバイルデバイスには当てはまらない。モバイルデバイスの場合、エコー経路は非線形であり得る。この場合、従来のAEC処理は、オーディオ入力からエコーを除去するのに効果的ではない可能性がある。
本明細書に記載されている実施形態に従い、上述の従来のAEC処理とは対照的に、AEC処理を実行する改良された技術は、スピーカから出力される入力オーディオ信号の振幅が特定の閾値よりも小さい場合に、第1のフィルタリング処理を実行し、入力オーディオ信号の振幅が閾値よりも大きい場合に、第2のフィルタリング処理を実行する二方式振幅フィルタリング処理を提供することを含む。例えば、第1のフィルタリング処理は、入力オーディオ信号と第1のインパルス応答関数との間の畳み込み(convolution)の形態をとり得る。一例では、第1のインパルス応答関数は、残差信号(residual signal)のパワーを最適化する(例えば、残差信号のパワーを最小にする)汎用的なインパルス応答関数とすることができる。この例では、第2のフィルタリング処理は、入力オーディオ信号の非線形関数と第2のインパルス応答関数との間の畳み込みの形態を取り得る。そのような畳み込みの場合、二方式振幅フィルタリング処理は、入力オーディオ信号として、入力オーディオ信号のサンプルを指定の時間ウィンドウに亘って提供することを含む。第1および第2のインパルス応答関数は、マイクロフォンに入力される入力信号から決定されてもよい。いくつかの実施形態では、インパルス応答関数の各々は、入力信号と畳み込みの個々の出力との間の残差のパワーの最小化から計算される。
有利には、第1のフィルタリング処理と第2のフィルタリング処理との間の上述の振幅に依存する切り替えは、モバイルデバイスのソフトウェアベースの通信システムにおける非線形エコー経路を処理するための簡単なフレームワークを提供する。
図1は、上記の改善された技術を実施することができる例示的な電子環境100を示す図である。図1に示すように、例示的な電子環境100は、モバイルデバイス120およびネットワーク190を含む。いくつかの実施形態では、モバイルデバイス120は、スマートフォン、タブレットコンピュータなどの形態をとる。
モバイルデバイス120は、音響エコーキャンセルを提供するように構成される。モバイルデバイス120は、スピーカ110、ネットワークインタフェース122、1つまたは複数の処理ユニット124、メモリ126、オーディオインタフェース128、およびマイクロフォン180を含む。ネットワークインタフェース122は、ポイントクラウド圧縮コンピュータ120による使用のために、ネットワーク170から受信した電子信号および/または光信号を電子形式に変換するためのたとえば、イーサネット(登録商標)アダプタ、トークンリングアダプタなどを含む。一組の処理ユニット124は、1つまたは複数の処理チップおよび/またはアセンブリを含む。メモリ126は、揮発性メモリ(例えば、RAM)および1つまたは複数のROMなどのような不揮発性メモリの両方、ディスクドライブ、ソリッドステートドライブ等を含む。一組の処理ユニット124およびメモリ126は、制御回路を形成し、制御回路は、本明細書で説明されるような様々な方法および機能を実行するように構成および配置される。
いくつかの実施形態では、モバイルデバイス120の1つまたは複数のコンポーネントは、メモリ126に格納された命令を処理するように構成されたプロセッサ(たとえば、処理ユニット124)とすることができるか、またはそのプロセッサを含むことができる。図1に示すような命令の例には、入力オーディオ信号マネージャ130、振幅比較マネージャ136、小振幅フィルタリングマネージャ140、大振幅フィルタリングマネージャ150、パワー最小化マネージャ160、および周期性マネージャ170が含まれる。さらに、図1に示すように、メモリ126は、そのようなデータを使用する個々のマネージャに関して説明される様々なデータを記憶するように構成される。
入力オーディオ信号マネージャ130は、モバイルデバイス120から遠く離れた(例えば、WebRTCセッションの遠端のパーティの)オーディオソースからネットワークインタフェース122を介して入力オーディオ信号データ132を受信するように構成される。入力オーディオ信号マネージャ130は、オーディオ信号データを受信すると、ネットワーク190を介して受信されたオーディオ信号を、例えば200サンプル/秒以下などのいくらかの周波数でサンプリングするように構成される。さらに、入力オーディオ信号マネージャ130は、時間ウィンドウデータ134において指定される特定の時間ウィンドウに亘ってオーディオ信号の結果のサンプルを記憶するように構成される。このような時間ウィンドウに亘ってオーディオ信号を記憶することによって、ウィンドウ化されたオーディオ信号が入力オーディオ信号データ132として生成される。いくつかの実施形態では、時間ウィンドウ134は、例えば200ミリ秒またはそれ以下の固定時間として指定される。いくつかの実施形態では、時間ウィンドウ134は、固定数のサンプル、例えば、1ウィンドウ当たり40サンプル、またはそれより多く、またはそれより少ないサンプルとして指定される。いくつかの実施形態では、入力オーディオ信号マネージャ130は、指定の周期(例えば、200ミリ秒に1回、またはそれより多いか、または少ない周期)で、ウィンドウ化されたオーディオ信号を更新する。
振幅比較マネージャ134は、ウィンドウ化されたオーディオ信号132の振幅を振幅比較データ138において指定の閾値振幅と比較して、比較結果144を生成するように構成される。振幅比較マネージャ134は、比較結果144に従って小振幅フィルタリングマネージャ140または大振幅フィルタリングマネージャ150のうちの1つを選択して、ウィンドウ化されたオーディオ信号132に対してフィルタリング処理を実行するように構成される。例えば、閾値138よりも振幅が小さいことを比較結果144が示す場合、振幅比較マネージャ134は、小振幅フィルタリングマネージャ140を選択するように構成される。この例では、閾値138よりも振幅が大きいことを比較結果144が示す場合、振幅比較マネージャ134は、大振幅フィルタリングマネージャ150を選択するように構成される。
いくつかの実施形態では、振幅比較マネージャ134は、ウィンドウ化されたオーディオ信号132のサンプルの振幅の絶対値の最大値(すなわち、Lノルム)をウィンドウ化されたオーディオ信号132の振幅として生成するように構成されている。いくつかの実施形態では、振幅比較マネージャ134は、ウィンドウ化されたオーディオ信号132のサンプルの振幅の二乗の和(すなわち、Lノルム)をウィンドウ化されたオーディオ信号132の振幅として生成するように構成されている。
小振幅フィルタリングマネージャ140は、小振幅インパルス応答データ142を用いてウィンドウ化されたオーディオ信号132に対して畳み込み処理を実行するように構成される。いくつかの実施形態では、小振幅インパルス応答データ142のサンプル数は、ウィンドウ化されたオーディオ信号132のサンプル数に等しい。いくつかの実施形態では、小振幅インパルス応答データ142のサンプル数は、ウィンドウ化されたオーディオ信号132のサンプル数とは等しくない。そのような実施形態では、小振幅フィルタリングマネージャ140は、ウィンドウ化されたオーディオ信号132および小振幅インパルス応答データ142から最小数のサンプルを使用するように構成される。
大振幅フィルタリングマネージャ150は、大振幅インパルス応答データ154を用いてウィンドウ化されたオーディオ信号132の非線形関数に対して畳み込み処理を実行するように構成される。いくつかの実施形態では、大振幅インパルス応答データ154のサンプル数は、ウィンドウ化されたオーディオ信号132のサンプル数に等しい。いくつかの実施態様では、大振幅インパルス応答データ154のサンプル数は、ウィンドウ化されたオーディオ信号132のサンプル数とは等しくない。そのような実施形態では、大振幅フィルタリングマネージャ150は、ウィンドウ化されたオーディオ信号132および大振幅インパルス応答データ150から最小数のサンプルを使用するように構成される。
さらに、大振幅フィルタリングマネージャ150は、非線形関数データ152に従ってウィンドウ化されたオーディオ信号132の各サンプルについて非線形関数評価を実行するように構成される。非線形関数データ152は、閾値138よりも振幅が大きいことを示す比較結果144に応答して、大振幅フィルタリングマネージャ150によって実行されるべき非線形関数評価を指定する。例えば、非線形関数データ152は、数値インジケータ、テキスト記述子を介してそのような非線形関数を示すことができる。大振幅フィルタリングマネージャ150は、そのようなインジケータまたは記述子を解釈し、その解釈に従って非線形関数評価を実行するように構成される。いくつかの実施形態では、非線形関数データ152において指定の非線形関数は、ウィンドウ化されたオーディオ信号132のサンプルの値の累乗(例えば、サンプルの二乗)の形をとり得る。いくつかの実施形態では、このような非線形関数は、絶対値、絶対値の二乗、またはサンプルの絶対値の任意の累乗の形をとり得る。
パワー最小化マネージャ160は、オーディオインタフェース128を介してマイクロフォン180から受信された入力信号データ156に基づいて、小振幅インパルス応答データ142または大振幅インパルス応答データ154のいずれかを生成するように構成される。いくつかの実施形態では、パワー最小化マネージャ160は、残差を入力信号データ156と畳み込み出力との間の差として形成するように構成される。畳み込み出力は、複数の未知の重みとウィンドウ化されたオーディオ信号132との線形結合である。次に、パワー最小化マネージャ160は、パワーに対して、即ち未知の残差信号の値のサンプルの値の二乗和に対して、複数の未知の重みに亘って最小化演算を実行することによって小振幅インパルス応答データ142または大振幅インパルス応答データ154のいずれかを決定するように構成される。パワー最小化マネージャ160が最小化演算から決定する重みは、小振幅インパルス応答データ142または大振幅インパルス応答データ154のいずれか、および残差データ162を生成する。いくつかの実施形態では、パワー最小化マネージャ160は、未知の残差の絶対値または未知の残差の絶対値の累乗に対して最小化演算を実行して重みを生成するように構成される。
周期性マネージャ170は、周期性データ172において指定される期間に従って周期的に小振幅インパルス応答データ142または大振幅インパルス応答データ154をパワー最小化マネージャ160に更新させるように構成される。周期性データ172において指定される期間は、絶対時間間隔(例えば、1秒またはそれ以下)の単位、または時間ウィンドウの数(例えば、1以上の時間ウィンドウ)の単位で表現することができる。
ネットワーク190は、モバイルデバイス120と任意のリモートオーディオソースとの間のネットワーク接続を提供するように構成され、かつ配置される。ネットワーク190は、インターネットまたは他のネットワークを介した通信に共通に使用される様々なプロトコルおよびトポロジのいずれかを実装し得る。さらに、ネットワーク190は、そのような通信で使用される様々なコンポーネント(例えば、ケーブル、スイッチ/ルータ、ゲートウェイ/ブリッジなど)を含み得る。
いくつかの実施形態では、メモリ126は、ランダムアクセスメモリ、ディスクドライブメモリ、フラッシュメモリ、および/またはその他などの任意のタイプのメモリとすることができる。いくつかの実施形態では、メモリ126は、ユーザデバイス120のコンポーネントに関連付けられた2つ以上のメモリコンポーネント(例えば、2つ以上のRAMコンポーネントまたはディスクドライブメモリ)として実施することができる。いくつかの実施形態では、メモリ126はデータベースメモリとすることができる。いくつかの実施形態では、メモリ126は、非ローカルメモリとすることができるか、または非ローカルメモリを含むことができる。例えば、メモリ126は、複数のデバイス(図示せず)によって共有されるメモリとすることができるか、またはそのメモリを含むことができる。いくつかの実施形態では、メモリ126は、ネットワーク内のサーバデバイス(図示せず)に関連付けることができ、かつユーザデバイス120のコンポーネントにサービスを提供するように構成することができる。
モバイルデバイス120のコンポーネント(例えば、モジュール、処理ユニット124)は、1つまたは複数のタイプのハードウェア、ソフトウェア、ファームウェア、オペレーティングシステム、ランタイムライブラリ、および/またはその他を含むことができる1つまたは複数のプラットフォーム(たとえば、1つまたは複数の類似または異なるプラットフォーム)に基づいて動作するように構成することができる。いくつかの実施形態では、モバイルデバイス120のコンポーネントは、デバイスのクラスタ(例えば、サーバファーム)内で動作するように構成することができる。そのような実施形態では、モバイルデバイス120のコンポーネントの機能性および処理を、デバイスのクラスタのいくつかのデバイスに分散させることができる。
モバイルデバイス120のコンポーネントは、属性を処理するように構成された任意のタイプのハードウェアおよび/またはソフトウェアとすることができるか、またはそれを含むことができる。いくつかの実施形態では、図1におけるモバイルデバイス120のコンポーネントに示されたコンポーネントの1つまたは複数の部分は、ハードウェアベースのモジュール(例えば、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、メモリ)、ファームウェアモジュール、および/またはソフトウェアベースのモジュール(例えば、コンピュータコードのモジュール、一組のコンピュータで実行可能なコンピュータ可読命令)とすることができるか、またはそれらを含むことができる。例えば、いくつかの実施形態では、モバイルデバイス120のコンポーネントの1つまたは複数の部分は、少なくとも1つのプロセッサ(図示せず)による実行のために構成されたソフトウェアモジュールとすることができるか、またはそれを含むことができる。いくつかの実施形態では、コンポーネントの機能は、図1に示されたものとは異なるモジュールおよび/または異なるコンポーネントに含まれ得る。
図示されていないが、いくつかの実施形態では、モバイルデバイス120のコンポーネント(またはその一部)は、例えばデータセンタ(例えば、クラウドコンピューティング環境)、コンピュータシステム、1つまたは複数のサーバ/ホストデバイス、および/またはその他の内部で動作するように構成することができる。いくつかの実施形態では、モバイルデバイス120のコンポーネント(またはその一部)は、ネットワーク内で動作するように構成することができる。したがって、モバイルデバイス120のコンポーネント(またはその一部)は、1つまたは複数のデバイスおよび/または1つまたは複数のサーバデバイスを含むことができる様々なタイプのネットワーク環境内で機能するように構成することができる。例えば、ネットワークは、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)および/またはその他とすることができるか、それを含むことができる。ネットワークは、無線ネットワークおよび/または例えば、ゲートウェイデバイス、ブリッジ、スイッチ、および/またはその他を使用して実施された無線ネットワークとすることができるか、またはそれを含むことができる。ネットワークは、1つまたは複数のセグメントを含むことができ、かつ/またはインターネットプロトコル(IP)および/またはプロプライエタリプロトコルなどの様々なプロトコルに基づく一部を有することができる。ネットワークは、インターネットの少なくとも一部を含むことができる。
いくつかの実施形態では、モバイルデバイス120の1つまたは複数のコンポーネントは、メモリに格納された命令を処理するように構成されたプロセッサとすることができるか、またはそれを含むことができる。例えば、入力オーディオ信号マネージャ130(および/またはその一部)、振幅比較マネージャ136(および/またはその一部)、小振幅フィルタリングマネージャ140(および/またはその一部)、大振幅フィルタリングマネージャ150(および/またはその一部)、パワー最小化マネージャ160(および/またはその一部)、および周期性マネージャ170(および/またはその一部)は、1つまたは複数の機能を実施するためのプロセスに関連する命令を実行するように構成されたプロセッサおよびメモリの組み合わせとすることができる。
図2は、エコーキャンセルを実行する例示的な方法200を示すフローチャートである。方法200は、モバイルデバイス120のメモリ126に存在し、かつ一組の処理ユニット124によって実行される、図1に関連して説明したソフトウェア構成によって実行することができる。
202において、モバイルデバイス120は、音響エコーを低減するようにモバイルデバイス120が構成されているオーディオシステムから遠く離れたソース位置からのオーディオ信号を受信する。いくつかの構成では、例えば図1に示されているように、オーディオシステムは、モバイルデバイス120に含まれる。いくつかの構成では、オーディオ信号は、時間ウィンドウに亘るオーディオ信号の等間隔サンプルの離散数(a discrete number of evenly-spaced samples)として表現される。
204において、モバイルデバイス120は、オーディオ信号の振幅と閾値振幅との比較処理を実行して、比較結果、例えば比較結果144を生成する。いくつかの構成では、振幅比較マネージャ136は、Lノルム、例えば、時間ウィンドウに亘るサンプルの絶対値の最大値に従ってオーディオ信号の振幅を計算する。いくつかの構成では、振幅比較マネージャ136は、Lノルム、例えば、時間ウィンドウに亘るサンプルの絶対値の二乗和に従ってオーディオ信号の振幅を計算する。
206において、オーディオ信号の振幅が閾値振幅よりも小さいことを示す比較結果に応答して、モバイルデバイス120は、オーディオシステムのマイクロフォンに入力される入力信号に対して第1のフィルタリング処理を実行して、第1のフィルタリングされた入力信号を生成する。いくつかの構成では、モバイルデバイス120は、小振幅フィルタリングマネージャ140と連携して、ウィンドウ化されたオーディオ信号(例えば、オーディオ信号データ132)および小振幅インパルス応答データ142に対して畳み込み処理を実行する。いくつかの構成では、後に生成される第1のフィルタリングされた入力信号は、入力信号と畳み込み処理の出力との間の差に等しい残差信号である。208において、モバイルデバイス120は、第1のフィルタリングされた入力信号をソース位置まで送信する。
210において、オーディオ信号の振幅が閾値振幅よりも大きいことを示す比較結果に応答して、モバイルデバイス120は、オーディオシステムのマイクロフォンに入力される入力信号に対して第2のフィルタリング処理を実行して、第2のフィルタリングされた入力信号を生成する。いくつかの構成では、モバイルデバイス120は、大振幅フィルタリングマネージャ150と連携して、ウィンドウ化されたオーディオ信号の非線形関数(例えば、オーディオ信号データ132)および大振幅インパルス応答データ152に対して畳み込み処理を実行する。いくつかの構成では、後に生成される第2のフィルタリングされた入力信号は、入力信号と畳み込み処理の出力との間の差に等しい残差信号である。212において、モバイルデバイス120は、第2のフィルタリングされた入力信号をソース位置まで送信する。
図3は、例示的なオーディオシステム300を示す概略図である。この図に示すように、オーディオ信号x(n)のサンプルは、瞬時に遠隔地310からオーディオシステム300に到着する。オーディオシステム300内の回路は、オーディオ信号x(n)をユーザ306によって聴取されるオーディオシステム300のスピーカ302に送る。
音響エコーは、入力信号y(n)を形成するためにユーザ306からの音声入力に加えて、スピーカ302からの出力がマイクロフォン304によってピックアップされるときに生じる。オーディオシステム300の回路は、遠隔地310に戻る出力信号e(n)を提供するように構成され、それはユーザがマイクロフォン306に提供したものに類似し、スピーカ302からの出力をフィルタリングする。
音響エコーの固有の非線形性(例えば、モバイルデバイス、例えばモバイルデバイス120におけるスピーカ302およびマイクロフォン306の近接性および品質による)のために、オーディオシステム300内の回路は、入力オーディオ信号x(n)の振幅に依存するフィルタリング処理を実行するように構成される。図3に示されるように、オーディオシステム300は、L∞ノルム、即ち、
に従って入力オーディオ信号x(n)の振幅を計算する。式中、x(i)は、nサンプルの時間ウィンドウ内のオーディオ信号のi番目のサンプルである。
ウィンドウ化された信号x(n)が受信された直後に、入力オーディオ信号||x||の振幅がある瞬間に生成されると、オーディオシステム300は、スイッチ320でこの振幅を閾値Tと比較する。次いで、オーディオシステム300は、||x||<Tのときの回路の小振幅ブランチ340と、||x||>Tのときの回路の大振幅ブランチ350とのうちの1つに従ってフィルタリング処理を実行する。
小振幅ブランチ340は、線形フィルタリング処理を実行することを含む。この線形フィルタリング処理は、入力信号y(n)からウィンドウ化されたオーディオ信号x(n)とインパルス応答関数h(n)との間の畳み込みを減算して残差信号e(n)を形成することを含む。例えば、この残差信号は、数学的形式:
を有し得る。
大振幅フィルタリング処理350は、非線形フィルタリング処理を実行することを含む。この非線形フィルタリング処理は、入力信号y(n)からウィンドウ化されたオーディオ信号の非線形関数、即ちg[x(n)]とインパルス応答関数h(n)との間の畳み込みを減算して残差信号e(n)を形成することを含む。いくつかの実施形態では、非線形関数はg(z)=zの形をとる。例えば、この残差信号は、数学的形式:
を有し得る。
オーディオシステム300は、個々の残差信号e(n)及びe(n)のパワーを最小化することによってインパルス応答関数h(n)及びh(n)の各々を導出する。例えば、オーディオシステムは、式:
で与えられる残差信号パワーPが最小となるように数c、c、...cを発見することにより残差信号e(n)に対してそのような最小化を実行し得る。いくつかの実施形態では、インパルス応答関数は、加重高調波の和(weighted harmonic sum)、すなわち、係数倍の高調波(例えば、正弦または余弦の項)の合計の形をとる。各高調波は基本周波数の倍数である。そのような実施形態では、オーディオシステム200の回路は、フーリエ解析の標準的な技術を適用して未知の重みを生成する。
同様に、大振幅ブランチ350におけるパワーの表現は、
である。
いくつかの実施形態では、オーディオシステム300は、例えば一定の固定された特定の期間に従ってインパルス応答関数hおよびhを周期的に更新する。いくつかの実施形態では、期間は時間ウィンドウのサイズに等しい。
いくつかの実施形態では、小振幅ブランチ350は、畳み込みの前にウィンドウ化されたオーディオ信号に非線形関数gを適用することを含み、ここでgはgとは異なる。
いくつかの実施態様では、スイッチ320に3つ以上のブランチが存在してもよい。そのような場合、複数の閾値、すなわち、k個のブランチが存在すると、k−1個の閾値T、T、...、Tk−1が存在する。このように、振幅がTよりも小さい場合、オーディオシステムは、第1のブランチに従って第1のフィルタ(即ち、第1の非線形関数および第1のインパルス応答関数)を提供し、振幅がTよりも大きくTよりも小さい場合、オーディオシステムは第2のブランチに従って第2のフィルタを提供する。
図4は、本明細書において説明する技術に関し使用され得る一般的なコンピュータデバイス400及び一般的なモバイル・コンピュータデバイス450の一例を図示している。
図4に示すように、コンピューティングデバイス400は、ラップトップ、デスクトップ、ワークステーション、個人用情報端末、サーバ、ブレードサーバ、メインフレーム、及び他の適切なコンピュータ等、様々な形態のデジタル・コンピュータを表すよう意図されている。コンピューティングデバイス450は、個人用情報端末、携帯電話、スマートフォン、及び他の同様のコンピューティングデバイス等、様々な形態のモバイルデバイスを表すよう意図されている。本明細書において示しているコンポーネントと、コンポーネント同士の接続及び関係と、コンポーネントの機能とは、例示としてのみ意図されており、本明細書において説明し、及び/又は特許請求の範囲に記載した発明の実施形態を限定するようには意図されていない。
コンピューティングデバイス400は、プロセッサ402と、メモリ404と、記憶デバイス406と、メモリ404及び高速拡張ポート410に接続している高速インタフェース408と、低速バス414及び記憶デバイス406に接続している低速インタフェース412とを備える。コンポーネント402,404,406,408,410,412の各々は、様々なバスを用いて相互接続されており、共通のマザーボードに取り付けられていることもあれば、適切な場合には他の態様により取り付けられていることもある。プロセッサ402は、高速インタフェース408に結合されているディスプレイ416等の外部の入力デバイス又は出力デバイス上においてGUI用のグラフィカル情報を表示するためのメモリ404又は記憶デバイス406に記憶されている命令を含む、コンピューティングデバイス400内における実行のための命令を処理できる。他の実施形態では、複数のプロセッサ及び/又は複数のバスは、適切な場合、複数のメモリ及びある種のメモリとともに使用されてもよい。さらに、複数のコンピューティングデバイス400が互いに接続されて、各々のデバイスが必要な動作のうちの部分を提供してもよい(例えば、サーババンク、ブレードサーバのグループ、又はマルチプロセッサシステム)。
メモリ404は、コンピューティングデバイス400内において情報を記憶する。一実施形態では、メモリ404は、1つ以上の揮発性メモリユニットである。別の実施形態では、メモリ404は、1つ以上の不揮発性メモリユニットである。さらに、メモリ404は、磁気ディスク又は光学ディスク等、別の形態のコンピュータ可読媒体であってもよい。
記憶デバイス406は、コンピューティングデバイス400のために大容量の記憶を提供できる。一実施形態では、記憶デバイス406は、フロッピー(登録商標)ディスクデバイス、ハードディスクデバイス、光ディスクデバイス、テープデバイス、フラッシュメモリ若しくは他の同様のソリッド・ステート・メモリ・デバイス、又はデバイスからなるアレイ(ストレージエリアネットワーク又は他の構成のデバイスを含む)等、コンピュータ可読媒体であってもよく、また、そのコンピュータ可読媒体を含んでいてもよい。コンピュータプログラム製品は、情報キャリアに有形に具現化される場合がある。さらに、コンピュータプログラム製品は、実行されたときに、上述した方法等の1つ以上の方法を実行する命令を含んでいてもよい。情報キャリアは、メモリ404、記憶デバイス406、又はプロセッサ402上のメモリ等、コンピュータ可読媒体又は機械可読媒体である。
高速制御部408は、コンピューティングデバイス400のために帯域集約の動作を管理する一方、低速制御部412は、比較的低い帯域集約の動作を管理する。機能のそのような割り当ては、例示にすぎない。一実施形態では、高速制御部408は、メモリ404と、ディスプレイ416(例えば、グラフィクスのプロセッサ又はアクセラレータを通じて)と、様々な拡張カード(図示せず)を受容し得る高速拡張ポート410とに結合されている。その実施形態では、低速制御部412は、記憶デバイス406と低速拡張ポート414に結合されている。様々な通信ポート(例えば、USB、Bluetooth(登録商標)、イーサネット(登録商標)、無線イーサネット)を含み得る低速拡張ポートは、キーボード、ポインティングデバイス、スキャナ等、1つ以上の入力デバイス若しくは出力デバイス、又はスイッチ若しくはルータ等のネットワーキングデバイス(例えば、ネットワークアダプタを通じて)に結合されていてもよい。
コンピューティングデバイス400は、図に示すように、多くの異なる形態において実装されてよい。例えばそれは、スタンダードサーバ420として実装されたり、そのようなサーバのグループにおいて複数回にわたって実装されたりする場合がある。さらにそれは、ラックサーバシステム424の一部として実装されてもよい。さらにそれは、ラップトップコンピュータ422等のパーソナルコンピュータにおいて実装されてもよい。これに代えて、コンピューティングデバイス400のコンポーネントは、デバイス450等のモバイルデバイス(図示せず)における他のコンポーネントと組み合わされてもよい。そのようなデバイスの各々は、コンピューティングデバイス400,450のうちの1つ以上を含んでいてもよく、システム全体が、互いに通信する複数のコンピューティングデバイス400,450から構成されてもよい。
コンピューティングデバイス450は、プロセッサ452と、メモリ464と、ディスプレイ454等の入力デバイス又は出力デバイスと、通信インタフェース466と、送受信機468とをコンポーネントとして特に備える。デバイス450は、追加の記憶部を提供するために、マイクロドライブ又は他のデバイス等の記憶デバイスをさらに備えていてもよい。コンポーネント450,452,464,454,466,468の各々は、様々なバスを用いて相互接続されており、コンポーネントのうちのいくつかは、共通のマザーボードに取り付けられていることもあれば、適切な場合には他の態様により取り付けられていることもある。
プロセッサ452は、コンピューティングデバイス450内において、メモリ464に記憶されている命令を含む命令を実行できる。プロセッサは、別個の複数のアナログプロセッサ及びデジタルプロセッサを含むチップからなるチップセットとして実装されてもよい。プロセッサは、例えば、ユーザインタフェースの制御等のデバイス450の他のコンポーネントの協調と、デバイス450によって動作させられるアプリケーションと、デバイス450による無線通信とを可能にする。
プロセッサ452は、ディスプレイ454に結合されている制御インタフェース458及びディスプレイインタフェース456を通じて使用者と通信し得る。ディスプレイ454は、例えば、TFT LCD(薄膜トランジスタ液晶ディスプレイ)若しくはOLED(有機発光ダイオード)ディスプレイ、又は他の適切なディスプレイ技術であってよい。ディスプレイインタフェース456は、グラフィカル情報及び他の情報を使用者に提示するためにディスプレイ454を動作させるための適切な回路を備えることができる。制御インタフェース458は、使用者からコマンドを受信し、プロセッサ452に渡すためにそのコマンドを変換できる。さらに、外部インタフェース462は、他のデバイスとのデバイス450の近領域通信を可能にするように、プロセッサ452と通信していてもよい。外部インタフェース462は、例えば、一部の実施形態における有線通信又は他の実施形態における無線通信を可能にする場合があり、さらに、複数のインタフェースが用いられてもよい。
メモリ464は、コンピューティングデバイス450内において、情報を記憶する。メモリ464は、1つ以上のコンピュータ可読媒体と、1つ以上の揮発性メモリユニットと、1つ以上の不揮発性メモリユニットと、のうちの1つ以上として実装される場合がある。さらに、拡張メモリ474が提供されるとともに、例えば、SIMM(シングルインラインメモリモジュール)カードインタフェースを含み得る拡張インタフェース472を通じてデバイス450に接続されてもよい。そのような拡張メモリ474によって、デバイス450のための余分な記憶スペースが提供される場合もあれば、また、デバイス450のためのアプリケーション又は他の情報が記憶される場合もある。具体的には、拡張メモリ474は、上述した処理を実行し、又は補完するための命令を含んでいてもよく、さらに、セキュア情報も含んでいる場合がある。したがって、例えば、拡張メモリ474は、デバイス450のためのセキュリティモジュールとして提供される場合もあり、デバイス450のセキュアな使用を可能にする命令に関しプログラミングされていてもよい。さらに、セキュアアプリケーションは、ハッキング不可能な態様により識別情報をSIMMカード上に配置すること等、追加の情報とともにSIMMカードを介して提供される場合がある。
メモリは、例えば、下記のように、フラッシュメモリ及び/又はNVRAMメモリを含み得る。一実施形態では、コンピュータプログラム製品は、情報キャリアに有形に具現化される。コンピュータプログラム製品は、実行されたときに、上述した方法等の1つ以上の方法を実行する命令を含む。情報キャリアは、例えば、送受信機468又は外部インタフェース462によって受信される、メモリ464、拡張メモリ474、又はプロセッサ452上のメモリ等のコンピュータ可読媒体又は機械可読媒体である。
デバイス450は、必要な場合にはデジタル信号処理回路を含み得る通信インタフェース466を通じて無線により通信できる。通信インタフェース466は、特に、GSM(登録商標)ボイスコール、SMS、EMS、又はMMSのメッセージング、CDMA、TDMA、PDC、WCDMA(登録商標)、CDMA2000、又はGPRS等、様々なモード又はプロトコルの下、通信を可能にし得る。そのような通信は、例えば、無線周波数の送受信機468を通じて行われてもよい。さらに、狭域通信は、Bluetooth、WiFi(登録商標)、又は他のそのような送受信機(図示せず)を用いること等によって、行われてもよい。さらに、GPS(全地球測位システム)受信機モジュール470は、航行及び場所に関係する追加の無線データをデバイス450に提供でき、その無線データは、適切な場合には、デバイス450上において動作するアプリケーションによって使用されてもよい。
さらに、デバイス450は、使用者から音声情報を受信し、これを使用に適したデジタル情報に変換できる音声コーデック460を用いて可聴の通信を行ってもよい。音声コーデック460は、例えば、デバイス450のハンドセットにおいて、スピーカを通じること等により使用者に対して可聴音を同様に生成してもよい。そのような音は、音声通話からの音を含む場合もあれば、記録された音(例えば、ボイスメッセージ、音楽ファイル等)を含む場合もあれば、また、デバイス450上において動作するアプリケーションによって生成される音を含む場合もある。
コンピューティングデバイス450は、図に示すように、多くの異なる形態により実装されてよい。例えば、それは、携帯電話480として実装されてもよい。さらに、それは、スマートフォン482、個人用情報端末、又は他の同様のモバイルデバイスの一部として実装されてもよい。
本明細書に記載されたシステムおよび技術の様々な実施形態は、デジタル電子回路、集積回路、特別に設計されたASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせで実現することができる。これらの様々な実施形態は、データおよび命令を受信し、かつデータおよび命令を記憶システム、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスに送信するように結合された少なくとも1つのプログラム可能なプロセッサを含むプログラマブルシステム上で実行可能および/または解釈可能な1つまたは複数のコンピュータプログラムにおける実施を含むことができる。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとしても知られている)は、プログラム可能なプロセッサ用のマシン命令を含み、高度な手続き型および/またはオブジェクト指向プログラミング言語および/またはアセンブリ言語/機械語で実施することができる。本明細書で使用される「機械可読媒体」という用語は、機械可読信号として機械命令を受信する機械可読媒体を含むプログラマブルプロセッサに機械命令および/またはデータを提供するために使用される任意のコンピュータプログラム製品、装置および/またはデバイス(例えば、磁気ディスク、光ディスク、メモリ、プログラマブル論理デバイス(PLD))を指す。「機械可読信号」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供するために使用される任意の信号を指す。
使用者との対話を提供するために、本明細書に記載されたシステムおよび技術は、情報を使用者に表示するためのディスプレイデバイス(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、使用者がそれによって入力をコンピュータに提供できるキーボード及びポインティングデバイス(例えば、マウス又はトラックボール)と、を有するコンピュータ上において実装されてもよい。他の種類のデバイスもまた、使用者との対話を提供するために使用されてもよく、例えば、使用者に提供されるフィードバックは、任意の形態の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触知フィードバック)であってよく、使用者からの入力は、音響入力、音声入力、又は触知入力を含む任意の形態により受信されてよい。
本明細書に記載されたシステムおよび技術は、バックエンドコンポーネント(例えば、データサーバとして)を含むコンピューティングシステム、ミドルウェアコンポーネント(例えば、アプリケーションサーバ)を含むコンピューティングシステム、フロントエンドコンポーネント(例えば、ユーザが本明細書に記載されたシステムおよび技術の実施形態と対話可能なグラフィカルユーザインタフェース又はウェブブラウザを有するクライアントコンピュータ)を含むコンピューティングシステム、又はそのようなバックエンドコンポーネント、ミドルウェアコンポーネント、若しくはフロントエンドコンポーネントの任意の組み合わせにより実装される場合がある。システムのコンポーネントは、デジタルデータ通信の任意の形態又は媒体(例えば、通信ネットワーク)によって相互接続されてよい。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク(「WAN」)、およびインターネットを含む。
コンピューティングシステムは、クライアントおよびサーバを含むことができる。クライアントおよびサーバは、一般に、互いに遠く離れており、典型的には、通信ネットワークを介してインタラクトする。クライアントとサーバとの関係は、個々のコンピュータ上で動作し、かつ互いにクライアント−サーバ関係を有するコンピュータプログラムにより生じる。
いくつかの実施形態について説明した。それにもかかわらず、本明細書の技術思想および範囲から逸脱することなく様々な変更がなされ得ることが理解されるであろう。
また、ある要素が他の要素の上に存在し、接続されている、電気的に接続されている、結合している、または電気的に結合していると言及されている場合、それは他の要素の上に直接に存在し、接続され又は結合されてもよく、又は1つ以上の介在要素が存在してもよい。対照的に、ある要素が他の要素に上に直接に存在し、他の要素に直接接続されているか直接結合されている場合、介在要素は存在しない。上に直接に存在し、直接的に接続された、または直接的に結合されたという用語は、詳細な説明を通して使用されないかもしれないが、上に直接に存在し、直接的に接続されているかまたは直接的に結合されているとして示されている要素は、そのように言及することができる。本願の特許請求の範囲は、本明細書に記載され又は図面に示される例示的な関係を暗示するように修正されてもよい。
記載された実施形態の特定の特徴は、本明細書に記載されているように例示されているが、当業者には多くの修正、置換、変更、均等物が生じるであろう。したがって、添付の特許請求の範囲は、そのような修正および変更の全てを実施の範囲内に包含することを意図していることを理解されたい。それらは限定ではなく単なる例として提示されたものであり、形態および細部の様々な変更がなされ得ることを理解されたい。相互排他的な組み合わせを除いて、本明細書に記載の装置および/または方法の任意の部分は、任意の組み合わせで組み合わせることができる。本明細書で説明される実施形態は、説明された異なる実施形態の機能、構成要素、および/または特徴の様々な組合せおよび/またはサブコンビネーションを含むことができる。
さらなる実施形態は、以下の実施例に要約される。
実施例1: スピーカおよびマイクロフォンを含むオーディオシステムにおける音響エコーを低減するように構成された処理回路が、前記オーディオシステムから離れたソース位置からのオーディオ信号を前記オーディオシステムの前記スピーカにおいて受信するステップと、前記処理回路が、前記オーディオ信号の振幅と閾値振幅との比較処理を実行して比較結果を生成するステップと、前記オーディオ信号の振幅が前記閾値振幅よりも小さいことを示す比較結果に応答して、前記処理回路が、前記オーディオシステムの前記マイクロフォンへの入力信号に対して第1のフィルタリング処理を実行して、第1のフィルタリングされた入力信号を生成するステップと、前記処理回路が、前記第1のフィルタリングされた入力信号を前記ソース位置まで送信するステップと、前記オーディオ信号の振幅が前記閾値振幅よりも大きいことを示す比較結果に応答して、前記処理回路が、前記オーディオシステムの前記マイクロフォンへの入力信号に対して第2のフィルタリング処理を実行して、前記第1のフィルタリングされた入力信号とは異なる第2のフィルタリングされた入力信号を生成するステップと、前記処理回路が、前記第2のフィルタリングされた入力信号を前記ソース位置まで送信するステップとを含む、方法。
実施例2: 前記第1のフィルタリング処理の実行は、指定の時間ウィンドウに亘って前記オーディオ信号をサンプリングして、ウィンドウ化されたオーディオ信号を生成することと、前記マイクロフォンに入力される前記入力信号に基づいて第1のインパルス応答関数を生成することと、前記ウィンドウ化されたオーディオ信号と前記第1のインパルス応答関数との畳み込みをして、第1のフィルタリングされた入力信号を生成することとを含む、実施例1に記載の方法。
実施例3: 前記マイクロフォンに入力される前記入力信号に基づく前記第1のインパルス応答関数の生成は、残差信号のパワーを最適化する汎用的なインパルス応答関数を前記第1のインパルス応答関数として生成することを含み、前記残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号および前記汎用的なインパルス応答関数の畳み込みとの間の差に等しく、前記第1のフィルタリングされた入力信号の前記ソース位置への送信は、パワーが最適化された残差信号を前記第1のフィルタリングされた入力信号として送信することを含み、前記パワーが最適化された残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号および前記第1のインパルス応答関数の畳み込みとの間の差に等しい、実施例2に記載の方法。
実施例4: 前記第1のインパルス応答関数は複数の高調波の加重和(weighted sum of harmonics)であり、各高調波は基本周波数の倍数に等しい周波数を有する、実施例2または3に記載の方法。
実施例5: 前記第1のフィルタリング処理の実行は、前記第1のインパルス応答関数の生成後の指定時間後に、別の第1のインパルス応答関数を生成することをさらに含む、実施例2乃至4のいずれか1つに記載の方法。
実施例6: 前記ウィンドウ化されたオーディオ信号は、前記オーディオ信号の複数のサンプルを含み、前記複数のサンプルの各々は、前記指定の時間ウィンドウ内に生じる時間における前記オーディオ信号の値であり、前記オーディオ信号の振幅と前記閾値振幅との比較処理の実行は、前記オーディオ信号の複数のサンプルの各々の絶対値を生成して、複数の絶対値を生成することと、前記複数の絶対値のうち最大のものを前記オーディオ信号の振幅として生成することとを含む、実施例2乃至5のいずれか1つに記載の方法。
実施例7: 前記第2のフィルタリング処理の実行は、前記ウィンドウ化されたオーディオ信号の非線形関数を生成することと、前記マイクロフォンに入力される前記入力信号に基づいて第2のインパルス応答関数を生成することと、(i)前記ウィンドウ化されたオーディオ信号の非線形関数と(ii)前記第1のインパルス応答関数との畳み込みをして、第1のフィルタリングされた入力信号を生成することとを含む、実施例1乃至6のいずれか1つに記載の方法。
実施例8: 前記ウィンドウ化されたオーディオ信号の非線形関数の生成は、前記ウィンドウ化されたオーディオ信号の振幅を二乗することを含む、実施例7に記載の方法。
実施例9: 前記マイクロフォンに入力される入力信号に基づく前記第2のインパルス応答関数の生成は、残差信号のパワーを最適化する汎用的なインパルス応答関数を前記第2のインパルス応答関数として生成することを含み、前記残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号の非線形関数および前記汎用的なインパルス応答関数の畳み込みとの間の差に等しく、前記第2のフィルタリングされた入力信号の前記ソース位置への送信は、パワーが最適化された残差信号を前記第2のフィルタリングされた入力信号として送信することを含み、前記パワーが最適化された残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号の非線形関数および前記第2のインパルス応答関数の畳み込みとの間の差に等しい、実施例7または8に記載の方法。
実施例10: 前記第2のフィルタリング処理の実行は、前記第2のインパルス応答関数の生成後の指定時間後に、別の第2のインパルス応答関数を生成することをさらに含む、実施例6乃至9のいずれか1つに記載の方法。
実施例11: 非一時的な記憶媒体を備えるコンピュータプログラム製品であって、前記コンピュータプログラム製品はコードを含み、前記コードは、スピーカおよびマイクロフォンを含むオーディオシステムにおける音響エコーを低減するように構成された処理回路により実行されたときに、前記オーディオシステムから離れたソース位置からのオーディオ信号を前記オーディオシステムの前記スピーカにおいて受信するステップと、前記オーディオ信号の振幅と閾値振幅との比較処理を実行して比較結果を生成するステップと、前記オーディオ信号の振幅が前記閾値振幅よりも小さいことを示す比較結果に応答して、前記オーディオシステムの前記マイクロフォンへの入力信号に対して第1のフィルタリング処理を実行して、第1のフィルタリングされた入力信号を生成するステップと、前記第1のフィルタリングされた入力信号を前記ソース位置まで送信するステップと、前記オーディオ信号の振幅が前記閾値振幅よりも大きいことを示す比較結果に応答して、前記オーディオシステムの前記マイクロフォンへの入力信号に対して第2のフィルタリング処理を実行して、前記第1のフィルタリングされた入力信号とは異なる第2のフィルタリングされた入力信号を生成するステップと、前記第2のフィルタリングされた入力信号を前記ソース位置まで送信するステップとを含む方法を前記処理回路に実行させる、コンピュータプログラム製品。
実施例12: 前記第1のフィルタリング処理の実行は、指定の時間ウィンドウに亘って前記オーディオ信号をサンプリングして、ウィンドウ化されたオーディオ信号を生成することと、前記マイクロフォンに入力される前記入力信号に基づいて第1のインパルス応答関数を生成することと、前記ウィンドウ化されたオーディオ信号と前記第1のインパルス応答関数との畳み込みをして、第1のフィルタリングされた入力信号を生成することとを含む、実施例11に記載のコンピュータプログラム製品。
実施例13: 前記マイクロフォンに入力される前記入力信号に基づく前記第1のインパルス応答関数の生成は、残差信号のパワーを最適化するインパルス応答関数を前記第1のインパルス応答関数として生成することを含み、前記残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号および汎用的なインパルス応答関数の畳み込みとの間の差に等しく、前記第1のフィルタリングされた入力信号の前記ソース位置への送信は、パワーが最適化された残差信号を前記第1のフィルタリングされた入力信号として送信することを含み、前記パワーが最適化された残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号および前記第1のインパルス応答関数の畳み込みとの間の差に等しい、実施例12に記載のコンピュータプログラム製品。
実施例14: 前記第1のフィルタリング処理の実行は、前記第1のインパルス応答関数の生成後の指定時間後に、別の第1のインパルス応答関数を生成することをさらに含む、実施例12または13に記載の方法。
実施例15: 前記ウィンドウ化されたオーディオ信号は、前記オーディオ信号の複数のサンプルを含み、前記複数のサンプルの各々は、前記指定の時間ウィンドウ内に生じる時間における前記オーディオ信号の値であり、前記オーディオ信号の振幅と前記閾値振幅との比較処理の実行は、前記オーディオ信号の複数のサンプルの各々の絶対値を生成して、複数の絶対値を生成することと、前記複数の絶対値のうち最大のものを前記オーディオ信号の振幅として生成することとを含む、実施例12乃至14のいずれか1つに記載のコンピュータプログラム製品。
実施例16: 前記第2のフィルタリング処理の実行は、前記ウィンドウ化されたオーディオ信号の非線形関数を生成することと、前記マイクロフォンに入力される前記入力信号に基づいて第2のインパルス応答関数を生成することと、(i)前記ウィンドウ化されたオーディオ信号の非線形関数と(ii)前記第1のインパルス応答関数との畳み込みをして、第1のフィルタリングされた入力信号を生成することとを含む、実施例11乃至15のいずれか1つに記載のコンピュータプログラム製品。
実施例17: 前記ウィンドウ化されたオーディオ信号の非線形関数の生成は、前記ウィンドウ化されたオーディオ信号の振幅を二乗することを含む、実施例16に記載の方法。
実施例18: 前記マイクロフォンに入力される入力信号に基づく前記第2のインパルス応答関数の生成は、残差信号のパワーを最適化する汎用的なインパルス応答関数を前記第2のインパルス応答関数として生成することを含み、前記残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号の非線形関数および前記汎用的なインパルス応答関数の畳み込みとの間の差に等しく、前記第2のフィルタリングされた入力信号の前記ソース位置への送信は、パワーが最適化された残差信号を前記第2のフィルタリングされた入力信号として送信することを含み、前記パワーが最適化された残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号の非線形関数および前記第2のインパルス応答関数の畳み込みとの間の差に等しい、実施例16または17に記載のコンピュータプログラム製品。
実施例19: 前記第2のフィルタリング処理の実行は、前記第2のインパルス応答関数の生成後の指定時間後に、別の第2のインパルス応答関数を生成することをさらに含む、実施例17に記載のコンピュータプログラム製品。
実施例20: スピーカおよびマイクロフォンを含むオーディオシステムにおける音響エコーを低減するように構成された電子装置であって、前記電子装置は、メモリと、前記メモリに接続された制御回路とを備え、前記制御回路は、前記オーディオシステムから離れたソース位置からのオーディオ信号を前記オーディオシステムの前記スピーカにおいて受信し、前記オーディオ信号の振幅と閾値振幅との比較処理を実行して比較結果を生成し、前記オーディオ信号の振幅が前記閾値振幅よりも小さいことを示す比較結果に応答して、前記オーディオシステムの前記マイクロフォンに入力される入力信号に対して第1のフィルタリング処理を実行して、第1のフィルタリングされた入力信号を生成し、かつ、前記第1のフィルタリングされた入力信号を前記ソース位置まで送信し、前記オーディオ信号の振幅が前記閾値振幅よりも大きいことを示す比較結果に応答して、前記オーディオシステムの前記マイクロフォンに入力される入力信号に対して第2のフィルタリング処理を実行して、前記第1のフィルタリングされた入力信号とは異なる第2のフィルタリングされた入力信号を生成し、かつ、前記第2のフィルタリングされた入力信号を前記ソース位置まで送信するように構成されている、電子装置。
さらに、図面に記載された論理フローは、望ましい結果を達成するために示された特定の順序または逐次的な順序を必要としない。さらに、記載されたフローから他のステップを設けてもよく、またステップを省略してもよく、他の構成を記載されたシステムに追加したり、システムから削除したりしてもよい。従って、他の実施態様も以下の特許請求の範囲内にある。

Claims (17)

  1. スピーカおよびマイクロフォンを含むオーディオシステムにおける音響エコーを低減するように構成された処理回路が、前記オーディオシステムから離れたソース位置からのオーディオ信号を前記オーディオシステムの前記スピーカにおいて受信するステップと、
    前記処理回路が、前記オーディオ信号の振幅と閾値振幅との比較処理を実行して比較結果を生成するステップと、
    前記オーディオ信号の振幅が前記閾値振幅よりも小さいことを示す比較結果に応答して、
    前記処理回路が、前記オーディオシステムの前記マイクロフォンへの入力信号に対して第1のフィルタリング処理を実行して、第1のフィルタリングされた入力信号を生成するステップと、
    前記処理回路が、前記第1のフィルタリングされた入力信号を前記ソース位置まで送信するステップと、
    前記オーディオ信号の振幅が前記閾値振幅よりも大きいことを示す比較結果に応答して、
    前記処理回路が、前記オーディオシステムの前記マイクロフォンへの入力信号に対して第2のフィルタリング処理を実行して、前記第1のフィルタリングされた入力信号とは異なる第2のフィルタリングされた入力信号を生成するステップと、
    前記処理回路が、前記第2のフィルタリングされた入力信号を前記ソース位置まで送信するステップと
    を含み、前記第1のフィルタリング処理の実行は、
    指定の時間ウィンドウに亘って前記オーディオ信号をサンプリングして、ウィンドウ化されたオーディオ信号を生成することと、
    前記マイクロフォンに入力される前記入力信号に基づいて第1のインパルス応答関数を生成することと、
    前記ウィンドウ化されたオーディオ信号と前記第1のインパルス応答関数との畳み込みをして、第1のフィルタリングされた入力信号を生成することと
    を含み、前記第1のインパルス応答関数は、複数の高調波の加重和であり、各高調波は基本周波数の倍数に等しい周波数を有する、方法。
  2. 前記マイクロフォンに入力される前記入力信号に基づく前記第1のインパルス応答関数の生成は、残差信号のパワーを最適化するインパルス応答関数を前記第1のインパルス応答関数として生成することを含み、前記残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号および汎用的なインパルス応答関数の畳み込みとの間の差に等しく、
    前記第1のフィルタリングされた入力信号の前記ソース位置への送信は、パワーが最適化された残差信号を前記第1のフィルタリングされた入力信号として送信することを含み、前記パワーが最適化された残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号および前記第1のインパルス応答関数の畳み込みとの間の差に等しい、請求項に記載の方法。
  3. 前記第1のフィルタリング処理の実行は、
    前記第1のインパルス応答関数の生成後の指定時間後に、別の第1のインパルス応答関数を生成することをさらに含む、請求項1または2に記載の方法。
  4. 前記ウィンドウ化されたオーディオ信号は、前記オーディオ信号の複数のサンプルを含み、前記複数のサンプルの各々は、前記指定の時間ウィンドウ内に生じる時間における前記オーディオ信号の値であり、
    前記オーディオ信号の振幅と前記閾値振幅との比較処理の実行は、
    前記オーディオ信号の複数のサンプルの各々の絶対値を生成して、複数の絶対値を生成することと、
    前記複数の絶対値のうち最大のものを前記オーディオ信号の振幅として生成することと
    を含む、請求項のいずれか一項に記載の方法。
  5. 前記第2のフィルタリング処理の実行は、
    ウィンドウ化されたオーディオ信号の非線形関数を生成することと、
    前記マイクロフォンに入力される前記入力信号に基づいて第2のインパルス応答関数を生成することと、
    (i)前記ウィンドウ化されたオーディオ信号の非線形関数と(ii)第のインパルス応答関数との畳み込みをして、第のフィルタリングされた入力信号を生成することと
    を含む、請求項1〜のいずれか一項に記載の方法。
  6. ウィンドウ化されたオーディオ信号の非線形関数の生成は、前記ウィンドウ化されたオーディオ信号の振幅を二乗することを含む、請求項に記載の方法。
  7. 前記マイクロフォンに入力される入力信号に基づく前記第2のインパルス応答関数の生成は、残差信号のパワーを最適化する汎用的なインパルス応答関数を前記第2のインパルス応答関数として生成することを含み、前記残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号の非線形関数および前記汎用的なインパルス応答関数の畳み込みとの間の差に等しく、
    前記第2のフィルタリングされた入力信号の前記ソース位置への送信は、パワーが最適化された残差信号を前記第2のフィルタリングされた入力信号として送信することを含み、前記パワーが最適化された残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号の非線形関数および前記第2のインパルス応答関数の畳み込みとの間の差に等しい、請求項またはに記載の方法。
  8. 前記第1のフィルタリング処理の実行は、
    ウィンドウ化されたオーディオ信号の第1の非線形関数を生成することと、ここで、前記第1の非線形関数は前記非線形関数とは異なり、
    前記マイクロフォンに入力される前記入力信号に基づいて第1のインパルス応答関数を生成することと、
    (i)前記ウィンドウ化されたオーディオ信号の第1の非線形関数と(ii)前記第1のインパルス応答関数との畳み込みをして、第1のフィルタリングされた入力信号を生成することと
    を含む、請求項に記載の方法。
  9. 前記第2のフィルタリング処理の実行は、
    第2のインパルス応答関数の生成後の指定時間後に、別の第3の応答関数を生成することをさらに含む、請求項のいずれか一項に記載の方法。
  10. 前記方法は、
    前記オーディオ信号の振幅が前記閾値振幅よりも大きくかつ第2の閾値振幅よりも大きいことを示す比較結果に応答して、
    前記処理回路が、前記オーディオシステムの前記マイクロフォンへの入力信号に対して第3のフィルタリング処理を実行して、第のフィルタリングされた入力信号を生成するステップであって、第3のフィルタリングされた入力信号は、前記第1のフィルタリングされた入力信号および前記第2のフィルタリングされた入力信号とは異なり、
    前記処理回路が、前記第3のフィルタリングされた入力信号を前記ソース位置まで送信するステップと
    をさらに含む、請求項1に記載の方法。
  11. 非一時的な記憶媒体を備えるコンピュータプログラム製品であって、前記コンピュータプログラム製品はコードを含み、前記コードは、スピーカおよびマイクロフォンを含むオーディオシステムにおける音響エコーを低減するように構成された処理回路により実行されたときに、
    前記オーディオシステムから離れたソース位置からのオーディオ信号を前記オーディオシステムの前記スピーカにおいて受信するステップと、
    前記オーディオ信号の振幅と閾値振幅との比較処理を実行して比較結果を生成するステップと、
    前記オーディオ信号の振幅が前記閾値振幅よりも小さいことを示す比較結果に応答して、
    前記オーディオシステムの前記マイクロフォンへの入力信号に対して第1のフィルタリング処理を実行して、第1のフィルタリングされた入力信号を生成するステップと、
    前記第1のフィルタリングされた入力信号を前記ソース位置まで送信するステップと、
    前記オーディオ信号の振幅が前記閾値振幅よりも大きいことを示す比較結果に応答して、
    前記オーディオシステムの前記マイクロフォンへの入力信号に対して第2のフィルタリング処理を実行して、前記第1のフィルタリングされた入力信号とは異なる第2のフィルタリングされた入力信号を生成するステップと、
    前記第2のフィルタリングされた入力信号を前記ソース位置まで送信するステップと
    を含む方法を前記処理回路に実行させ
    前記第1のフィルタリング処理の実行は、
    指定の時間ウィンドウに亘って前記オーディオ信号をサンプリングして、ウィンドウ化されたオーディオ信号を生成することと、
    前記マイクロフォンに入力される前記入力信号に基づいて第1のインパルス応答関数を生成することと、
    前記ウィンドウ化されたオーディオ信号と前記第1のインパルス応答関数との畳み込みをして、第1のフィルタリングされた入力信号を生成することと
    を含み、前記第1のインパルス応答関数は、複数の高調波の加重和であり、各高調波は基本周波数の倍数に等しい周波数を有する、コンピュータプログラム製品。
  12. 前記マイクロフォンに入力される前記入力信号に基づく前記第1のインパルス応答関数の生成は、残差信号のパワーを最適化するインパルス応答関数を前記第1のインパルス応答関数として生成することを含み、前記残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号および汎用的なインパルス応答関数の畳み込みとの間の差に等しく、
    前記第1のフィルタリングされた入力信号の前記ソース位置への送信は、パワーが最適化された残差信号を前記第1のフィルタリングされた入力信号として送信することを含み、前記パワーが最適化された残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号および前記第1のインパルス応答関数の畳み込みとの間の差に等しい、請求項11に記載のコンピュータプログラム製品。
  13. 前記ウィンドウ化されたオーディオ信号は、前記オーディオ信号の複数のサンプルを含み、前記複数のサンプルの各々は、前記指定の時間ウィンドウ内に生じる時間における前記オーディオ信号の値であり、
    前記オーディオ信号の振幅と前記閾値振幅との比較処理の実行は、
    前記オーディオ信号の複数のサンプルの各々の絶対値を生成して、複数の絶対値を生成することと、
    前記複数の絶対値のうち最大のものを前記オーディオ信号の振幅として生成することと
    を含む、請求項11または12に記載のコンピュータプログラム製品。
  14. 前記第2のフィルタリング処理の実行は、
    ウィンドウ化されたオーディオ信号の非線形関数を生成することと、
    前記マイクロフォンに入力される前記入力信号に基づいて第2のインパルス応答関数を生成することと、
    (i)前記ウィンドウ化されたオーディオ信号の非線形関数と(ii)第のインパルス応答関数との畳み込みをして、第のフィルタリングされた入力信号を生成することと
    を含む、請求項1113のいずれか一項に記載のコンピュータプログラム製品。
  15. 前記マイクロフォンに入力される入力信号に基づく前記第2のインパルス応答関数の生成は、残差信号のパワーを最適化する汎用的なインパルス応答関数を前記第2のインパルス応答関数として生成することを含み、前記残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号の非線形関数および前記汎用的なインパルス応答関数の畳み込みとの間の差に等しく、
    前記第2のフィルタリングされた入力信号の前記ソース位置への送信は、パワーが最適化された残差信号を前記第2のフィルタリングされた入力信号として送信することを含み、前記パワーが最適化された残差信号は、前記マイクロフォンに入力される前記入力信号と前記ウィンドウ化されたオーディオ信号の非線形関数および前記第2のインパルス応答関数の畳み込みとの間の差に等しい、請求項14に記載のコンピュータプログラム製品。
  16. 前記第2のフィルタリング処理の実行は、
    前記第2のインパルス応答関数の生成後の指定時間後に、別の第3のインパルス応答関数を生成することをさらに含む、請求項14または15に記載のコンピュータプログラム製品。
  17. スピーカおよびマイクロフォンを含むオーディオシステムにおける音響エコーを低減するように構成された電子装置であって、前記電子装置は、
    メモリと、
    前記メモリに接続された制御回路と
    を備え、前記制御回路は、
    前記オーディオシステムから離れたソース位置からのオーディオ信号を前記オーディオシステムの前記スピーカにおいて受信し、
    前記オーディオ信号の振幅と閾値振幅との比較処理を実行して比較結果を生成し、
    前記オーディオ信号の振幅が前記閾値振幅よりも小さいことを示す比較結果に応答して、
    前記オーディオシステムの前記マイクロフォンへの入力信号に対して第1のフィルタリング処理を実行して、第1のフィルタリングされた入力信号を生成し、かつ、
    前記第1のフィルタリングされた入力信号を前記ソース位置まで送信し、
    前記オーディオ信号の振幅が前記閾値振幅よりも大きいことを示す比較結果に応答して、
    前記オーディオシステムの前記マイクロフォンへの入力信号に対して第2のフィルタリング処理を実行して、前記第1のフィルタリングされた入力信号とは異なる第2のフィルタリングされた入力信号を生成し、かつ、
    前記第2のフィルタリングされた入力信号を前記ソース位置まで送信する
    ように構成されており、
    前記第1のフィルタリング処理の実行は、
    指定の時間ウィンドウに亘って前記オーディオ信号をサンプリングして、ウィンドウ化されたオーディオ信号を生成することと、
    前記マイクロフォンに入力される前記入力信号に基づいて第1のインパルス応答関数を生成することと、
    前記ウィンドウ化されたオーディオ信号と前記第1のインパルス応答関数との畳み込みをして、第1のフィルタリングされた入力信号を生成することと
    を含み、前記第1のインパルス応答関数は、複数の高調波の加重和であり、各高調波は基本周波数の倍数に等しい周波数を有する、電子装置。
JP2018548021A 2016-06-30 2017-06-30 モバイルデバイスにおける非線形エコーキャンセルのための二方式振幅処理フレームワーク Active JP6670014B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662356766P 2016-06-30 2016-06-30
US62/356,766 2016-06-30
PCT/US2017/040313 WO2018005979A1 (en) 2016-06-30 2017-06-30 Bi-magnitude processing framework for nonlinear echo cancellation in mobile devices

Publications (2)

Publication Number Publication Date
JP2019512947A JP2019512947A (ja) 2019-05-16
JP6670014B2 true JP6670014B2 (ja) 2020-03-18

Family

ID=59325691

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018548021A Active JP6670014B2 (ja) 2016-06-30 2017-06-30 モバイルデバイスにおける非線形エコーキャンセルのための二方式振幅処理フレームワーク

Country Status (6)

Country Link
US (1) US10045137B2 (ja)
EP (1) EP3414889B1 (ja)
JP (1) JP6670014B2 (ja)
KR (1) KR102146816B1 (ja)
CN (1) CN108702424B (ja)
WO (1) WO2018005979A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7187183B2 (ja) * 2018-06-14 2022-12-12 株式会社トランストロン エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム
CN113556652B (zh) * 2020-04-24 2022-08-09 阿里巴巴集团控股有限公司 语音处理方法、装置、设备及系统
US11501791B1 (en) * 2021-11-22 2022-11-15 Hopin Ltd Loopback audio channels for echo cancellation in web browsers

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3457896B2 (ja) * 1998-10-30 2003-10-20 沖電気工業株式会社 反響消去装置
JP2006128758A (ja) * 2004-10-26 2006-05-18 Matsushita Electric Ind Co Ltd 適応フィルタおよびそれを用いた音響エコーキャンセラ装置並びにハンズフリー電話、および適応フィルタ方法およびそれを用いた音響エコーキャンセラ方法
CN1780167A (zh) * 2004-11-24 2006-05-31 北京三星通信技术研究有限公司 快速收敛的回波消除装置
EP1827002A1 (en) * 2006-02-22 2007-08-29 Alcatel Lucent Method of controlling an adaptation of a filter
KR101469739B1 (ko) * 2007-06-21 2014-12-05 코닌클리케 필립스 엔.브이. 오디오 신호들을 처리하는 디바이스 및 방법
US7809129B2 (en) 2007-08-31 2010-10-05 Motorola, Inc. Acoustic echo cancellation based on noise environment
US8433061B2 (en) * 2007-12-10 2013-04-30 Microsoft Corporation Reducing echo
CN102118530B (zh) * 2010-01-06 2013-08-14 杭州华三通信技术有限公司 一种回声消除的方法和装置
US8204210B2 (en) * 2010-02-09 2012-06-19 Nxp B.V. Method and system for nonlinear acoustic echo cancellation in hands-free telecommunication devices
JP5406966B2 (ja) * 2012-08-15 2014-02-05 日本電信電話株式会社 反響消去装置、反響消去方法、反響消去プログラム
US9143862B2 (en) * 2012-12-17 2015-09-22 Microsoft Corporation Correlation based filter adaptation
CN203104592U (zh) * 2012-12-20 2013-07-31 歌尔声学股份有限公司 一种用于小型免提语音通讯系统中的回声消除装置
GB2510331A (en) * 2012-12-21 2014-08-06 Microsoft Corp Echo suppression in an audio signal
KR102112018B1 (ko) * 2013-11-08 2020-05-18 한국전자통신연구원 영상 회의 시스템에서의 음향 반향 제거 장치 및 방법
JP6243536B2 (ja) * 2013-12-12 2017-12-06 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. エコー打ち消し
GB2515592B (en) * 2013-12-23 2016-11-30 Imagination Tech Ltd Echo path change detector
KR20150079237A (ko) * 2013-12-31 2015-07-08 한국전자통신연구원 음향 반향 제거 장치 및 방법
US9336767B1 (en) * 2014-03-28 2016-05-10 Amazon Technologies, Inc. Detecting device proximities
GB2519392B (en) * 2014-04-02 2016-02-24 Imagination Tech Ltd Auto-tuning of an acoustic echo canceller
GB2525051B (en) * 2014-09-30 2016-04-13 Imagination Tech Ltd Detection of acoustic echo cancellation
US20160127827A1 (en) * 2014-10-29 2016-05-05 GM Global Technology Operations LLC Systems and methods for selecting audio filtering schemes
CN104980337B (zh) * 2015-05-12 2019-11-22 腾讯科技(深圳)有限公司 一种音频处理的性能提升方法及装置
US10123141B2 (en) * 2015-11-13 2018-11-06 Bose Corporation Double-talk detection for acoustic echo cancellation
CN105391879B (zh) * 2015-12-09 2018-06-12 天津大学 一种无回声残留双端通话鲁棒的声学回声消除方法
US10225395B2 (en) * 2015-12-09 2019-03-05 Whatsapp Inc. Techniques to dynamically engage echo cancellation

Also Published As

Publication number Publication date
KR102146816B1 (ko) 2020-08-21
CN108702424A (zh) 2018-10-23
EP3414889A1 (en) 2018-12-19
EP3414889B1 (en) 2019-12-04
US20180007482A1 (en) 2018-01-04
US10045137B2 (en) 2018-08-07
CN108702424B (zh) 2021-04-20
WO2018005979A1 (en) 2018-01-04
KR20180113586A (ko) 2018-10-16
JP2019512947A (ja) 2019-05-16

Similar Documents

Publication Publication Date Title
US20150039751A1 (en) Dynamic parallel coordinates visualization of network flows
US10861479B2 (en) Echo cancellation for keyword spotting
JP6670014B2 (ja) モバイルデバイスにおける非線形エコーキャンセルのための二方式振幅処理フレームワーク
WO2018132235A1 (en) Decoupled binaural rendering
WO2016146301A1 (en) Correlation-based two microphone algorithm for noise reduction in reverberation
JP6706633B2 (ja) 通話音質改善のためのシステムおよび方法
CN106165015B (zh) 用于促进基于加水印的回声管理的装置和方法
WO2021074736A1 (en) Providing adversarial protection of speech in audio signals
US9154985B2 (en) Mechanism for facilitating dynamic and segment-based monitoring of cellular network performance in an on-demand services environment
US8868713B2 (en) Method and apparatus providing a user interface for a request-oriented service architecture
KR102258710B1 (ko) 제스처로 활성화되는 원격 제어기
US20150249884A1 (en) Post-processed reference path for acoustic echo cancellation
KR20230084236A (ko) 음향 에코 제거 및 잔류 에코 억제를 위한 통합 심층 신경망 모델
US20240257823A1 (en) Systems and methods for remote real-time audio monitoring
US20240107273A1 (en) Systems and methods for wireless delivery of real-time reactionary device data
US20230350635A1 (en) Systems and methods for measurement of multicomponent round-trip audio latency
WO2024163219A1 (en) Systems and methods for remote real-time audio monitoring
CN111145776B (zh) 音频处理方法和装置
WO2024215897A1 (en) Systems and methods for live event audience group communication
CN115440257A (zh) 车辆音频的处理方法及装置、车辆、电子设备和存储介质
CN109671444A (zh) 一种语音处理方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180928

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180928

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200121

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20200121

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20200122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200219

R150 Certificate of patent or registration of utility model

Ref document number: 6670014

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250