JP2013527493A - 複数のマイクによるロバストな雑音抑制 - Google Patents

複数のマイクによるロバストな雑音抑制 Download PDF

Info

Publication number
JP2013527493A
JP2013527493A JP2013508256A JP2013508256A JP2013527493A JP 2013527493 A JP2013527493 A JP 2013527493A JP 2013508256 A JP2013508256 A JP 2013508256A JP 2013508256 A JP2013508256 A JP 2013508256A JP 2013527493 A JP2013527493 A JP 2013527493A
Authority
JP
Japan
Prior art keywords
signal
noise
module
subband
acoustic signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013508256A
Other languages
English (en)
Other versions
JP2013527493A5 (ja
Inventor
エヴリ,マーク
アヴェンダノ,カーロス
ソルバッハ,ラッジャー
ジャン,イー
ムルジア,カルロ
Original Assignee
オーディエンス,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オーディエンス,インコーポレイテッド filed Critical オーディエンス,インコーポレイテッド
Publication of JP2013527493A publication Critical patent/JP2013527493A/ja
Publication of JP2013527493A5 publication Critical patent/JP2013527493A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/002Damping circuit arrangements for transducers, e.g. motional feedback circuits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

【解決手段】ロバストな雑音抑制システムは、音響信号の雑音成分とエコー成分を同時に低減することが可能であり、同時に音声歪みのレベルを制限する、当該システムは、接話型、手持ち型又は他の構成の、二以上のマイクからの音響信号を受信することができる。受信した音響信号は、蝸牛(cochlea)領域のサブバンド信号へと変換され、エコー成分と雑音成分が、そのサブバンド信号から取り去れられる。音響サブバンド信号の特徴が特定され、乗算マスクを生成するために用いられる。乗算マスクは、雑音が取り去られたサブバンド信号に適用され、サブバンド信号は、時間領域にて再構成される。

Description

本発明は、音声処理に関し、特に、音声信号の雑音抑制処理に関する。
現在、都合の悪い音声環境において、背景雑音を低減するための、数多くの方法が存在する。定常雑音抑制システムは、固定あるいは変動するdBにより、定常雑音を抑制する。固定の抑制システムは、固定値のdBにより、定常雑音又は非定常雑音を抑制する。定常雑音抑制器の欠点は、非定常雑音を抑制しないことである。一方で、固定の抑制システムの弱点は、低いSNRにおける音声歪みを避けるため、控えめなレベルにより、雑音を抑制しなければならないことである。
雑音抑制の別の方式は、動的雑音抑制である。一般的な種類の動的雑音抑制システムは、信号対雑音比(SNR)に基づく。SNRは、抑制値(suppression value)を決定するために用いられ得る。不幸なことに、SNRそのものは、音声環境における異なる種類の雑音の存在に起因する音声歪みについての、良い判断材料ではない。一般的に、既定の時間における音声エネルギーは、発話、無音、発話、無音等を含む。さらに、その音声環境において、定常雑音と動的雑音とが、生じ得る。SNRは、定常及び非定常の音声成分及び雑音成分を全て平均化する。雑音信号の特性についてのSNRの決定においては、単に、雑音の全体的なレベルが考慮されるに過ぎない。
先行技術の弱点を克服するために、音声信号を処理するための、改良された雑音抑制システムが必要とされている。
本技術は、音響信号の雑音成分とエコー成分を同時に低減することが可能であり、同時に音声歪みのレベルを制限する、ロバストな雑音抑制システムを提供する。当該システムは、接話型、手持ち型又は他の構成の、二以上のマイクからの音響信号を受信することができる。受信した音響信号は、蝸牛(cochlea)領域のサブバンド信号へと変換され、エコー成分と雑音成分が、そのサブバンド信号から取り去られる(subtracted)。音響サブバンド信号の特徴(量)(features)が特定され、乗算(multiplicative)マスクを生成するために用いられる。乗算マスクは、雑音が取り去られたサブバンド信号に適用され、サブバンド信号は、時間領域にて再構成される。
一実施形態におけるシステムは、音声信号における雑音低減を実行するシステムであって、メモリを含み得る。前記メモリに保管され、プロセッサにより実行される周波数分析モジュールは、時間領域の音響信号から、蝸牛領域のサブバンド信号を生成することができる。前記メモリに保管され、プロセッサにより実行される雑音消去モジュールは、前記サブバンド信号の少なくとも一部を消去することができる。前記メモリに保管され、プロセッサにより実行される調整モジュールは、変更された前記サブバンド信号の雑音成分又はエコー成分を抑制することができる。前記メモリに保管され、プロセッサにより実行される再構成モジュールは、前記調整モジュールにより提供される、前記成分が抑制された前記サブバンド信号から、変更された時間領域信号を再構成することができる。
雑音低減は、プロセッサ及びメモリを備えるコンピュータにより実行される処理として、さらに実行され得る。また、プログラムが具体化される、コンピュータ読取可能な記憶媒体が、実装され得る。該プログラムは、プロセッサにより実行可能であり、音声信号の雑音を低減する方法を実行する。
本技術において用いられる実施形態の環境を例示する図。 例示的なオーディオ装置のブロック図。 例示的な音声処理システムのブロック図。 音響信号の雑音低減を実行する例示的な方法のフローチャート。 音響信号から特徴を抽出する例示的な方法のフローチャート。
本技術は、音響信号の雑音成分とエコー成分を同時に低減することが可能であり、同時に音声歪みのレベルを制限する、ロバストな雑音抑制システムを提供する。当該システムは、接話型、手持ち型又は他の構成の、二以上のマイクからの音響信号を受信することができる。受信した音響信号は、蝸牛(cochlea)領域のサブバンド信号へと変換され、エコー成分と雑音成分が、そのサブバンド信号から取り去られる。音響サブバンド信号の特徴が特定され、乗算(multiplicative)マスクを生成するために用いられる。乗算マスクは、雑音が取り去られたサブバンド信号に適用され、サブバンド信号は、時間領域にて再構成される。本技術は、動的雑音抑制システムと非定常雑音抑制システムの双方を実現し、雑音の特性とユースケースに基づいて、「知覚的に最適な」雑音抑制量を提供する。
雑音消去と雑音抑制の組み合わせによる雑音(及びエコー)低減を実行により、オーディオ装置の柔軟な設計が可能となる。特に、減算(subtractive)と乗算(multiplicative)の段階の組み合わせは、有利である。なぜなら、オーディオ装置のマイクの配置とユースケース(例えば、接話/非接話(far-talk))を柔軟にし、同時に、音声品質と雑音抑制の全体的なトレードオフを最適化するためである。マイクは、「近接したマイク構成」に対して、それぞれ、4センチメートル以内に配置されてもよい。あるいは、「広げられたマイク構成」に対して、4センチメートルより広く配置されてもよい。また、二つより多いマイクを用いる構成の組み合わせであってもよい。
図1は、本技術の実施形態が用いられ得る環境の例を表す図である。ユーザは、オーディオ装置104への音源102として、振舞う。例示的なオーディオ装置104は、二つのマイク:音源102に対する主たる(primary)マイク106と、主たるマイク106から離れて配置される補助的な(secondary)マイク108を含む。代わりに、オーディオ装置104は、単一のマイクを含んでもよい。さらなる他の実施形態において、オーディオ装置104は、二以上のマイク、例えば、3、4、5、6、7、8、9、10又はそれより多くのマイクを含んでもよい。
主たるマイク106及び補助的なマイク108は、全方位マイクであってもよい。代わりの実施形態は、指向性マイクのような、他の方式のマイク又は音響センサを利用してもよい。
マイク106、108は、音源102からの音(すなわち、音響信号)を受信するが、マイク106、108は、さらに、雑音112を拾う。図1において、雑音110は、単一の場所から到来するように示されているが、音源102の位置と異なる、一以上の場所からの、あらゆる音を含み得る。さらに、雑音110は、反射とエコーを含み得る。雑音110は、定常雑音、非定常雑音及び/又はそれらの組み合わせであり得る。
いくつかの実施形態は、二つのマイク106、108によって受信される音響信号の間のレベルの差(例えば、エネルギーの差)を利用することができる。接話によるユースケースにおいて、主たるマイク106は、補助的なマイク108よりも音源102に非常に近いため、主たるマイク106の強度レベルは、より高くなり、例えば、音声区間(speech/voice segment)に主たるマイク106によって受信される、より大きなエネルギーレベルをもたらす。
レベルの差は、時間周波数領域において、音声と雑音を区別するために用いられ得る。さらなる実施形態は、音声を区別するために、エネルギーレベルの差と、時間遅延との組み合わせを用いることができる。両耳キュー符号化に基づいて、音声信号抽出又は音声強調が、実施され得る。
図2は、例示的なオーディオ装置104のブロック図である。図示される実施形態において、オーディオ装置104は、受信器200と、プロセッサ202と、主たるマイク106と、任意の補助的なマイク108と、音声処理システム210と、出力デバイス206を含む。オーディオ装置104は、動作に必要な、さらなる、あるいは他の部品を含んでもよい。同様に、オーディオ装置104は、図2に示される部品と同様又は同等の機能を実行する、より少ない部品を含んでもよい。
プロセッサ202は、オーディオ装置104のメモリ(図2において図示されない)に保管された命令及びモジュールを実行し、本明細書で説明される、音響信号に対する雑音低減を含む機能を実行する。プロセッサ202は、演算装置として具体化される、ハードウェア及びソフトウェアを含み得る。演算装置は、プロセッサ202の、浮動小数点演算や、他の演算を行うことができる。
例示的な受信器200は、通信ネットワークから信号を受信するよう構成された音響センサである。いくつかの実施形態において、受信器200は、アンテナデバイスを含んでもよい。その信号は、音声処理システム210へと転送され、本明細書で説明される技術を用いて、雑音を低減し、音声信号を、出力デバイス206へと提供する。本技術は、オーディオ装置104の送信経路及び受信経路の一方又は両方において、使用され得る。
音声処理システム210は、主たるマイク160と補助的なマイク108を用いて、音源から音響信号を受信し、その音響信号を処理するよう構成される。処理は、音響信号において雑音低減を実行する段階を含み得る。音声処理システム210は、以下で、より詳細に説明される。主たるマイク106と補助的なマイク108は、それらの間で、エネルギーレベルの差、時間の差、又は位相の差の検出を可能にするために、一定の距離、離れて配置され得る。主たるマイク106と補助的なマイク108により受信される音響信号は、電気信号(すなわち、主たる電気信号及び補助的な電気信号)へと変換され得る。電気信号そのものは、アナログデジタル変換器(図示しない)により、デジタル信号へと変換され、いくつかの実施形態に従って処理される。明確化を目的として、音響信号を区別するために、本明細書では、主たるマイク106により受信された音響信号は、主たる音響信号と呼び、補助的なマイク108で受信された音響信号は、補助的な音響信号と呼ぶ。主たる音響信号及び補助的な音響信号は、音声処理システム210によって処理され、信号対雑音比の改善した信号を生成する。本明細書で説明される技術についての実施形態は、主たるマイク106のみを利用して、実施され得ることに留意する。
出力デバイス206は、音声出力をユーザに提供する、あらゆるデバイスである。例えば、出力デバイス206は、スピーカ、ヘッドセット若しくはハンドセットのイヤホン又は会議装置のスピーカを含み得る。
様々な実施形態において、主たるマイク及び補助的なマイクが、近接して配置される(例えば、1−2cm)全方位マイクである場合には、前方対向(forwards-facing)及び後方対向(backwards- facing)な方向性マイクをシミュレートするために、ビームフォーミング技術が用いられ得る。レベルの差は、時間周波数領域での音声と雑音を区別するために用いられ、雑音低減において利用され得る。
図3は、本明細書で説明される雑音低減方法を実行するための、例示的な音声処理システム210のブロック図である。例示的な実施形態において、音声処理システム210は、オーディオ装置104の中のメモリの中に具体化される。音声処理システム210は、周波数分析モジュール302、特徴抽出モジュール304、音源推定エンジンモジュール306、マスク生成モジュール308、雑音消去(NPNS)モジュール310、調整モジュール312及び再構成モジュール314を含むことができる。音声処理システム210は、図3に示されるより、より多くの部品、あるいはより少ない部品を含み得る。また、複数のモジュールの機能は、より少ないモジュールか、又は追加のモジュールへ、組み合わされるか、または拡張され得る。例示的な通信ラインが、図3及び本明細書の他の図面において、様々なモジュールとの間に示されている。通信ラインは、どのモジュールが通信により他のモジュールと接続されているかを限定することを意図するものではない。また、モジュール間で通信される信号の数や種類を限定することを意図するものではない。
動作において、主たるマイク106及び補助的なマイク108から受信した音響信号は、電気信号へと変換され、その電気信号は、周波数分析モジュール302を通じて処理される。音響信号は、周波数分析モジュール302により処理される前に、時間領域において、前処理され得る。時間領域の前処理は、入力リミッタゲインの適用と、音声時間の伸張(stretching)と、FIR又はIIRフィルタを用いたフィルタリングを含み得る。
周波数分析モジュール302は、音響信号を取得し、フィルタバンクによりシミュレーションされる、蝸牛の周波数分析(例えば、蝸牛領域(cochlear domain))を模倣する。周波数分析モジュール302は、主たる音響信号と補助的な音響信号のそれぞれを、二つ以上の周波数サブバンド信号へと、分離する。サブバンド信号は、入力信号に関するフィルタリング処理の結果である。ここで、フィルタの帯域幅は、周波数分析モジュール302により受信される信号の帯域幅よりも狭い。そのフィルタバンクは、一連の、直列で、複素数の、一次IIRフィルタにより、実装され得る。代わりに、短時間フーリエ変換(STFT)のような他のフィルタ、サブバンドフィルタバンク、変調複素重ね(lapped)変換、蝸牛モデル、ウェーブレット等を、周波数分析及び合成のために、用いることができる。周波数サブバンド信号のサンプルは、連続して、時間フレーム(例えば、既定の期間にわたって)へと区分され得る。例えば、フレームの長さは、4ms、8ms又は他の時間長であってもよい。いくつかの実施形態において、全くフレームが存在しなくてもよい。その結果は、高速蝸牛変換(FCT;fast cochlea transform)領域において、サブバンド信号を含み得る。
サブバンドのフレーム信号は、周波数分析モジュール302から、分析パスサブシステム320と、信号パスサブシステム330へと提供される。分析パスサブシステム320は、その信号を処理し、信号の特徴を識別し、サブバンド信号の音声成分と雑音成分とを区別し、信号調整器(modifier)を生成する。信号パスサブシステム330は、サブバンド信号の雑音を低減することにより、主たる音響信号のサブバンド信号を調整する責任を有する。雑音低減は、分析パスサブシステム320において生成される、乗法ゲインマスクか、あるいは、サブバンド信号から成分を減算するような、調整器を適用する段階を含むことができる。雑音低減は、サブバンド信号の雑音を低減し、望ましい音声成分を保存することができる。
信号パスサブシステム330は、雑音消去モジュール310及び調整モジュール312を含む。雑音消去モジュール310は、周波数分析モジュール302から、サブバンドのフレーム信号を受信する。雑音消去モジュール310は、主たる音響信号の、一以上のサブバンド信号から、雑音成分を取り去る(すなわち、消去する)ことができる。または、雑音消去モジュール310は、主たる信号の中の雑音成分のサブバンド推定と、雑音除去済みのサブバンド信号の形式による音声成分のサブバンド推定を、出力する。
雑音消去モジュール310は、例えば、二つのマイク構成を有するシステムにおいて、減算(subtractive)アルゴリズムによる音源決定に基づき、雑音消去を提供することができる。雑音消去モジュール310は、さらに、エコー消去を提供することができ、スピーカとRxパスの線形性に対して、本質的にロバストである。ほとんど音声品質の劣化がないか、あるいはまったくない雑音消去及びエコー消去(例えば、主たる信号のサブバンドから成分を取り去る)を適用することにより、雑音消去モジュール310は、周波数分析モジュール302から受信され、調整モジュール312と事後的なフィルタリングモジュールへ提供されるサブバンド信号の信号対雑音比(SNR)を増加させることができる。実行される雑音消去の量は、雑音源の拡散と、マイク間の距離に依存し得る。これらは、共に、マイク間の雑音のコヒーレンス(coherence)に寄与し、より大きなコヒーレンスは、よりよい消去をもたらす。
雑音消去モジュール310は、様々な方法で、実装され得る。いくつかの実施形態において、雑音消去モジュール310は、単一のNPNSモジュールによって、実装され得る。代わりに、雑音消去モジュール310は、例えば、直接接続によって配置され得る、二以上のNPNSモジュールを含み得る。
いくつかの実施形態において、雑音消去器モジュール310により実行される、雑音消去の例は、
米国特許出願第12/215,980号(タイトル「System and Method for Providing Noise Suppression Utilizing Null Processing Noise Subtraction」、2008年6月30日出願)、
米国特許出願第12/422,917号(タイトル「Adaptive Noise Cancellation」、2009年4月13日出願)、
米国特許出願第12/693,998号(タイトル「Adaptive Noise Reduction Using Level Cues」、2010年1月26日出願)、
において開示される。ここで、これらの内容を、本明細書に援用する。
分析パスサブシステム320の特徴抽出モジュール304は、周波数分析モジュール302及びNPNSモジュール310の出力により提供される、主たる音響信号及び補助的な音響信号に由来する、サブバンドのフレーム信号を受信する。特徴抽出モジュール304は、サブバンド信号のフレームのエネルギー推定と、主たる音響信号と補助的な音響信号との間のマイク間レベル差(ILD)、マイク間時間差(ITD)及びマイク間位相差(IPD)と、主たるマイクと補助的なマイクの自己雑音推定とを計算する。同様に、マイク信号間のピッチの推定や、相互相関のような、他のモジュールによって利用され得る、他のモノラル又はステレオの特徴が、計算され得る。特徴抽出モジュール304は、NPNSモジュール310への入力を提供し、NPNSモジュール310からの出力を処理する。
特徴抽出モジュール304は、ゼロ化処理(null-processing)のマイク間レベル差(NP−ILD)を生成することができる。NP−ILDは、未処理のILDを用いる本システムにおいて、代わりに用いられてもよい。主たるマイクと補助的なマイクの間の、未処理のILDは、特徴抽出モジュール304内のILDモジュールにより、決定され得る。一実施形態におけるILDモジュールによって計算されるILDは、数学的に、以下のように表すことができる。
Figure 2013527493
ここで、E1とE2は、それぞれ、主たるマイク106と補助的なマイク108のエネルギー出力であり、重複しない時間間隔(「フレーム」)にわたって、各サブバンド信号において計算される。かかる数式は、要素cにより正規化され、[-1,+1]の範囲に制限された、dBのILDを表す。従って、音源102が、E1の、主たるマイク106に近くにあり、雑音がない場合には、ILD=1となり、雑音が追加されると、ILDが減少する。
いくつかの場合において、マイク間の距離が、主たるマイクと口との間の距離に関して小さい場合に、未処理のILDは、他の音源(distracter)から正しい音源を区別するために、有益でない場合がある。なぜなら、それらの音源が、およそ等しい値の未処理のILDを有し得るためである。他の音源から正しい音源を区別するために用いられる、未処理のILDに関する制限を避けるために、雑音消去モジュール330の出力は、音声信号に対して正の値を有し、雑音成分に対して小さいか負の値を有するILDを求めるために、用いられ得る。なぜなら、これらは、雑音消去モジュール310の出力において、著しく減衰するためである。雑音消去モジュールILD330から求められるILDは、ゼロ化処理のマイク間レベル差(NP−ILD)から求められ、数学的に、以下のように表される。
Figure 2013527493
ここで、ENPは、NPNSの出力エネルギーである。NP−ILDの使用により、オーディオ装置内のマイクの柔軟な配置が可能となる。例えば、NP−ILDにより、マイクが、2−15cmの距離を隔てて、前後に構成されるよう配置され、かつ、全体的な抑制レベルの性能の変動を、数dBとすることが可能となる。
NPNSモジュールは、雑音消去済のサブバンド信号を、特徴抽出モジュール304のILDブロックに提供することができる。ILDは、NPNS出力信号エネルギーの、補助的なマイクエネルギーに対する割合として決定され得るため、しばしば、NP−ILDと交換可能である。「未処理のILD(Raw−ILD)」は、ILDが「未処理の」主たるマイク信号及び補助的なマイク信号から計算される場合に対する曖昧さを除去するために、用いられ得る。
エネルギーレベル推定とマイク間レベル差の決定は、詳しくは、米国特許出願第11/343,524号(タイトル「System and Method for Utilizing Inter-Microphone Level Differences for Speech Enhancement」)において説明されており、ここで、これらの内容を、本明細書に援用する。
音源推定エンジンモジュール306は、特徴抽出モジュール304によって提供される、フレームのエネルギー推定(量)を処理し、雑音推定を計算する。そして、サブバンド信号における雑音と音声のモデルを得る。音源推定エンジンモジュール306は、NPNSモジュール310の出力信号のエネルギースペクトルのような、音源の属性を、適応的に見積もる。エネルギースペクトル属性は、マイク生成モジュール308において、乗法マスクを生成するために用いられ得る。
音源推定エンジンモジュール306は、特徴抽出モジュール304からNP−ILDを受信し、NP−ILDの確率分布又は対象音源102、背景雑音及び任意でエコーの「クラスタ」を追跡する。
かかる情報は、他の聴覚のキュー(cue)とともに用いられ、音源及び雑音の分類の間の分類境界を定義する。音声、雑音及びエコーのNP−ILD分布は、環境条件、オーディオ装置104の移動、ユーザの手及び/又は顔の位置及びオーディオ装置104に対する他の物体の変動や、他の要因により、時間と共に変動し得る。クラスタ追跡器は、音声又は雑音源について時間で変化するNP−ILDを、適応させる。
一般性を失うことなく、エコーを無視し、音源と雑音のILD分布が重複しない場合に、SNRが十分に正であるときには、信号を音声として、あるいは、SNRが十分に負であるときには、信号を雑音として分類するように、二つの分布の間の分類境界又は優性(dominance)閾値を特定することが可能である。かかる分類は、優性マスクとして、サブバンド及び時間フレームごとに決定され、クラスタ追跡モジュールによって、音源推定エンジンモジュール306の雑音推定モジュールへと出力され得る。
クラスタ追跡器は、音響信号に由来する音響の特徴に(少なくとも部分的に)基づいて、音響特性の全体的な(global)要旨(summary)を決定する。全体的に実行する(running)推定は、更新され得る。そして、瞬間の局所的な(local)分類が、少なくとも一以上の音響特性に基づいて、求められる。次に、スペクトルエネルギー分類が、その瞬間の局所的な分類と、一以上の音響特性に(少なくとも部分的に)基づいて、決定され得る。
いくつかの実施形態において、クラスタ追跡モジュールは、かかる局所的なクラスタと観測に基づいて、エネルギースペクトルにおける複数の点を、音声又は雑音として、分類する。そのため、そのエネルギースペクトルの各点に対する、局所的な二値(binary)マスクが、音声か、あるいは雑音として、特定される。
クラスタ追跡モジュールは、サブバンドごとに、雑音/音声分類信号を生成し、その分類を、NPNSモジュール310に提供することができる。いくつかの実施形態において、その分類は、雑音と音声との間の差を示す制御信号である。雑音消去モジュール310は、その分類信号を利用し、受信したマイク信号の雑音を推定する。いくつかの実施形態において、クラスタ追跡モジュールの結果は、音源推定エンジンモジュール306内の雑音推定モジュールへと転送され得る。言い換えれば、現在の雑音推定が、音声処理システム210内で雑音信号を処理するために、エネルギースペクトルにおける雑音であると示される位置とともに、提供される。
クラスタ追跡モジュールによるクラスタの追跡の例は、米国特許出願第12/004,897号(タイトル「System and method for Adaptive Classification of Audio Sources」、2007年12月21日出願)に開示される。ここで、これらの内容を、本明細書に援用する。
音源推定エンジンモジュール306は、雑音N(t,w)を推定するために、クラスタ追跡モジュールからの雑音/音声分類制御信号と、雑音消去モジュール310からの出力を受信し得る、雑音推定モジュールを含むことができる。ここで、tは、時間における点であり、Wは、周波数又はサブバンドを表す。雑音推定モジュールにより決定される雑音推定は、マスク生成モジュール308へと提供される。いくつかの実施形態において、マスク生成モジュール308は、雑音消去モジュール310の雑音推定出力と、クラスタ追跡モジュールの出力を受信する。
音源推定エンジンモジュール306内の雑音推定モジュールは、NP−ILD雑音推定器及び定常雑音推定器を含んでもよい。雑音推定値は、例えば、max()演算を用いて、結合され得る。そうして、結合された雑音推定から得られる雑音抑制性能は、少なくとも個別の雑音推定値の雑音抑制性能となる。
NP−ILD雑音推定は、優性マスクと雑音消去モジュール310の出力信号エネルギーから求められ得る。あるサブバンドにおける優性マスクが1(音声を示す)である場合に、雑音推定は凍結され、あるサブバンドにおける優性マスクが0(雑音を示す)である場合に、雑音推定が、NPNS出力信号エネルギーと等しくなるように設定される。定常雑音推定は、一般的に音声が変動するよりもゆっくりと変動する、NPNS出力信号の成分を追跡する。そして、かかるモジュールへの主な入力は、NPNS出力エネルギーである。
マスク生成器モジュール308は、音源推定エンジンモジュール306により推定された、サブバンドの音声成分と雑音成分のモデルを受信し、乗算マスクを生成する。乗算マスクは、NPNS310により調整器312へと提供される、推定された、雑音除去済サブバンド信号へと適用される。調整器モジュール312は、そのゲインマスクを、NPNSモジュール310により出力された、雑音除去済の、主たる音響信号のサブバンド信号に、乗算する。そのマスクの適用により、主たる音響信号のサブバンド信号における雑音成分のエネルギーレベルが低減され、雑音低減がもたらされる。
乗算マスクは、ウィーナフィルタ及び音質最適化抑制システムによって定義される。ウィーナフィルタは、雑音のパワースペクトル密度と、主たる音響信号のパワースペクトル密度とに基づき得る。ウィーナフィルタは、雑音推定に基づくゲインを導く。導かれたゲインは、雑音のある信号を前提として、完全な(clean)音声信号の理論上のMMSEの推定を生成するために、用いられる。マスクを適用した結果としての、音声歪みの量を制限するために、ウィーナゲインは、知覚的に求められるゲイン下限(lower bound)を用いて、下端において制限され得る。
マスク生成モジュール308からのゲインマスク出力値は、時間と、サブバンド信号に依存し、サブバンドごとに、雑音低減を最適化する。雑音低減は、音声損失歪みが、許容される閾値制限に従うという制約を受け得る。閾値制限は、例えば、音声品質最適化抑制(VQOS;voice quality optimized suppression)レベルのような、多くの要因に基づき得る。VQOSレベルは,雑音低減により取り込まれる、サブバンド信号内の音声損失歪みの、推定される最大の閾値レベルである。VQOSは調整可能であり、サブバンド信号の特性を考慮し、システム及び音響設計者に、完全な設計の柔軟性を提供する。サブバンド信号において実行される雑音低減の量の下限は、VQOS閾値に従って決定されることにより、サブバンド信号の音声損失歪みの量を制限する。結果として、あるサブバンド信号において、可能であれば、大きな量の雑音低減がなされ得る。そして、大きな量の雑音低減に対する、大きな音声損失歪みが許容されないような場合には、雑音低減は、より小さくなり得る。
いくつかの実施形態において、サブバンド信号における雑音成分のエネルギーレベルは、少なくとも、残留雑音目標レベルまで低減され得る。残留雑音目標レベルは、固定されるか、ゆっくりと時間において変動し得る。いくつかの実施形態においては、残留雑音目標レベルは、各サブバンド信号に対して同一であり、他の実施形態においては、サブバンドにわたって変化してもよい。かかる目標レベルとは、雑音成分が知覚されなくなるレベルか、主たる音響信号を取得するために用いられるマイクの自己雑音レベルより低いレベルか、ベースバンドチップ上のある成分のノイズゲート若しくは雑音低減技術を実装するシステム内の内部ノイズゲートより低いレベルとして定義され得る。
調整モジュール312は、雑音消去モジュール310から、信号パスの蝸牛(cochlear)サンプルを受信し、その受信されたサンプルに、マスク生成器308から受信したゲインマスクを適用する。信号パスの蝸牛サンプルは、主たる音響信号の、雑音除去済のサブバンド信号を含み得る。ウィーナフィルタ推定により提供されたマスクは、フレームからフレームへと、すぐに変動し得る。また、雑音推定及び音声推定は、フレーム間で、変動し得る。その変動に対応するために、マスクの上方(upwards)及び下方(downwards)時間(temporal)スルーレート(slew rate)が、調節器312により、合理的な制限の中で、制約され得る。そのマスクは、フレームレートから、サンプリングレートまで、単純線形補間を用いて補間され、乗算の雑音抑制により、サブバンド信号に適用される。調節モジュール312は、マスク済の周波数サブバンド信号を出力することができる。
再構成モジュール314は、マスク済の周波数サブバンド信号を、蝸牛領域から、時間領域へと、変換することができる。その変換は、マスク済の周波数サブバンド信号と、位相シフト済の信号とを、加算する段階を含み得る。代わりに、当該変換は、マスク済の周波数サブバンド信号を、蝸牛チャンネルの逆周波数と乗算する段階を含んでもよい。時間領域への変換が完了すると、合成された音響信号は、出力装置206を介してユーザへ出力され、かつ/あるいはエンコーディングのためにコーデックへと提供される。
いくつかの実施形態において、合成された時間領域の音響信号についての、追加の事後処理が実行され得る。例えば、快適雑音生成器により生成される、快適雑音(comfort noise)が、ユーザに信号を提供する前に、合成された音響信号に追加され得る。快適雑音は、通常、聞き手にとって認識できない、一様な快適雑音(例えば、ピンク雑音)であり得る。かかる快適雑音は、合成された音響信号に加えられ、可聴性についての閾値を強制し、低レベルの非定常出力雑音成分をマスクする。いくつかの実施形態において、快適雑音レベルは、可聴性についての閾値よりちょうど上になるよう選択され、さらに、ユーザによって設定可能とされ得る。いくつかの実施形態において、マスク生成モジュール308は、雑音を、快適雑音のレベルか、又はそれより低いレベルに抑えるゲインマスクを生成するために、快適雑音のレベルへのアクセスを有する。
図3のシステムは、オーディオ装置によって受信される、複数の種類の信号を処理することができる。本システムは、一以上のマイクにより受信される音響信号に適用され得る。本システムは、デジタルのRx信号のような、アンテナ又は他の接続を通じて受信される信号を、さらに処理することができる。
図4及び図5は、本技術を実行する例示的な方法のフローチャートを含む。図4及び図5の各ステップは、任意の順番で実行され得る。また、図4及び図5の方法は、図示されるよりも、さらに追加のステップを含んでもよいし、より少ないステップで実行されてもよい。
図4は、音響信号の雑音低減を実行する例示的な方法のフローチャートである。ステップ405において、マイクの音響信号が受信される。マイク106、108により受信される音響信号は、音声及び雑音の少なくとも一部を、それぞれ含み得る。ステップ410において、音響信号についての前処理が実行され得る。前処理は、音響信号への、ゲイン、均等化及び他の信号処理を適用する段階を含んでもよい。
ステップ415において、蝸牛(cochlea)領域における、サブバンド信号が生成される。サブバンド信号は、複素フィルタの直列接続を用いて、時間領域の信号から、生成され得る。
ステップ420において、特徴抽出が実行される。特徴抽出は、サブバンド信号から、雑音成分を消去し、サブバンド信号が雑音又はエコーを有するかを推定し、マスクを生成するために用いられる、特徴を抽出することができる。特徴抽出の実行は、図5に関して、より詳細に説明される。
ステップ425において、雑音消去が実行される。雑音消去は、NPNSモジュール330により、周波数分析モジュール302から受信された、一以上のサブバンド信号について、実行され得る。雑音消去は、主たる音響信号のサブバンドから、雑音成分を取り去る段階を含み得る。いくつかの実施形態において、エコー成分は、主たる音響信号のサブバンドから消去され得る。雑音消去済(又はエコー消去済)信号は、雑音成分エネルギー推定を決定するために特徴抽出モジュール304に提供され、さらに、音源推定エンジン306に提供され得る。
ステップ430において、雑音推定(値)、エコー推定(値)及び音声推定(値)が、サブバンドに対して決定され得る。それぞれの推定は、音響信号の各サブバンドと、音響音声信号の各フレームに対して決定され得る。エコーは、音源推定エンジン306により受信されるRx信号の、少なくとも一部から、決定されてもよい。ある時間フレーム内のサブバンドが、雑音か、音声か、又はエコーであるかの決定に関する推定は、マスク生成モジュール308に提供される。
ステップ435において、マスクが生成される。マスクは、マスク生成器308により、生成され得る。マスクが生成され、特定のサブバンドが、雑音か、音声か、又はエコーであるかの決定に基づいて、各フレームの、各サブバンドに適用され得る。マスクは、音声品質最適化抑制、すなわち、音声歪みの特定のレベルに最適化されるよう決定された抑制レベルに基づいて、生成され得る。ステップ440において、マスクは、サブバンドに適用され得る。マスクは、調整器312によって、NPNS310により出力されたサブバンド信号へ適用され得る。マスクは、調整器312により、フレームレートから、サンプリングレートまで、補間され得る。
ステップ445において、サブバンド信号から、時間領域の信号が再構成される。時間バンド信号は、再構成モジュール314が、サブバンド信号に対する一連の遅延及び複素数乗算演算を適用することにより、再構成され得る。ステップ450において、再構成された時間領域の信号について、後処理が実行され得る。後処理は、後処理器によって実行され、再構成された信号に出力リミッタの適用、自動ゲイン制御の適用又は他の後処理を含んでもよい。ステップ455において、再構成された出力信号が、出力され得る。
図5は、音声信号から特徴を抽出する例示的な方法のフローチャートである。図5の方法は、図4の方法のステップ420の詳細を提供する。ステップ505において、サブバンド信号が受信される。特徴抽出モジュール304は、周波数分析モジュール302からサブバンド信号を受信し、雑音消去モジュール310から出力信号を受信することができる。ステップ510において、例えば、サブバンドエネルギーレベルのような、二次統計(値)が、決定される。エネルギーサブバンドレベルは、各フレームの、各サブバンドに対して、決定され得る。ステップ515において、マイク間の相互相関や、マイク信号の自己相関が、計算され得る。ステップ520において、マイク間レベル差(ILD)が、決定される。ステップ525において、ゼロ化処理(null processing)のマイク間レベル差(NP−ILD)が決定される。ILDとNP−ILDは、共に、サブバンド信号エネルギーと、雑音推定エネルギーの、少なくとも一部から、決定される。抽出された特徴は、サブバンド信号の雑音を低減する、音声処理システムによって、利用される。
図3、4に関して説明されたものを含む、上述したモジュールは、コンピュータ読取可能な媒体(例えば、コンピュータ読取可能な媒体)のような、記憶媒体に保管される命令として、含まれ得る。これらの命令は、プロセッサ202によって読み出され、実行され、上述した機能を実行することができる。いくつかの命令の例は、ソフトウェア、プログラムコード及びファームウェアを含む。記憶媒体の例は、メモリ装置及び集積回路を含む。
本発明は、上述した、好ましい実施形態及び実施例への参照によって開示されるが、かかる例は、例示的なものであり、限定する意図をもってなされたものではない点に留意する。修正及び組み合わせは、容易に当業者の頭に思い浮かぶであろうことが予期される。これらの修正及び組み合わせは、本発明の精神及び以下のクレームの範囲内にある。

Claims (19)

  1. 音声信号の雑音低減を実行するシステムであって:
    メモリと;
    前記メモリに保管され、プロセッサによって実行される周波数分析モジュールであって、時間領域の音響信号から、蝸牛領域のサブバンド信号を生成する、周波数分析モジュールと;
    前記メモリに保管され、プロセッサにより実行される雑音消去モジュールであって、前記サブバンド信号の少なくとも一部を消去する、雑音消去モジュールと;
    前記メモリに保管され、プロセッサにより実行される調整モジュールであって、変更された前記サブバンド信号の雑音成分又はエコー成分を抑制する、調整モジュールと;
    前記メモリに保管され、プロセッサにより実行される再構成モジュールであって、前記調整モジュールにより提供される、成分が抑制された前記サブバンド信号から、変更された時間領域の信号を再構成する、再構成モジュールと;
    を有する、システム。
  2. 前記時間領域の音響信号は、オーディオ装置の一以上のマイクの信号から受信される、
    請求項1に記載のシステム。
  3. 前記メモリに保管され、プロセッサにより実行される特徴抽出モジュールであって、前記サブバンド信号の特徴を決定し、前記特徴は、前記音響信号の一連のフレームのうちの各フレームに対して決定される、特徴抽出モジュール
    をさらに有する、請求項1に記載のシステム。
  4. 前記特徴抽出モジュールは、第一の音響信号と、第二の音響信号、第三の音響信号又は他の音響信号との間の、マイク間のレベル差又はマイク間の時間差若しくは位相差に基づいて、前記雑音消去モジュール又は前記調整モジュールの適応を制御するよう構成される、
    請求項3に記載のシステム。
  5. 前記雑音消去モジュールは、前記サブバンド信号から、雑音成分を取り去るか、又は、エコー成分を取り去ることにより、前記サブバンド信号の少なくとも一部分を消去する、
    請求項1に記載のシステム。
  6. 前記メモリに保管され、プロセッサにより実行される特徴抽出モジュールであって、前記サブバンド信号の特徴を決定し、前記特徴は、前記音響信号の一連のフレームのうちの各フレームに対して決定される、特徴抽出モジュール
    をさらに有し、
    前記特徴は、前記特徴抽出モジュールにおいて、前記雑音消去モジュールの出力と、ゼロ化処理のマイク間のレベル差のような、受信した入力信号とから算出される、
    請求項5に記載のシステム。
  7. 前記メモリに保管され、プロセッサにより実行されるマスク生成モジュールであって、マスクを生成し、前記マスクは、前記調整モジュールによって、前記雑音消去モジュールにより出力されたサブバンド信号へと適用されるよう構成される、マスク生成モジュール
    をさらに有する、請求項1に記載のシステム。
  8. 前記メモリに保管され、プロセッサにより実行される特徴抽出モジュールであって、前記サブバンド信号の特徴を決定し、前記特徴は、前記音響信号の一連のフレームのうちの各フレームに対して決定される、特徴抽出モジュール
    をさらに有し、
    前記マスクは、前記特徴抽出モジュールにおいて求められた一以上の特徴の一部に基づいて決定される、
    請求項7に記載のシステム。
  9. 前記マスクは、前記第一の音響信号の各サブバンドの、音声損失歪みの閾値レベル、雑音若しくはエコー抑制の所望のレベル、又は推定される信号対雑音比のうちの少なくとも一部に基づいて決定される、
    請求項8に記載のシステム。
  10. 音響信号の雑音低減を実行する方法であって:
    プロセッサが、周波数分析モジュールを実行し、時間領域の音響信号から、蝸牛領域のサブバンド信号を生成する段階と;
    プロセッサが、雑音消去モジュールを実行し、前記サブバンド信号の少なくとも一部を消去する段階と;
    プロセッサが、調整モジュールを実行し、変更された前記サブバンド信号の雑音成分又はエコー成分を抑制する段階と;
    プロセッサが、再構成モジュールを実行し、前記抑制する段階において提供される、成分が抑制された前記サブバンド信号から、変更された時間領域の信号を再構成する段階と;
    を有する、方法。
  11. オーディオ装置の一以上のマイクの信号から前記時間領域の音響信号を受信する段階
    をさらに有する、請求項10に記載の方法。
  12. 前記サブバンド信号の特徴を決定する段階であって、前記特徴は、前記音響信号の一連のフレームのうちの各フレームに対して決定される、段階
    をさらに有する、請求項10に記載の方法。
  13. 第一の音響信号と、第二の音響信号、第三の音響信号又は他の音響信号との間の、マイク間のレベル差又はマイク間の時間差若しくは位相差に基づいて、前記雑音消去モジュール又は前記調整モジュールの適応を制御する段階
    をさらに有する、請求項12に記載の方法。
  14. 前記サブバンド信号から、雑音成分を取り去るか、又は、エコー成分を取り去ることにより、前記サブバンド信号の少なくとも一部分を消去する段階
    をさらに有する、請求項10に記載の方法。
  15. 前記サブバンド信号の特徴を決定する段階であって、前記特徴は、前記音響信号の一連のフレームのうちの各フレームに対して決定される、段階
    をさらに有し、
    前記特徴は、前記特徴抽出モジュールにおいて、前記雑音消去モジュールの出力と、受信した入力信号とから算出される、
    請求項14に記載の方法。
  16. マスクを生成する段階であって、前記マスクは、前記調整モジュールによって、前記雑音消去モジュールにより出力されたサブバンド信号へと適用されるよう構成される、段階
    をさらに有する、請求項10に記載の方法。
  17. 前記サブバンド信号の特徴を決定する段階であって、前記特徴は、前記音響信号の一連のフレームのうちの各フレームに対して決定される、段階
    をさらに有し、
    前記マスクは、前記特徴抽出モジュールにおいて求められた一以上の特徴の一部に基づいて決定される、
    請求項16に記載の方法。
  18. 前記マスクは、前記第一の音響信号の各サブバンドの、音声損失歪みの閾値レベル、雑音若しくはエコー抑制の所望のレベル、又は推定される信号対雑音比のうちの少なくとも一部に基づいて決定される、
    請求項17に記載の方法。
  19. プロセッサに音響信号の雑音低減を実行する方法を実行させるプログラムを保管するコンピュータ読取可能な記憶媒体であって、前記方法は:
    時間領域の音響信号から、蝸牛領域のサブバンド信号を生成する段階と;
    前記サブバンド信号の少なくとも一部を消去する段階と;
    変更された前記サブバンド信号の雑音成分又はエコー成分を抑制する段階と;
    前記抑制する段階において提供される、成分が抑制された前記サブバンド信号から、変更された時間領域の信号を再構成する段階と;
    を有する、記憶媒体。
JP2013508256A 2010-04-29 2011-04-28 複数のマイクによるロバストな雑音抑制 Pending JP2013527493A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US32932210P 2010-04-29 2010-04-29
US61/329,322 2010-04-29
US12/832,920 US8538035B2 (en) 2010-04-29 2010-07-08 Multi-microphone robust noise suppression
US12/832,920 2010-07-08
PCT/US2011/034373 WO2011137258A1 (en) 2010-04-29 2011-04-28 Multi-microphone robust noise suppression

Publications (2)

Publication Number Publication Date
JP2013527493A true JP2013527493A (ja) 2013-06-27
JP2013527493A5 JP2013527493A5 (ja) 2014-06-05

Family

ID=44861918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013508256A Pending JP2013527493A (ja) 2010-04-29 2011-04-28 複数のマイクによるロバストな雑音抑制

Country Status (5)

Country Link
US (2) US8538035B2 (ja)
JP (1) JP2013527493A (ja)
KR (1) KR20130108063A (ja)
TW (1) TWI466107B (ja)
WO (1) WO2011137258A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9502048B2 (en) 2010-04-19 2016-11-22 Knowles Electronics, Llc Adaptively reducing noise to limit speech distortion
US10045140B2 (en) 2015-01-07 2018-08-07 Knowles Electronics, Llc Utilizing digital microphones for low power keyword detection and noise suppression

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
KR101702561B1 (ko) * 2010-08-30 2017-02-03 삼성전자 주식회사 음원출력장치 및 이를 제어하는 방법
US8682006B1 (en) 2010-10-20 2014-03-25 Audience, Inc. Noise suppression based on null coherence
WO2012107561A1 (en) * 2011-02-10 2012-08-16 Dolby International Ab Spatial adaptation in multi-microphone sound capture
US10418047B2 (en) * 2011-03-14 2019-09-17 Cochlear Limited Sound processing with increased noise suppression
US8724823B2 (en) * 2011-05-20 2014-05-13 Google Inc. Method and apparatus for reducing noise pumping due to noise suppression and echo control interaction
US9881616B2 (en) * 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
WO2014022280A1 (en) * 2012-08-03 2014-02-06 The Penn State Research Foundation Microphone array transducer for acoustic musical instrument
US9264524B2 (en) 2012-08-03 2016-02-16 The Penn State Research Foundation Microphone array transducer for acoustic musical instrument
CN102801861B (zh) * 2012-08-07 2015-08-19 歌尔声学股份有限公司 一种应用于手机的语音增强方法和装置
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9100466B2 (en) * 2013-05-13 2015-08-04 Intel IP Corporation Method for processing an audio signal and audio receiving circuit
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
US9508345B1 (en) 2013-09-24 2016-11-29 Knowles Electronics, Llc Continuous voice sensing
US9953634B1 (en) 2013-12-17 2018-04-24 Knowles Electronics, Llc Passive training for automatic speech recognition
CN103915102B (zh) * 2014-03-12 2017-01-18 哈尔滨工程大学 一种lfm水声多途信号的噪声抑制方法
US9437188B1 (en) 2014-03-28 2016-09-06 Knowles Electronics, Llc Buffered reprocessing for multi-microphone automatic speech recognition assist
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
WO2016050780A1 (en) * 2014-10-02 2016-04-07 Sony Corporation Method, apparatus and system
US9311928B1 (en) * 2014-11-06 2016-04-12 Vocalzoom Systems Ltd. Method and system for noise reduction and speech enhancement
US9648419B2 (en) 2014-11-12 2017-05-09 Motorola Solutions, Inc. Apparatus and method for coordinating use of different microphones in a communication device
US9712915B2 (en) 2014-11-25 2017-07-18 Knowles Electronics, Llc Reference microphone for non-linear and time variant echo cancellation
DE112016000545B4 (de) * 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
US10186276B2 (en) * 2015-09-25 2019-01-22 Qualcomm Incorporated Adaptive noise suppression for super wideband music
WO2017096174A1 (en) 2015-12-04 2017-06-08 Knowles Electronics, Llc Multi-microphone feedforward active noise cancellation
US20170206898A1 (en) * 2016-01-14 2017-07-20 Knowles Electronics, Llc Systems and methods for assisting automatic speech recognition
US9756421B2 (en) * 2016-01-22 2017-09-05 Mediatek Inc. Audio refocusing methods and electronic devices utilizing the same
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US10743101B2 (en) 2016-02-22 2020-08-11 Sonos, Inc. Content mixing
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9838737B2 (en) * 2016-05-05 2017-12-05 Google Inc. Filtering wind noises in video content
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
EP3542547B1 (en) * 2016-11-21 2020-07-15 Harman Becker Automotive Systems GmbH Adaptive beamforming
US10262673B2 (en) 2017-02-13 2019-04-16 Knowles Electronics, Llc Soft-talk audio capture for mobile devices
US10468020B2 (en) * 2017-06-06 2019-11-05 Cypress Semiconductor Corporation Systems and methods for removing interference for audio pattern recognition
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) * 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
WO2019143759A1 (en) 2018-01-18 2019-07-25 Knowles Electronics, Llc Data driven echo cancellation and suppression
KR102088222B1 (ko) * 2018-01-25 2020-03-16 서강대학교 산학협력단 분산도 마스크를 이용한 음원 국지화 방법 및 음원 국지화 장치
US10755728B1 (en) * 2018-02-27 2020-08-25 Amazon Technologies, Inc. Multichannel noise cancellation using frequency domain spectrum masking
CN108564963B (zh) * 2018-04-23 2019-10-18 百度在线网络技术(北京)有限公司 用于增强语音的方法和装置
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US10964314B2 (en) * 2019-03-22 2021-03-30 Cirrus Logic, Inc. System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
GB2585086A (en) * 2019-06-28 2020-12-30 Nokia Technologies Oy Pre-processing for automatic speech recognition
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US10764699B1 (en) 2019-08-09 2020-09-01 Bose Corporation Managing characteristics of earpieces using controlled calibration
CN110648679B (zh) * 2019-09-25 2023-07-14 腾讯科技(深圳)有限公司 回声抑制参数的确定方法和装置、存储介质及电子装置
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
DE102020202206A1 (de) * 2020-02-20 2021-08-26 Sivantos Pte. Ltd. Verfahren zur Unterdrückung eines Eigenrauschens einer Mikrofonanordnung
WO2021226515A1 (en) 2020-05-08 2021-11-11 Nuance Communications, Inc. System and method for data augmentation for multi-microphone signal processing
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11610598B2 (en) 2021-04-14 2023-03-21 Harris Global Communications, Inc. Voice enhancement in presence of noise

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090012783A1 (en) * 2007-07-06 2009-01-08 Audience, Inc. System and method for adaptive intelligent noise suppression
JP2009522942A (ja) * 2006-01-05 2009-06-11 オーディエンス,インコーポレイテッド 発話改善のためにマイク間レベル差を用いるシステム及び方法
WO2010005493A1 (en) * 2008-06-30 2010-01-14 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction

Family Cites Families (219)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3581122A (en) 1967-10-26 1971-05-25 Bell Telephone Labor Inc All-pass filter circuit having negative resistance shunting resonant circuit
US3989897A (en) 1974-10-25 1976-11-02 Carver R W Method and apparatus for reducing noise content in audio signals
US4811404A (en) 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
US4910779A (en) 1987-10-15 1990-03-20 Cooper Duane H Head diffraction compensated stereo system with optimal equalization
IL84948A0 (en) 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US5027306A (en) 1989-05-12 1991-06-25 Dattorro Jon C Decimation filter as for a sigma-delta analog-to-digital converter
US5050217A (en) 1990-02-16 1991-09-17 Akg Acoustics, Inc. Dynamic noise reduction and spectral restoration system
US5103229A (en) 1990-04-23 1992-04-07 General Electric Company Plural-order sigma-delta analog-to-digital converters using both single-bit and multiple-bit quantization
JPH0566795A (ja) 1991-09-06 1993-03-19 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 雑音抑圧装置とその調整装置
JP3279612B2 (ja) 1991-12-06 2002-04-30 ソニー株式会社 雑音低減装置
JP3176474B2 (ja) 1992-06-03 2001-06-18 沖電気工業株式会社 適応ノイズキャンセラ装置
US5408235A (en) 1994-03-07 1995-04-18 Intel Corporation Second order Sigma-Delta based analog to digital converter having superior analog components and having a programmable comb filter coupled to the digital signal processor
JP3307138B2 (ja) 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
US5828997A (en) 1995-06-07 1998-10-27 Sensimetrics Corporation Content analyzer mixing inverse-direction-probability-weighted noise to input signal
US5687104A (en) 1995-11-17 1997-11-11 Motorola, Inc. Method and apparatus for generating decoupled filter parameters and implementing a band decoupled filter
US5774562A (en) 1996-03-25 1998-06-30 Nippon Telegraph And Telephone Corp. Method and apparatus for dereverberation
JP3325770B2 (ja) 1996-04-26 2002-09-17 三菱電機株式会社 ノイズ低減回路及びノイズ低減装置及びノイズ低減方法
US5701350A (en) 1996-06-03 1997-12-23 Digisonix, Inc. Active acoustic control in remote regions
US5825898A (en) 1996-06-27 1998-10-20 Lamar Signal Processing Ltd. System and method for adaptive interference cancelling
US5806025A (en) 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
US5963651A (en) 1997-01-16 1999-10-05 Digisonix, Inc. Adaptive acoustic attenuation system having distributed processing and shared state nodal architecture
JP3328532B2 (ja) 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
US6104993A (en) 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
JP4132154B2 (ja) 1997-10-23 2008-08-13 ソニー株式会社 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
US6343267B1 (en) 1998-04-30 2002-01-29 Matsushita Electric Industrial Co., Ltd. Dimensionality reduction for speaker normalization and speaker and environment adaptation using eigenvoice techniques
US6160265A (en) 1998-07-13 2000-12-12 Kensington Laboratories, Inc. SMIF box cover hold down latch and box door latch actuating mechanism
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6539355B1 (en) 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
US6011501A (en) 1998-12-31 2000-01-04 Cirrus Logic, Inc. Circuits, systems and methods for processing data in a one-bit format
US6453287B1 (en) 1999-02-04 2002-09-17 Georgia-Tech Research Corporation Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders
US6381570B2 (en) 1999-02-12 2002-04-30 Telogy Networks, Inc. Adaptive two-threshold method for discriminating noise from speech in a communication signal
US6377915B1 (en) 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
US6490556B2 (en) 1999-05-28 2002-12-03 Intel Corporation Audio classifier for half duplex communication
US20010044719A1 (en) 1999-07-02 2001-11-22 Mitsubishi Electric Research Laboratories, Inc. Method and system for recognizing, indexing, and searching acoustic signals
US6453284B1 (en) 1999-07-26 2002-09-17 Texas Tech University Health Sciences Center Multiple voice tracking system and method
US6480610B1 (en) 1999-09-21 2002-11-12 Sonic Innovations, Inc. Subband acoustic feedback cancellation in hearing aids
US7054809B1 (en) 1999-09-22 2006-05-30 Mindspeed Technologies, Inc. Rate selection method for selectable mode vocoder
US6326912B1 (en) 1999-09-24 2001-12-04 Akm Semiconductor, Inc. Analog-to-digital conversion using a multi-bit analog delta-sigma modulator combined with a one-bit digital delta-sigma modulator
US6594367B1 (en) 1999-10-25 2003-07-15 Andrea Electronics Corporation Super directional beamforming design and implementation
US6757395B1 (en) 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US20010046304A1 (en) 2000-04-24 2001-11-29 Rast Rodger H. System and method for selective control of acoustic isolation in headsets
JP2001318694A (ja) 2000-05-10 2001-11-16 Toshiba Corp 信号処理装置、信号処理方法および記録媒体
US7346176B1 (en) 2000-05-11 2008-03-18 Plantronics, Inc. Auto-adjust noise canceling microphone with position sensor
US6377637B1 (en) 2000-07-12 2002-04-23 Andrea Electronics Corporation Sub-band exponential smoothing noise canceling system
US6782253B1 (en) 2000-08-10 2004-08-24 Koninklijke Philips Electronics N.V. Mobile micro portal
JP2004507144A (ja) 2000-08-11 2004-03-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Σδ変調器を同期させる方法および装置
JP3566197B2 (ja) * 2000-08-31 2004-09-15 松下電器産業株式会社 雑音抑圧装置及び雑音抑圧方法
US7472059B2 (en) 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US20020128839A1 (en) 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US20020097884A1 (en) 2001-01-25 2002-07-25 Cairns Douglas A. Variable noise reduction algorithm based on vehicle conditions
WO2002093561A1 (de) 2001-05-11 2002-11-21 Siemens Aktiengesellschaft Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals
US6675164B2 (en) 2001-06-08 2004-01-06 The Regents Of The University Of California Parallel object-oriented data mining system
WO2003003770A1 (en) 2001-06-26 2003-01-09 Nokia Corporation Method for transcoding audio signals, transcoder, network element, wireless communications network and communications system
US6876859B2 (en) 2001-07-18 2005-04-05 Trueposition, Inc. Method for estimating TDOA and FDOA in a wireless location system
CA2354808A1 (en) 2001-08-07 2003-02-07 King Tam Sub-band adaptive signal processing in an oversampled filterbank
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
CN1279512C (zh) 2001-11-29 2006-10-11 编码技术股份公司 用于改善高频重建的方法和装置
US8942387B2 (en) 2002-02-05 2015-01-27 Mh Acoustics Llc Noise-reducing directional microphone array
US8098844B2 (en) 2002-02-05 2012-01-17 Mh Acoustics, Llc Dual-microphone spatial noise suppression
US7050783B2 (en) 2002-02-22 2006-05-23 Kyocera Wireless Corp. Accessory detection system
AU2003233425A1 (en) 2002-03-22 2003-10-13 Georgia Tech Research Corporation Analog audio enhancement system using a noise suppression algorithm
GB2387008A (en) 2002-03-28 2003-10-01 Qinetiq Ltd Signal Processing System
US7072834B2 (en) 2002-04-05 2006-07-04 Intel Corporation Adapting to adverse acoustic environment in speech processing using playback training data
US7065486B1 (en) 2002-04-11 2006-06-20 Mindspeed Technologies, Inc. Linear prediction based noise suppression
DK1359787T3 (en) 2002-04-25 2015-04-20 Gn Resound As Fitting method and hearing prosthesis which is based on signal to noise ratio loss of data
US7319959B1 (en) 2002-05-14 2008-01-15 Audience, Inc. Multi-source phoneme classification for noise-robust automatic speech recognition
US7257231B1 (en) 2002-06-04 2007-08-14 Creative Technology Ltd. Stream segregation for stereo signals
CA2493105A1 (en) 2002-07-19 2004-01-29 British Telecommunications Public Limited Company Method and system for classification of semantic content of audio/video data
US7539273B2 (en) 2002-08-29 2009-05-26 Bae Systems Information And Electronic Systems Integration Inc. Method for separating interfering signals and computing arrival angles
US7574352B2 (en) 2002-09-06 2009-08-11 Massachusetts Institute Of Technology 2-D processing of speech
US7283956B2 (en) 2002-09-18 2007-10-16 Motorola, Inc. Noise suppression
US7657427B2 (en) 2002-10-11 2010-02-02 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
KR100477699B1 (ko) 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
WO2004084181A2 (en) 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Simple noise suppression model
GB2401744B (en) 2003-05-14 2006-02-15 Ultra Electronics Ltd An adaptive control unit with feedback compensation
WO2005004113A1 (ja) 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US7245767B2 (en) 2003-08-21 2007-07-17 Hewlett-Packard Development Company, L.P. Method and apparatus for object identification, classification or verification
US7516067B2 (en) 2003-08-25 2009-04-07 Microsoft Corporation Method and apparatus using harmonic-model-based front end for robust speech recognition
CA2452945C (en) 2003-09-23 2016-05-10 Mcmaster University Binaural adaptive hearing system
US20050075866A1 (en) 2003-10-06 2005-04-07 Bernard Widrow Speech enhancement in the presence of background noise
US7461003B1 (en) 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
WO2005041170A1 (en) 2003-10-24 2005-05-06 Nokia Corpration Noise-dependent postfiltering
US7672693B2 (en) 2003-11-10 2010-03-02 Nokia Corporation Controlling method, secondary unit and radio terminal equipment
US7725314B2 (en) 2004-02-16 2010-05-25 Microsoft Corporation Method and apparatus for constructing a speech filter using estimates of clean speech and noise
US8438026B2 (en) 2004-02-18 2013-05-07 Nuance Communications, Inc. Method and system for generating training data for an automatic speech recognizer
DE602004004242T2 (de) 2004-03-19 2008-06-05 Harman Becker Automotive Systems Gmbh System und Verfahren zur Verbesserung eines Audiosignals
CN1947171B (zh) 2004-04-28 2011-05-04 皇家飞利浦电子股份有限公司 自适应波束形成器、旁瓣抑制器、自动语音通信设备
US8712768B2 (en) 2004-05-25 2014-04-29 Nokia Corporation System and method for enhanced artificial bandwidth expansion
US7254535B2 (en) 2004-06-30 2007-08-07 Motorola, Inc. Method and apparatus for equalizing a speech signal generated within a pressurized air delivery system
US20060089836A1 (en) 2004-10-21 2006-04-27 Motorola, Inc. System and method of signal pre-conditioning with adaptive spectral tilt compensation for audio equalization
US7469155B2 (en) 2004-11-29 2008-12-23 Cisco Technology, Inc. Handheld communications device with automatic alert mode selection
GB2422237A (en) 2004-12-21 2006-07-19 Fluency Voice Technology Ltd Dynamic coefficients determined from temporally adjacent speech frames
US8170221B2 (en) 2005-03-21 2012-05-01 Harman Becker Automotive Systems Gmbh Audio enhancement system and method
SG161223A1 (en) 2005-04-01 2010-05-27 Qualcomm Inc Method and apparatus for vector quantizing of a spectral envelope representation
US8249861B2 (en) 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
US7813931B2 (en) 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US20070005351A1 (en) 2005-06-30 2007-01-04 Sathyendra Harsha M Method and system for bandwidth expansion for voice communications
CN101238511B (zh) 2005-08-11 2011-09-07 旭化成株式会社 声源分离装置、音频识别装置、移动电话机、声源分离方法
KR101116363B1 (ko) 2005-08-11 2012-03-09 삼성전자주식회사 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치
US20070041589A1 (en) 2005-08-17 2007-02-22 Gennum Corporation System and method for providing environmental specific noise reduction algorithms
US8326614B2 (en) 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
EP1760696B1 (en) 2005-09-03 2016-02-03 GN ReSound A/S Method and apparatus for improved estimation of non-stationary noise for speech enhancement
US20070053522A1 (en) 2005-09-08 2007-03-08 Murray Daniel J Method and apparatus for directional enhancement of speech elements in noisy environments
US8139787B2 (en) 2005-09-09 2012-03-20 Simon Haykin Method and device for binaural signal enhancement
JP4742226B2 (ja) 2005-09-28 2011-08-10 国立大学法人九州大学 能動消音制御装置及び方法
EP1772855B1 (en) 2005-10-07 2013-09-18 Nuance Communications, Inc. Method for extending the spectral bandwidth of a speech signal
US7813923B2 (en) 2005-10-14 2010-10-12 Microsoft Corporation Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
US8433074B2 (en) * 2005-10-26 2013-04-30 Nec Corporation Echo suppressing method and apparatus
US7546237B2 (en) 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US8194880B2 (en) * 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8271277B2 (en) 2006-03-03 2012-09-18 Nippon Telegraph And Telephone Corporation Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium
US8180067B2 (en) 2006-04-28 2012-05-15 Harman International Industries, Incorporated System for selectively extracting components of an audio input signal
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US20070299655A1 (en) 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
DE602007003605D1 (de) 2006-06-23 2010-01-14 Gn Resound As Hörinstrument mit adaptiver richtsignalverarbeitung
JP4836720B2 (ja) 2006-09-07 2011-12-14 株式会社東芝 ノイズサプレス装置
MX2009002779A (es) 2006-09-14 2009-03-30 Lg Electronics Inc Tecnicas para aumentar el dialogo.
DE102006051071B4 (de) 2006-10-30 2010-12-16 Siemens Audiologische Technik Gmbh Pegelabhängige Geräuschreduktion
DE602006002132D1 (de) 2006-12-14 2008-09-18 Harman Becker Automotive Sys beitung
US7986794B2 (en) 2007-01-11 2011-07-26 Fortemedia, Inc. Small array microphone apparatus and beam forming method thereof
JP5401760B2 (ja) 2007-02-05 2014-01-29 ソニー株式会社 ヘッドフォン装置、音声再生システム、音声再生方法
JP4882773B2 (ja) 2007-02-05 2012-02-22 ソニー株式会社 信号処理装置、信号処理方法
US8060363B2 (en) 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
WO2008106036A2 (en) 2007-02-26 2008-09-04 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
US7925502B2 (en) 2007-03-01 2011-04-12 Microsoft Corporation Pitch model for noise estimation
KR100905585B1 (ko) 2007-03-02 2009-07-02 삼성전자주식회사 음성신호의 대역폭 확장 제어 방법 및 장치
EP1970900A1 (en) 2007-03-14 2008-09-17 Harman Becker Automotive Systems GmbH Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal
CN101266797B (zh) 2007-03-16 2011-06-01 展讯通信(上海)有限公司 语音信号后处理滤波方法
JP5260561B2 (ja) 2007-03-19 2013-08-14 ドルビー ラボラトリーズ ライセンシング コーポレイション 知覚モデルを使用した音声の強調
US8005238B2 (en) 2007-03-22 2011-08-23 Microsoft Corporation Robust adaptive beamforming with enhanced noise suppression
US7873114B2 (en) 2007-03-29 2011-01-18 Motorola Mobility, Inc. Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
US8180062B2 (en) 2007-05-30 2012-05-15 Nokia Corporation Spatial sound zooming
JP4455614B2 (ja) 2007-06-13 2010-04-21 株式会社東芝 音響信号処理方法及び装置
US8428275B2 (en) 2007-06-22 2013-04-23 Sanyo Electric Co., Ltd. Wind noise reduction device
US8140331B2 (en) 2007-07-06 2012-03-20 Xia Lou Feature extraction for identification and classification of audio signals
US7817808B2 (en) 2007-07-19 2010-10-19 Alon Konchitsky Dual adaptive structure for speech enhancement
US7856353B2 (en) 2007-08-07 2010-12-21 Nuance Communications, Inc. Method for processing speech signal data with reverberation filtering
US20090043577A1 (en) 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
ATE448649T1 (de) * 2007-08-13 2009-11-15 Harman Becker Automotive Sys Rauschverringerung mittels kombination aus strahlformung und nachfilterung
JP5302968B2 (ja) 2007-09-12 2013-10-02 ドルビー ラボラトリーズ ライセンシング コーポレイション 音声明瞭化を伴うスピーチ改善
US8538763B2 (en) 2007-09-12 2013-09-17 Dolby Laboratories Licensing Corporation Speech enhancement with noise level estimation adjustment
EP2045801B1 (en) 2007-10-01 2010-08-11 Harman Becker Automotive Systems GmbH Efficient audio signal processing in the sub-band regime, method, system and associated computer program
EP2202531A4 (en) 2007-10-01 2012-12-26 Panasonic Corp DETECTOR FOR SOUND SOUND ALIGNMENT
US8107631B2 (en) 2007-10-04 2012-01-31 Creative Technology Ltd Correlation-based method for ambience extraction from two-channel audio signals
US20090095804A1 (en) 2007-10-12 2009-04-16 Sony Ericsson Mobile Communications Ab Rfid for connected accessory identification and method
US8046219B2 (en) 2007-10-18 2011-10-25 Motorola Mobility, Inc. Robust two microphone noise suppression system
WO2009051197A1 (ja) * 2007-10-19 2009-04-23 Nec Corporation エコー抑圧方法及び装置
US8606566B2 (en) 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
ATE456130T1 (de) 2007-10-29 2010-02-15 Harman Becker Automotive Sys Partielle sprachrekonstruktion
EP2058804B1 (en) 2007-10-31 2016-12-14 Nuance Communications, Inc. Method for dereverberation of an acoustic signal and system thereof
ATE508452T1 (de) 2007-11-12 2011-05-15 Harman Becker Automotive Sys Unterscheidung zwischen vordergrundsprache und hintergrundgeräuschen
KR101444100B1 (ko) 2007-11-15 2014-09-26 삼성전자주식회사 혼합 사운드로부터 잡음을 제거하는 방법 및 장치
US20090150144A1 (en) 2007-12-10 2009-06-11 Qnx Software Systems (Wavemakers), Inc. Robust voice detector for receive-side automatic gain control
US8175291B2 (en) 2007-12-19 2012-05-08 Qualcomm Incorporated Systems, methods, and apparatus for multi-microphone based speech enhancement
EP2232704A4 (en) 2007-12-20 2010-12-01 Ericsson Telefon Ab L M APPARATUS AND METHOD FOR NOISE SUPPRESSION
US8554551B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
US8223988B2 (en) 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8374854B2 (en) 2008-03-28 2013-02-12 Southern Methodist University Spatio-temporal speech enhancement technique based on generalized eigenvalue decomposition
US9197181B2 (en) 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method
US8831936B2 (en) 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US20090315708A1 (en) 2008-06-19 2009-12-24 John Walley Method and system for limiting audio output in audio headsets
US9253568B2 (en) 2008-07-25 2016-02-02 Broadcom Corporation Single-microphone wind noise suppression
ES2678415T3 (es) 2008-08-05 2018-08-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para procesamiento y señal de audio para mejora de habla mediante el uso de una extracción de característica
EP2321978A4 (en) 2008-08-29 2013-01-23 Dev Audio Pty Ltd MICROPHONE NETWORK SYSTEM AND METHOD FOR ACQUIRING SOUNDS
US8392181B2 (en) 2008-09-10 2013-03-05 Texas Instruments Incorporated Subtraction of a shaped component of a noise reduction spectrum from a combined signal
EP2164066B1 (en) 2008-09-15 2016-03-09 Oticon A/S Noise spectrum tracking in noisy acoustical signals
ATE552690T1 (de) 2008-09-19 2012-04-15 Dolby Lab Licensing Corp Upstream-signalverarbeitung für client- einrichtungen in einem drahtlosen kleinzellen- netz
US8583048B2 (en) 2008-09-25 2013-11-12 Skyphy Networks Limited Multi-hop wireless systems having noise reduction and bandwidth expansion capabilities and the methods of the same
US20100082339A1 (en) 2008-09-30 2010-04-01 Alon Konchitsky Wind Noise Reduction
US20100094622A1 (en) 2008-10-10 2010-04-15 Nexidia Inc. Feature normalization for speech and audio processing
US8724829B2 (en) 2008-10-24 2014-05-13 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coherence detection
US8218397B2 (en) 2008-10-24 2012-07-10 Qualcomm Incorporated Audio source proximity estimation using sensor array for noise reduction
US8111843B2 (en) 2008-11-11 2012-02-07 Motorola Solutions, Inc. Compensation for nonuniform delayed group communications
US8243952B2 (en) 2008-12-22 2012-08-14 Conexant Systems, Inc. Microphone array calibration method and apparatus
DK2211339T3 (en) 2009-01-23 2017-08-28 Oticon As listening System
JP4892021B2 (ja) 2009-02-26 2012-03-07 株式会社東芝 信号帯域拡張装置
US8359195B2 (en) 2009-03-26 2013-01-22 LI Creative Technologies, Inc. Method and apparatus for processing audio and speech signals
US8184822B2 (en) 2009-04-28 2012-05-22 Bose Corporation ANR signal processing topology
US8611553B2 (en) 2010-03-30 2013-12-17 Bose Corporation ANR instability detection
US8144890B2 (en) 2009-04-28 2012-03-27 Bose Corporation ANR settings boot loading
US8071869B2 (en) 2009-05-06 2011-12-06 Gracenote, Inc. Apparatus and method for determining a prominent tempo of an audio work
US8160265B2 (en) 2009-05-18 2012-04-17 Sony Computer Entertainment Inc. Method and apparatus for enhancing the generation of three-dimensional sound in headphone devices
US8737636B2 (en) 2009-07-10 2014-05-27 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive active noise cancellation
US7769187B1 (en) 2009-07-14 2010-08-03 Apple Inc. Communications circuits for electronic devices and accessories
US8571231B2 (en) 2009-10-01 2013-10-29 Qualcomm Incorporated Suppressing noise in an audio signal
US20110099010A1 (en) 2009-10-22 2011-04-28 Broadcom Corporation Multi-channel noise suppression system
US8244927B2 (en) 2009-10-27 2012-08-14 Fairchild Semiconductor Corporation Method of detecting accessories on an audio jack
US8848935B1 (en) 2009-12-14 2014-09-30 Audience, Inc. Low latency active noise cancellation system
US8526628B1 (en) 2009-12-14 2013-09-03 Audience, Inc. Low latency active noise cancellation system
US8385559B2 (en) 2009-12-30 2013-02-26 Robert Bosch Gmbh Adaptive digital noise canceller
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8700391B1 (en) 2010-04-01 2014-04-15 Audience, Inc. Low complexity bandwidth expansion of speech
JP2013527491A (ja) 2010-04-09 2013-06-27 ディーティーエス・インコーポレイテッド オーディオ再生のための適応的環境ノイズ補償
US8606571B1 (en) 2010-04-19 2013-12-10 Audience, Inc. Spatial selectivity noise reduction tradeoff for multi-microphone systems
US8958572B1 (en) 2010-04-19 2015-02-17 Audience, Inc. Adaptive noise cancellation for multi-microphone systems
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US8447595B2 (en) 2010-06-03 2013-05-21 Apple Inc. Echo-related decisions on automatic gain control of uplink speech signal in a communications device
US8515089B2 (en) 2010-06-04 2013-08-20 Apple Inc. Active noise cancellation decisions in a portable audio device
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
US8719475B2 (en) 2010-07-13 2014-05-06 Broadcom Corporation Method and system for utilizing low power superspeed inter-chip (LP-SSIC) communications
US8761410B1 (en) 2010-08-12 2014-06-24 Audience, Inc. Systems and methods for multi-channel dereverberation
US8611552B1 (en) 2010-08-25 2013-12-17 Audience, Inc. Direction-aware active noise cancellation system
US8447045B1 (en) 2010-09-07 2013-05-21 Audience, Inc. Multi-microphone active noise cancellation system
US9049532B2 (en) 2010-10-19 2015-06-02 Electronics And Telecommunications Research Instittute Apparatus and method for separating sound source
US8682006B1 (en) 2010-10-20 2014-03-25 Audience, Inc. Noise suppression based on null coherence
US8311817B2 (en) 2010-11-04 2012-11-13 Audience, Inc. Systems and methods for enhancing voice quality in mobile device
CN102486920A (zh) 2010-12-06 2012-06-06 索尼公司 音频事件检测方法和装置
US9229833B2 (en) 2011-01-28 2016-01-05 Fairchild Semiconductor Corporation Successive approximation resistor detection
JP5817366B2 (ja) 2011-09-12 2015-11-18 沖電気工業株式会社 音声信号処理装置、方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009522942A (ja) * 2006-01-05 2009-06-11 オーディエンス,インコーポレイテッド 発話改善のためにマイク間レベル差を用いるシステム及び方法
US20090012783A1 (en) * 2007-07-06 2009-01-08 Audience, Inc. System and method for adaptive intelligent noise suppression
WO2010005493A1 (en) * 2008-06-30 2010-01-14 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9502048B2 (en) 2010-04-19 2016-11-22 Knowles Electronics, Llc Adaptively reducing noise to limit speech distortion
US10045140B2 (en) 2015-01-07 2018-08-07 Knowles Electronics, Llc Utilizing digital microphones for low power keyword detection and noise suppression

Also Published As

Publication number Publication date
US8538035B2 (en) 2013-09-17
US20120027218A1 (en) 2012-02-02
US20130322643A1 (en) 2013-12-05
TW201205560A (en) 2012-02-01
KR20130108063A (ko) 2013-10-02
TWI466107B (zh) 2014-12-21
US9438992B2 (en) 2016-09-06
WO2011137258A1 (en) 2011-11-03

Similar Documents

Publication Publication Date Title
TWI466107B (zh) 多麥克風之穩固雜訊抑制
US9343056B1 (en) Wind noise detection and suppression
US9558755B1 (en) Noise suppression assisted automatic speech recognition
US9502048B2 (en) Adaptively reducing noise to limit speech distortion
US8447596B2 (en) Monaural noise suppression based on computational auditory scene analysis
JP5762956B2 (ja) ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
JP5675848B2 (ja) レベルキューによる適応ノイズ抑制
US9076456B1 (en) System and method for providing voice equalization
US8682006B1 (en) Noise suppression based on null coherence
US8761410B1 (en) Systems and methods for multi-channel dereverberation
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
Hegner et al. A high performance low complexity noise suppression algorithm

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140416

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140416

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150623

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151020

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160405