JP2007535698A - バーク帯域ワイナ・フィルタリング及び修正されたドブリンガ雑音評価に基づく雑音抑制 - Google Patents
バーク帯域ワイナ・フィルタリング及び修正されたドブリンガ雑音評価に基づく雑音抑制 Download PDFInfo
- Publication number
- JP2007535698A JP2007535698A JP2007509545A JP2007509545A JP2007535698A JP 2007535698 A JP2007535698 A JP 2007535698A JP 2007509545 A JP2007509545 A JP 2007509545A JP 2007509545 A JP2007509545 A JP 2007509545A JP 2007535698 A JP2007535698 A JP 2007535698A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- circuit
- noise suppression
- speech
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 49
- 238000001914 filtration Methods 0.000 title description 6
- 238000009499 grossing Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 230000003595 spectral effect Effects 0.000 claims description 69
- 238000001228 spectrum Methods 0.000 claims description 32
- 238000011156 evaluation Methods 0.000 claims description 31
- 238000012935 Averaging Methods 0.000 claims description 9
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 description 23
- 238000004364 calculation method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000001413 cellular effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000009467 reduction Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- QSIYTPCKNAPAJY-UHFFFAOYSA-N aluminum;ethoxy-oxido-oxophosphanium;2-(trichloromethylsulfanyl)isoindole-1,3-dione Chemical class [Al+3].CCO[P+]([O-])=O.CCO[P+]([O-])=O.CCO[P+]([O-])=O.C1=CC=C2C(=O)N(SC(Cl)(Cl)Cl)C(=O)C2=C1 QSIYTPCKNAPAJY-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 235000019504 cigarettes Nutrition 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
Abstract
雑音抑制装置において、入力信号は、離散フーリエ解析によって周波数領域に変換され、バーク帯域に分割される。雑音は、それぞれの帯域(85)において評価される。雑音を評価する回路は、雑音の間の方が音声の間よりも遅い時定数で雑音評価を更新する平滑化フィルタを含む。この雑音抑制装置は、入力信号のそれぞれのフレームの信号対雑音比と逆比例する雑音抑制ファクタ(89)を調整する回路(86)を更に含む。雑音評価は、それぞれの帯域において信号から減算される。離散フーリエ変換によって信号は時間領域に再変換され、重複し合成されたウィンドウが、処理の間に生じうる歪みを除去する。
Description
本発明は、音声信号処理に関し、特に、雑音(ノイズ)を低減するためにスペクトル減算を用いる回路に関する。
この出願では、「電話」とは、ライセンスを有するサービス・プロバイダからのダイアル・トーンを直接又は間接に用いる通信装置のための総称的な用語である。従って、「電話」と言えば、机上電話機(図1を参照)、コードレス電話機(図2を参照)、スピーカフォン(図3を参照)、ハンドフリー・キット(図4を参照)、携帯電話(図5を参照)などを含む。単純化のために、本発明は、電話を例として説明されるが、それよりも広い用途を有している。無線周波数のトランシーバやインターコムなど、ダイアル・トーンを用いない通信装置などがその例である。
電話システムには、多くの雑音源が存在する。原因が音響的である雑音もあれば、それ以外にも、例えば、電話網(ネットワーク)などのように電子的な雑音源もある。この出願では、「雑音」と言えば、周期的であるか、純粋にランダムであるか、その中間のどこかであるかとは関係なく、望まない音声を意味する。よって、雑音には、背景の音楽、相手以外の人間の声、タイヤの雑音、風の雑音なども含まれる。自動車は、特にやかましい環境となりうるが、そのために、本発明はハンドフリー・キットにとって特に有用な発明となる。
広く定義すると、雑音は、スピーカの音のエコーを含む。しかし、エコーの除去は、電話システムでは別個に処理されており、2つのチャネルにおける信号の比較に関係している。本発明は雑音の抑制に関するものであり、これは、本発明による装置は単一のチャネルでリアルタイムに動作する、すなわち、エコー除去の場合のように遅延を計算しないことを意味する。
普遍的に妥当するとは言えないが、従来技術では、一般に、雑音の「抑制」(suppression)を減算(subtraction)と関連付け、雑音の「低減」(reduction)を減衰(attenuation)と関連付けている。この出願では、雑音の抑制は、ある信号を別の信号から減算して雑音の量を減少させることを含む。
この技術分野の当業者であれば、アナログ信号がいったんデジタル形式に変換されるとそれ以後のすべての動作は、適切にプログラムされた1又は複数のマイクロプロセッサにおいて生じうることを理解する。例えば、「信号」という用語を用いたからとしても、アナログ信号又はデジタル信号のいずれかを必ずしも意味するものではない。メモリの中のデータも、たとえ1ビットであっても、信号でありうる。
プログラミングの意味における「効率」とは、ある機能を実行するのに要求される命令の数である。命令の数が少なければ、命令の数が多い場合よりも優れており、すなわち効率的である。機械(アセンブリ)言語以外の言語では、1行のコードには、数百の命令が含まれる場合がある。この出願では、「効率」とは機械言語の命令に関するものであり、コードのラインに関係しない。その理由は、単位時間内に実行することができる命令の数によって、ある動作を実行する又はある機能を実行するのに要する時間が決定される。
「バーク(Bark)帯域」又は「バーク・スケール」とは、人間の聴覚システムは一連の帯域通過フィルタと類似しているという一般的に受け入れられている人間の聴覚のモデルに関するものである。これらのフィルタの帯域幅は周波数と共に増加し、周波数知覚の精度は周波数が上昇すると低下する。帯域を計算する公式については、複数の異なるものが知られている。バーク・スケールは24の帯域を含み、その中で低い方から18の帯域だけが本発明においては用いられる。その理由は、電話システムの帯域幅は通常の人の聴覚の全範囲よりも狭いからである。しかし、他の帯域及び帯域幅は、本発明を他の応用例において実現する際に用いることができる。
従来技術においては、雑音パワーを評価することは計算的に負担が大きく、計算を完了するには高速な計算か十分な時間かのいずれかが要求された。高速な計算には高いクロック速度が要求され、特にバッテリによって給電されている装置において望まれるよりも多くの電力が必要となる。計算のための長すぎる時間が必要であると、入力信号が計算の間に著しく変化することにより誤差が生じうる。
以上を考慮すると、本発明の目的は、電話機又はそれ以外の通信装置における雑音抑制のための従来よりもより効率的なシステムを提供することである。
本発明の別の目的は、従来技術におけるシステムと同等に又は更に高い性能で動作する雑音抑制システムであって、より効率的なシステムを提供することである。
本発明の別の目的は、従来技術におけるシステムと同等に又は更に高い性能で動作する雑音抑制システムであって、より効率的なシステムを提供することである。
本発明の更に別の目的は、従来技術の回路よりも歪みを生じない雑音抑制回路を提供することである。
以上の目的は、本発明において実現される。本発明では、入力信号が離散フーリエ変換によって周波数領域に変換され、バーク帯域に分割される。それぞれの帯域について雑音が評価される。雑音を評価する回路は、音声の間よりも雑音の間の方がより遅い時定数で雑音評価を更新する平滑化回路を含む。この雑音抑制器は、更に、入力信号のそれぞれのフレームの信号対雑音比に逆比例する雑音抑制ファクタを調整する回路を含む。雑音評価は、それぞれの帯域において信号から減算される。逆離散フーリエ変換によって、信号を時間領域に再度変換して戻し、オーバラップし合成されたウィンドウが、処理の間に生じた歪みを除去する。
本発明のより完全な理解は、以下の説明を添付の図面を参照して読むことによって得られるはずである。
信号はアナログ又はデジタルでありうるから、ブロック図は、ハードウェア、流れ図のようなソフトウェア、又はハードウェアとソフトウェアとの混合として理解することができる。マイクロプロセッサのプログラミングは、個人的にも集団的にも、この技術分野の当業者の能力の範囲内である。
信号はアナログ又はデジタルでありうるから、ブロック図は、ハードウェア、流れ図のようなソフトウェア、又はハードウェアとソフトウェアとの混合として理解することができる。マイクロプロセッサのプログラミングは、個人的にも集団的にも、この技術分野の当業者の能力の範囲内である。
本発明は、内部電子装置が実質的に同一であるが外観が異なる多くの応用例において使用が可能である。図1には、ベース10とキーパッド11とディスプレイ13とハンドセット14とを含む机上電話機が図解されている。図1に示されているように、この電話機は、スピーカ15とマイクロフォン16とを含むスピーカフォンとしての能力も有している。図2に図解されているコードレス電話は、ベース20とハンドセット21とがコードではなくてアンテナ23及び24を介して無線周波数信号によって結合されている点を除くと、類似している。ハンドセット21のための電源は、このハンドセットがクレードル29に置かれると、ベース20における端子26及び27を介して充電される内部バッテリ(図示せず)によって供給される。
図3は、企業のオフィスで見られるような会議電話機又はスピーカフォンを図解している。電話機30は、立体的なケースの中にマイクロフォン31とスピーカ32とを含む。電話機30は、マイクロフォン34及び35のようないくつかのマイクロフォンを含み、音声受信を向上させ、又は、米国特許第5,138,651号(Sudo)に開示されているように、エコー除去又は雑音除去のための複数の入力を提供する。
図4は、図5に図解されているセルラ電話への音声結合を提供するハンズフリー・キットとして知られているものを図解している。ハンズフリー・キットには様々な実現例があるが、一般的には、プラグ37に付属した給電されたスピーカ36を含み、このプラグは付属のアウトレットや車両のタバコ用ライター・ソケットに適合する。また、ハンズフリー・キットは、プラグ39で終端するケーブル38を含む。プラグ39は、セルラ電話機42のソケット41(図5)のようなセルラ電話機の上のヘッドセット・ソケットに適合する。また、ハンズフリー・キットは、典型的には、ボリューム・コントロールなどいくつかの制御スイッチを含む。例えば、呼に応答するために「オフフック」となるためのスイッチである。更に、ハンズフリー・キットは、典型的には、キットにプラグインされるバイザ(visor)マイクロフォン(図示せず)を含む。本発明に従って構築される音声処理回路は、ハンズフリー・キットやセルラ(携帯)電話に組み込むことが可能である。
様々な形態の電話機が本発明による効果を受けることができる。図6は、セルラ電話機の主要な構成要素のブロック図である。典型的には、ブロックは、指示された機能を実現する集積回路に対応する。マイクロフォン51とスピーカ52とキーパッド53とは、信号処理回路54に結合されている。回路54は、複数の機能を実行し、この技術分野では製造業者によって異なるいくつかの名称によって知られている。例えば、インフィニオン(Infineon)社は、回路54を「シングル・チップ・ベースバンドIC」と称する。クアルコム(QualComm)社は、回路54を「モバイル・ステーション・モデム」と生じる。異なる製造業者からの回路は明らかにその詳細は異なっているが、一般的に、指示された機能は含まれている。
セルラ電話機は、音声周波数回路と無線周波数回路との両方を含む。デュープレクサ55は、アンテナ56を受信プロセッサ57に結語する。デュープレクサ55は、アンテナ56をパワーアンプ58に結合し、送信の間は、受信プロセッサ57をパワーアンプから切り離す。送信プロセッサ59は、回路54からの音声信号を用いて無線周波数信号を変調する。スピーカフォンなどのセルラ型ではない応用例では、無線周波数回路は存在せず、信号プロセッサ54はいくぶん単純化されている。エコーのキャンセル及び雑音の問題が残るが、これは、音声プロセッサ60において処理される。本発明を含むように修正されるのは、音声プロセッサ60である。
最近の雑音低減アルゴリズムは、ほとんどが、スペクトル減算として知られている技術に基づいている。雑音を含まない(クリーンな)音声信号が加算的で相関のない雑音を含む(ノイジーな)信号に影響を受ける場合には、この雑音を含む音声信号は、単純に、信号の和である。雑音源のパワー・スペクトル密度(PSD)が完全にわかっている場合には、それを、ワイナ(Weiner)フィルタを用いて、雑音を含む音声信号から減算して雑音を含まない音声を生じさせることができる。例えば、J.S. Lim and A. V. Oppenheim, "Enhancement and bandwidth compression of noisy speech," Proc. IEEE, vol. 67, pp. 1586-1604, Dec. 1979を参照のこと。通常は、雑音源はわからないので、スペクトル減算アルゴリズムにおいて重要な要素は雑音を含む信号のパワー・スペクトル密度(PSD)の評価である。
スペクトル減算を用いる雑音低減は、次の式のように書くことができる。
ここで、Ps(f)は音声のパワー・スペクトルであり、Px(f)は雑音を含む音声であり、Pn(f)は雑音のパワー・スペクトルである。減算プロセスの周波数応答は次のように書くことができる。
ここで、P∧n(f)は雑音評価のパワー・スペクトルであり、βはサブバンドの信号対雑音比に基づくスペクトル重み付けファクタである(なお、数式では∧はPの上にあるが、ここでは入力上の制約によりPの後に書かれている)。雑音を含まない音声評価は次の式によって得られる。
単一チャネルの雑音抑制システムでは、雑音を含む信号のPSDは、雑音を含む信号自体から評価されるのであるが、というのは、この雑音を含む信号が唯一の使用可能な信号であるからである。ほとんどの場合に、雑音評価は正確ではない。従って、不正確な雑音評価の結果として生じる歪みを低減するプロセスにおいて、何らかの調整がなされることが必要である。この理由により、雑音抑制方法のほとんどは、スペクトル重み付けファクタを制御するパラメータβを導入することにより、低い信号対雑音比(S/N)を有する周波数が減衰され、高いS/N比を有する周波数は修正されないようにしている。
図7は、本発明の好適実施例によって構築された雑音抑制器に関係する音声プロセッサ60の一部のブロック図である。雑音抑制に加えて、音声プロセッサ60は、エコーのキャンセルや追加的なフィルタリングなどそれ以外の機能を含んでいるが、これらは本発明とは関係ない。以下の説明では、見出しの数字は、図7におけるブロックに関係する。また、第2の雑音抑制回路がライン入力66とスピーカ出力68との間で受信チャネルに結合することができ、これは、破線79によって表されている。
71.解析ウィンドウ:
雑音低減(reduction)プロセスは、情報のブロックを処理することによって実行される。ブロックのサイズは、例えば、128個のサンプルである。本発明のある実施例では、入力フレームのサイズは32フレームである。従って、入力データは、処理のためにバッファされなければならない。128ワードのバッファ・サイズが、入力データをウィンドウ化スペクトル前に用いられる。
71.解析ウィンドウ:
雑音低減(reduction)プロセスは、情報のブロックを処理することによって実行される。ブロックのサイズは、例えば、128個のサンプルである。本発明のある実施例では、入力フレームのサイズは32フレームである。従って、入力データは、処理のためにバッファされなければならない。128ワードのバッファ・サイズが、入力データをウィンドウ化スペクトル前に用いられる。
バッファされたデータはウィンドウ化され、周波数領域におけるブロック処理において生じた歪み(artifacts)が低減される。異なるウィンドウのオプションが利用可能である。ウィンドウの選択は、異なるファクタ、すなわち、メイン・ローブの幅と、サイド・ローブのレベルと、重複(オーバラップ)のサイズとに基づく。前処理において用いられたウィンドウのタイプは、メイン・ローブの幅とサイド・ローブのレベルとに影響を及ぼす。例えば、ハニング(Hanning)ウィンドウは、矩形のウィンドウと比較すると、メイン・ローブの幅がより広く、サイド・ローブのレベルはより低い。この技術分野ではいくつかのウィンドウ・タイプが知られており、ゲインや平滑化係数などのパラメータを適切に調整して、それらいくつかのタイプのウィンドウを用いることができる。
周波数領域処理によって生じる歪みは、用いられる重複がより少ない場合には、更に悪化する。しかし、用いられる重複が多いと、その結果として、計算上の要求が増加する。合成ウィンドウを用いることにより、再構成の段階で生じる歪みは低減する。以上のすべてのファクタを考慮して、それぞれが25%の重複を有する台形型の解析ウィンドウと、平滑化された台形型の合成ウィンドウとが、用いられる。128個の点の離散フーリエ変換では、25%の重複とは、前のフレームからの最後の32個のサンプルが現在のフレームのための最初の(最も古い)32のフレームとして用いられることを意味する。
重複のサイズであるDは、(2Dana−Dsyn)と等しい。Danaが24に等しく、Dsynが16に等しい場合には、解析ウィンドウであるWana(n)は、次の式によって与えられる。
合成ウィンドウであるWsyn(n)は、次の式によって与えられる。
中心区間は両方のウィンドウで同一である。完全な再構成のためには、解析ウィンドウと合成ウィンドウとは、0≦n<Dであるときには、次の条件を満たす。
そして、D≦n<96であるときには、次の条件を満たす。
バッファされたデータは、次の式で表される解析ウィンドウを用いてウィンドウ化される。ただし、x(m,n)は、フレームmにおけるバッファされたデータである。
72.順離散フーリエ変換(DFT):
ウィンドウ化された時間領域データは、次の変換方程式によって与えられる離散フーリエ変換を用いて周波数領域に変換される。ただし、xw(m,n)はフレームmにおけるウィンドウ化された時間領域データであり、X(m,k)はフレームmにおける変換されたデータであり、NはDFTのサイズである。
ウィンドウ化された時間領域データは、次の変換方程式によって与えられる離散フーリエ変換を用いて周波数領域に変換される。ただし、xw(m,n)はフレームmにおけるウィンドウ化された時間領域データであり、X(m,k)はフレームmにおける変換されたデータであり、NはDFTのサイズである。
入力時間領域データは実数であるから、DFTの出力はファクタN/2によって正規化される。
74.周波数領域処理:
雑音抑制回路の周波数応答が、計算され、図8のブロック図に図解されている複数の特徴を有する。以下の説明での参照番号は、図8におけるブロックを意味する。
81.パワー・スペクトル密度(PSD)評価:
雑音を含む音声のパワー・スペクトル密度は、次の式によって定義される1次の再帰的(recursive)フィルタを用いて近似される。
74.周波数領域処理:
雑音抑制回路の周波数応答が、計算され、図8のブロック図に図解されている複数の特徴を有する。以下の説明での参照番号は、図8におけるブロックを意味する。
81.パワー・スペクトル密度(PSD)評価:
雑音を含む音声のパワー・スペクトル密度は、次の式によって定義される1次の再帰的(recursive)フィルタを用いて近似される。
ここで、Px(m,k)はフレームmにおける雑音を含む音声のパワー・スペクトル密度であり、Px(m−1,k)はフレームm−1における雑音を含む音声のパワー・スペクトル密度である。|X(m,k)|2はフレームmにおける雑音を含む音声のマグニチュード・スペクトルであり、kは周波数インデクスである。εSはスペクトル平滑化ファクタである。
82.バーク帯域エネルギ評価:
サブバンド・ベースの信号解析が実行され、雑音低減プロセスの間に生じたスペクトルの歪みが低減される。サブバンドは、バーク(Bark)帯域(「臨界(critical)帯域」とも称される)に基づいており、人の耳による知覚をモデル化している。狭帯域の音声スペクトルにおけるバーク帯域の帯域エッジと中心周波数とが次の表に示されている。
82.バーク帯域エネルギ評価:
サブバンド・ベースの信号解析が実行され、雑音低減プロセスの間に生じたスペクトルの歪みが低減される。サブバンドは、バーク(Bark)帯域(「臨界(critical)帯域」とも称される)に基づいており、人の耳による知覚をモデル化している。狭帯域の音声スペクトルにおけるバーク帯域の帯域エッジと中心周波数とが次の表に示されている。
雑音を含む音声フレームのDFTは、17個のバーク帯域に分割される。128点のDFTの場合の、それぞれのバーク帯域に対応するスペクトル・ビン数が次の表に示されている。
それぞれのバーク帯域における雑音を含む音声のエネルギは、次の式によって計算される。
それぞれのバーク帯域における雑音のエネルギは、次の式によって計算される。
ここで、fH(i)及びfL(i)は、バーク帯域iにおける最高の周波数と最低の周波数とのそれぞれに対応するスペクトル・ビン数であり、Px(m,k)及びPn(m,k)は、雑音を含む音声のパワー・スペクトル密度と雑音評価とである。
84.雑音評価:
Rainer Martinは、最小統計に基づく雑音評価の初期の主張者であった(これについては、"Spectral Subtraction Based on Minimum Statistics," Proc. 7th European Signal Processing Conf., EUSIPCO-94, September 13-16, 1994, pp. 1182-1185を参照のこと)。この方法は、音声におけるポーズ(停止、息継ぎ)を見つけて背景の雑音を評価する音声活動検出器を必要としない。このアルゴリズムは、その代わりに、有限時間ウィンドウの中のパワー・スペクトル密度の最小評価を用いて、雑音レベルを評価する。このアルゴリズムは、それぞれのスペクトル・ビンにおける雑音を含む音声信号の短期パワーの評価は時間経過と共に明確なピークと谷間とを示すという観察に基づいている。信頼できる雑音パワー評価を得るためには、データ・ウィンドウすなわちバッファ長は、最長の認識可能な音声活動に及ぶのに十分な程度の長さを有していなければならないが、同時に、雑音がほぼ安定的であるのに十分なほどに短くなければならない。雑音パワー評価Pn(m,k)は、M個のサブバンド・パワー・サンプルのウィンドウの中の短時間パワー評価Px(m,k)の最小値として得られる。アルゴリズムの計算上の複雑さを低減し、遅延を短縮するためには、長さがMである1つのウィンドウへのデータは、長さがlであるw個のウィンドウに分解される。ただし、ここで、l*w=Mである。
84.雑音評価:
Rainer Martinは、最小統計に基づく雑音評価の初期の主張者であった(これについては、"Spectral Subtraction Based on Minimum Statistics," Proc. 7th European Signal Processing Conf., EUSIPCO-94, September 13-16, 1994, pp. 1182-1185を参照のこと)。この方法は、音声におけるポーズ(停止、息継ぎ)を見つけて背景の雑音を評価する音声活動検出器を必要としない。このアルゴリズムは、その代わりに、有限時間ウィンドウの中のパワー・スペクトル密度の最小評価を用いて、雑音レベルを評価する。このアルゴリズムは、それぞれのスペクトル・ビンにおける雑音を含む音声信号の短期パワーの評価は時間経過と共に明確なピークと谷間とを示すという観察に基づいている。信頼できる雑音パワー評価を得るためには、データ・ウィンドウすなわちバッファ長は、最長の認識可能な音声活動に及ぶのに十分な程度の長さを有していなければならないが、同時に、雑音がほぼ安定的であるのに十分なほどに短くなければならない。雑音パワー評価Pn(m,k)は、M個のサブバンド・パワー・サンプルのウィンドウの中の短時間パワー評価Px(m,k)の最小値として得られる。アルゴリズムの計算上の複雑さを低減し、遅延を短縮するためには、長さがMである1つのウィンドウへのデータは、長さがlであるw個のウィンドウに分解される。ただし、ここで、l*w=Mである。
最小値を求めるためにサブウィンドウ・ベースのサーチを用いるとマーティン(Martin)の雑音評価方法の計算上の複雑さは低減されるが、このサーチでは、すべてのサブバンドに対するそれぞれのサブウィンドウにおける最小値を記憶するために大量のメモリが必要となる。ゲルハルト・ドブリンガ(Gerhard Doblinger)が、最小統計をトラックする計算的に効率のよいアルゴリズムを提案している(G. Doblinger, "Computationally efficient speech enhancement by spectral minima tracking in subbands, " Proc. 4th European Con f. Speech, Communication and Technology, EUROSPEECH'95, September 18-21,1995, pp. 1513-1516を参照のこと)。このアルゴリズムの流れ図が、図9において、細いラインによって示されている。このアルゴリズムによると、雑音を含む音声のスペクトルの現在の(フレームmの)値が前のフレーム(フレームm−1)の雑音評価よりも小さいならば、雑音評価は、現在の雑音を含む音声のスペクトルに更新される。そうでない場合には、現在のフレームの雑音評価は、1次の平滑化フィルタによって更新される。この1次の平滑化は、現在の雑音を含む音声のスペクトルPx(m,k)と、前のフレームの雑音を含む音声のスペクトルPx(m−1,k)と、前のフレームの雑音を含む音声Px(m−1,k)との関数である。図9におけるパラメータβ及びγは、背景雑音における短時間の定常攪乱(stationary disturbance)に調整するのに用いられる。このアルゴリズムにおいて用いられるβ及びγの値は、それぞれが、0.5及び0.995であるが、変動しうる。
ドブリンガ(Doblinger)の雑音評価方法は、メモリをそれほど要求しない単純な1次フィルタを用いて最小統計をトラックする。従って、ドブリンガの方法は、マーティンの最小統計のアルゴリズムよりも効率が優れている。しかし、ドブリンガの方法は、マーティンの方法と比較すると、両方の方法が同じ収束時間を有するとしても、音声フレームの間の雑音を過大評価している。このような雑音の過大評価は、スペクトル減算の間に音声に歪みを生じさせる。
本発明によると、ドブリンガの雑音評価方法が、図9において太いラインによって示されているようにプロセスの中に挿入された追加的なテストによって修正される。この修正によると、現在の雑音を含む音声のスペクトルが雑音評価から大きく逸脱している場合には、非常に遅い時定数を有する1次指数平均化平滑化フィルタを用いて、現在のフレームの雑音評価を更新する。このような低速の時定数フィルタの効果は、雑音評価を低減し、評価の変化を低速化するということである。
図9におけるパラメータμは、背景雑音に急激な変化が存在するときに、雑音評価の収束時間を制御する。パラメータμの値が高くなればなるほど、収束時間は遅くなり、音声の歪みは小さくなる。従って、パラメータμのチューニングは、雑音評価の収束時間と音声の歪みとの間のトレードオフである。パラメータνは、雑音評価からの雑音を含む音声のスペクトルの逸脱スレショルドを制御する。本発明のある実施例では、νの値は3である。これと異なる値を用いることも可能である。スレショルドが低くなると、収束時間が増加する。スレショルドが高くなると、歪みが増加する。1から9までの範囲が使用可能であると考えられるが、この限度は重要ではない。
89.スペクトル・ゲインの計算:
修正されたワイナ・フィルタリング:様々な高度なスペクトル・ゲインの計算方法については、文献が存在する。例えば、Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator," IEEE Trans. Acoust. Speech, Signal Processing, vol. ASSP-32, pp. 1109-1121, Dec. 1984; Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error log-spectral amplitude estimator," IEEE Trans. Acoust. Speech, Signal Processing, vol. ASSP-33 (2), pp. 443-445, April 1985; and I. Cohen, "On speech enhancement under signal presence uncertainty," Proceedings of the 26th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP-01, Salt Lake City, Utah, pp. 7-11, May 2001を参照のこと。
89.スペクトル・ゲインの計算:
修正されたワイナ・フィルタリング:様々な高度なスペクトル・ゲインの計算方法については、文献が存在する。例えば、Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator," IEEE Trans. Acoust. Speech, Signal Processing, vol. ASSP-32, pp. 1109-1121, Dec. 1984; Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error log-spectral amplitude estimator," IEEE Trans. Acoust. Speech, Signal Processing, vol. ASSP-33 (2), pp. 443-445, April 1985; and I. Cohen, "On speech enhancement under signal presence uncertainty," Proceedings of the 26th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP-01, Salt Lake City, Utah, pp. 7-11, May 2001を参照のこと。
閉じた形式のスペクトル・ゲイン公式により、音声の実際のスペクトル振幅と音声のスペクトル振幅の評価との間の平均自乗誤差が最小化される。また、別の閉じた形式のスペクトル・ゲイン公式を用いて、音声の実際の振幅の対数と音声の評価された振幅の対数との間の平均自乗誤差が最小化される。これらのアルゴリズムは理論的な意味では最適であるかもしれないが、これらのアルゴリズムの実際の性能は、非常に雑音の多い状況においては商業的に有用とは言えない。これらのアルゴリズムは、雑音がそれほどでもない環境においても、音楽的なトーンに関しては著しい歪みを生じさせる。多くの修正されたアルゴリズムが、概要を上述した2つのものから導かれている。
この技術分野においては、一般化されたワイナ・フィルタリングに基づいて、スペクトル・ゲインを信号対雑音比の関数として計算することが知られている(L. Arslan, A. McCree, V. Viswanathan, "New methods for adaptive noise suppression," Proceedings of the 26th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP-01, Salt Lake City, Utah, pp. 812-815, May 2001を参照のこと)。一般化されたワイナ・フィルタは、次の式で与えられる。
ただし、P∧s(m,k)は雑音のない音声のパワー・スペクトル評価であり、P∧n(m,k)は雑音評価の音声のパワー・スペクトルであり、αは雑音抑制ファクタである(なお、数式では∧はPの上にあるが、ここでは入力上の制約によりPの後に書かれている)。雑音のない音声スペクトルを評価するには多くの方法がある。例えば、雑音のない音声スペクトルは、線形予測符号化(linear predicative coding)モデル・スペクトルとして評価することができる。また、雑音のない音声スペクトルは、単にゲインを修正することにより、雑音を含む音声のスペクトルPx(m,k)から計算することができる。
ここで、Ex(m)はフレームmにおける雑音を含む音声のエネルギであり、En(m)はフレームmにおける雑音のエネルギである。信号対雑音比(SNR)は、次の式を用いて計算される。
この数式を一般化されたワイナ・フィルタの公式に代入すると次の式が得られる。
ここで、SNR(m)は、フレーム番号mの信号対雑音比であり、α‘は(Ex(m)/En(m))αと等しい新たな雑音抑制ファクタである。数式16によると、H(m,k)は信号対雑音比と共に変動するので、雑音を含むフレームに対してはより強い抑制を、発せられた音声フレームの間にはそれよりも弱い抑制が保証される。
バーク帯域ベースの修正されたワイナ・フィルタリング:修正されたワイナ・フィルタのソリューションは、全体のフレームmの信号対雑音比に基づく。スペクトル・ゲインの関数が全体のフレームの信号対雑音比に基づいているので、スペクトル・ゲインの値は、音声が発せられたフレームの間は大きく、音声が発せられていないのフレームの間は小さくなる。これにより、「雑音ポンピング」が生じ、雑音がオン及びオフに切り替えられるように聞こえる。この問題を克服するためには、本発明の別の特徴に従って、バーク帯域ベースのスペクトル解析が実行される。それぞれのフレームのそれぞれの帯域における信号対雑音比は、次の式に従って計算される。
ここで、Ex(m,i)及びEn(m,i)は、それぞれが、フレームmにおける帯域iの雑音を含む音声のエネルギと雑音のエネルギとである。最終的には、バーク帯域ベースのスペクトル・ゲインの値は、修正されたワイナ・ソリューションにおけるバーク帯域SNRを用いて計算される。
ここで、fL(i)及びfH(i)は、バーク帯域iにおける最高の周波数と最低の周波数とのそれぞれに対応するスペクトル・ビン数である。
スペクトル減算ベースの方法の短所の1つとして、音楽的トーンに歪みが生じることがある。雑音評価が不正確であるために、いくつかのスペクトルのピークが、スペクトル減算の後の残差(residue)として残ってしまう。これらの歪みを低減するには、雑音抑制ファクタであるα‘は、上で計算された値よりも高い値に維持されなければならない。しかし、α’の値が高いと、結果的に、発せられた音声により多くの歪みが生じる。パラメータα‘のチューニングは、音声振幅の低減と音楽的トーンの歪みとの間のトレードオフである。これにより、音声の間の雑音低減量を制御する新たな機構に至ることになる。
スペクトル減算ベースの方法の短所の1つとして、音楽的トーンに歪みが生じることがある。雑音評価が不正確であるために、いくつかのスペクトルのピークが、スペクトル減算の後の残差(residue)として残ってしまう。これらの歪みを低減するには、雑音抑制ファクタであるα‘は、上で計算された値よりも高い値に維持されなければならない。しかし、α’の値が高いと、結果的に、発せられた音声により多くの歪みが生じる。パラメータα‘のチューニングは、音声振幅の低減と音楽的トーンの歪みとの間のトレードオフである。これにより、音声の間の雑音低減量を制御する新たな機構に至ることになる。
雑音を含むスペクトル成分に存在する信号の不確実性を用いて音声を強化するというアイデアは、この技術分野で知られている(R.J. McAulay and M. L. Malpass, "Speech enhancement using a soft-decision noise suppression filter," IEEE Trans. Acoust., Speech, Signal Processing, vol ASSP-28, pp. 137-145, April 1980を参照のこと)。雑音を含む環境において音声が存在する確率を計算した後で、その計算された確率は、雑音抑制ファクタαを調整するのに用いられる。
発せられた音声を検出する方法の1つとして、雑音を含む音声のエネルギ・スペクトルと雑音のエネルギ・スペクトルとの間の比率を計算する方法がある。この比率が非常の大きい場合には、音声が発せられていると推測することができる。本発明の別の特徴によると、音声が存在する確率が、すべてのバーク帯域について、計算される。このバーク帯域解析の結果として、音声の質を強化しながら計算的な節約が可能となる。この最初のステップは、次の式によって比率を計算することである。
ただし、Ex(m,i)及びEn(m,i)は、上で既に定義したものと同じである。この比率をスレショルドλthと比較して、音声が存在するかどうかが判断される。スレショルドを超えた場合に音声は存在する。図10を参照のこと。
音声が存在する確率は、次の式のように、1次の指数平均化(平滑化)フィルタによって計算される。
ここで、εpは確率平滑化ファクタであり、Ipは音声が存在するときには1に等しく、存在しないときには0に等しい。連続するフレームにおける音声の存在の相関は、フィルタによって捕捉される。
雑音抑制ファクタαは、音声存在確率とスレショルドpthとを比較することによって決定される。特に、αは、スレショルドを超えない場合よりもスレショルドを超えた場合の方が低く設定される。もう一度注意しておくが、このファクタは、それぞれの帯域について計算される。
スペクトル・ゲインの制限:スペクトル・ゲインは、ゲインが例えば−20dBの最小値を下回ることがないように、制限される。このシステムは、小さなゲインでも動作するが、ゲインを最小値未満まで低減することは許容しない。なお、この値は重要ではない。ゲインを制限することによって、スペクトル・ゲインの限られた精度による固定された点の計算の結果として生じうる音楽的なトーンの歪みや音声の歪みを低減させることができる。
ゲインの下限は、スペクトル・ゲインの計算プロセスによって調整される。バーク帯域におけるエネルギがあるスレショルドEth未満である場合には、最小のゲインは−1dBに設定される。あるセグメントが音声が発せられたものとして分類されると、確率はpthを超え、従って、最小ゲインは−1dBに設定される。いずれの条件も満たされない場合には、最小ゲインは許容されうる最低の値である例えば−20dBに設定される。本発明のある実施例では、Ethに対する適した値は0.01である。pthに適した値は0.1である。このプロセスは、それぞれの帯域にたいして反復され、それぞれの帯域におけるゲインが調節される。
スペクトル・ゲインの平滑化:すべてのブロック変換ベースの処理では、ウィンドウ化と重複・加算とが、周波数領域のブロックで信号を処理することによって生じる歪みを低減する技術として知られている。このような歪みの低減は、ウィンドウのメイン・ローブの幅、ウィンドウのサイド・ローブの勾配、ブロック間での重複量などのいくつかのファクタに影響を受ける。メイン・ローブの幅は、用いられているウィンドウのタイプによって影響される。例えば、ハニング(Hanning、余弦を上昇させたもの)ウィンドウは、矩形のウィンドウよりもメイン・ローブの幅が広くサイド・ローブのレベルが低い。
スペクトル・ゲインを制御することによってウィンドウは平滑化され、重複及び加算プロセスの間に重複境界において不連続を生じさせる。この不連続は、スペクトル・ゲイン関数の時間変動性に起因する。この歪みを低減するには、本発明によると、以下の技術が用いられる。すなわち、周波数軸に沿ったスペクトル・ゲインの平滑化、バーク帯域ゲインの平均化(ゲインの瞬時値を用いるのではなく)、時間軸に沿ったスペクトル・ゲインの平滑化である。
92.周波数におけるゲイン平滑化:
周波数におけるゲインの急激な変化を回避するために、スペクトル・ゲインは、次の式によって与えられる指数平均化平滑化フィルタを用いて周波数軸に沿って平滑化される。
92.周波数におけるゲイン平滑化:
周波数におけるゲインの急激な変化を回避するために、スペクトル・ゲインは、次の式によって与えられる指数平均化平滑化フィルタを用いて周波数軸に沿って平滑化される。
ここで、εgfは周波数におけるゲイン平滑化ファクタであり、H(m,k)はスペクトル・ビン数kにおけるスペクトル・ゲインの瞬時値であり、H‘(m,k−1)はスペクトル・ビン数k−1における平滑化されたスペクトル・ゲインであり、H‘(m,k)はスペクトル・ビン数kにおける平滑化されたスペクトル・ゲインである。
93.平均バーク帯域ゲインの計算:
スペクトル・ゲインにおける急激な変化は、それぞれのバーク帯域におけるスペクトル・ゲインを平均化することによって、更に低減される。これにより、バーク帯域におけるすべてのスペクトル・ビンは、そのバーク帯域におけるすべてのスペクトル・ゲインの間の平均である同じスペクトル・ゲインを有することになる。帯域H‘avg(m,k)における平均のスペクトル・ゲインは、単純に、帯域の中のゲインの総和を当該帯域におけるビン数によって除算した値である。より高い周波数帯域の帯域幅はより低い周波数帯域の帯域幅よりも大きいので、スペクトル・ゲインの平均化は、より高い帯域においては、より低い帯域においてほどには、狭帯域雑音を低減することに関して効率的ではない。従って、平均化は、約1.35kHz未満の周波数成分を有する帯域についてだけ実行される。この限度は重要ではなく、好みや便宜やそれ以外の考慮に適するように経験的に調整が可能である。
94.時間に関するゲイン平滑化:
急激に変化する雑音を含む環境では、低周波数の雑音フラッタ(noise flutter)が強化された出力音声に導入される。このフラッタは、ほとんどのスペクトル減算ベースの雑音低減システムの副産物である。背景雑音が急激に変化し雑音評価がそのような急激な変化に適応できる場合には、スペクトル・ゲインもまた急激に変動してフラッタを生じる。低周波数フラッタは、次の式で与えられる1次指数平均化平滑化フィルタを用いて時間においてスペクトル・ゲインH“(m,k)を平滑化することによって低減される。
93.平均バーク帯域ゲインの計算:
スペクトル・ゲインにおける急激な変化は、それぞれのバーク帯域におけるスペクトル・ゲインを平均化することによって、更に低減される。これにより、バーク帯域におけるすべてのスペクトル・ビンは、そのバーク帯域におけるすべてのスペクトル・ゲインの間の平均である同じスペクトル・ゲインを有することになる。帯域H‘avg(m,k)における平均のスペクトル・ゲインは、単純に、帯域の中のゲインの総和を当該帯域におけるビン数によって除算した値である。より高い周波数帯域の帯域幅はより低い周波数帯域の帯域幅よりも大きいので、スペクトル・ゲインの平均化は、より高い帯域においては、より低い帯域においてほどには、狭帯域雑音を低減することに関して効率的ではない。従って、平均化は、約1.35kHz未満の周波数成分を有する帯域についてだけ実行される。この限度は重要ではなく、好みや便宜やそれ以外の考慮に適するように経験的に調整が可能である。
94.時間に関するゲイン平滑化:
急激に変化する雑音を含む環境では、低周波数の雑音フラッタ(noise flutter)が強化された出力音声に導入される。このフラッタは、ほとんどのスペクトル減算ベースの雑音低減システムの副産物である。背景雑音が急激に変化し雑音評価がそのような急激な変化に適応できる場合には、スペクトル・ゲインもまた急激に変動してフラッタを生じる。低周波数フラッタは、次の式で与えられる1次指数平均化平滑化フィルタを用いて時間においてスペクトル・ゲインH“(m,k)を平滑化することによって低減される。
ここで、f(k)はバーク帯域kの中心周波数であり、εgtは時間における平滑化ファクタであり、b(i)はスペクトル・ビンkのバーク帯域数であり、H‘(m,k)はフレーム・インデクスmにおける(周波数に関して)平滑化されたスペクトル・ゲインであり、H’(m−1,k)はフレーム・インデクスm−1における(周波数に関して)平滑化されたスペクトル・ゲインであり、H‘avg(m,k)はフレーム・インデクスmにおける(周波数に関して)平滑化され平均化されたスペクトル・ゲインである。
平滑化はパラメータεgtに対して敏感であるが、その理由は、過剰な平滑化は音声においてテールエンドのエコー(残響)又は雑音ポンピングを生じさせるからである。ゲイン平滑化の設定が高すぎると、音声振幅が著しく低減することがありうる。εgtの値としては0.1から0.3が適切である。例が与えられている他の値と同様に、特定の値は、この動作の前に信号がどのように処理されるかに依存する。例えば、ゲインがどのように用いられるかである。
76.逆離散フーリエ変換:
雑音を含まない音声スペクトルは、雑音を含む音声スペクトルをスペクトル・ゲイン関数とブロック75において乗算することによって得られる。これは減算のようには見えないかもしれないが、雑音を含まない音声評価は次の式によって与えられるという結論に至った上述の初期の発展を思い出してほしい。
76.逆離散フーリエ変換:
雑音を含まない音声スペクトルは、雑音を含む音声スペクトルをスペクトル・ゲイン関数とブロック75において乗算することによって得られる。これは減算のようには見えないかもしれないが、雑音を含まない音声評価は次の式によって与えられるという結論に至った上述の初期の発展を思い出してほしい。
減算は、乗算子H(f)に含まれている。
雑音を含まない音声スペクトルは、次の式で与えられる逆離散フーリエ変換を用いて時間領域に再度変換される。
雑音を含まない音声スペクトルは、次の式で与えられる逆離散フーリエ変換を用いて時間領域に再度変換される。
ここで、X(m,k)H(m,k)は雑音を含まない音声スペクトル評価であり、s(m,n)はフレームmにおける時間領域の雑音を含まない評価である。
77.合成ウィンドウ:
雑音を含まない音声は、合成ウィンドウを用いてウィンドウ化されることで、ブロックする歪みが低減される。
77.合成ウィンドウ:
雑音を含まない音声は、合成ウィンドウを用いてウィンドウ化されることで、ブロックする歪みが低減される。
78.オーバラップ及び加算:
最後に、ウィンドウ化された雑音を含まない音声が、次のように、重複(オーバラップ)され、前のフレームと加算される。
最後に、ウィンドウ化された雑音を含まない音声が、次のように、重複(オーバラップ)され、前のフレームと加算される。
ここで、sw(m−1,・・・)は前のフレームのウィンドウ化された雑音を含まない音声であり、sw(m,n)は現在のフレームのウィンドウ化された雑音を含まない音声であり、Dはオーバラップの量である。Dは、上述したように、本発明のある実施例では32である。
本発明は、このようにして、修正されたドブリンガ雑音評価と、サブバンド・ベースのワイナ・フィルタリングと、サブバンド・ゲインの計算と、それぞれのサブバンドにおけるSNR調整されたゲインと、ゲイン平滑化と、台形型ウィンドウの25%のオーバラップとによって、雑音の抑制を向上させる。この組合せによって、計算量は、従来技術によるほぼ5MIPSと比較して、より低いMIPSに低減される(テキサス・インスツルメンツ社のC55xxプロセッサでは2MIPS未満であり、2k未満のデータ・メモリを用いたモトローラ社のスターコア(Starcore)SC140においては1MIPS未満)。更に、音楽的なトーンの歪みもより少なく、抑制の後で残っている背景雑音についても気が付く程の変化はない。
以上で本発明について説明したが、この技術分野の当業者にとっては、本発明の範囲の中で様々な修正が可能であることは明らかである。例えば、バーク帯域モデルの使用は望ましいが必須ではない。帯域通過フィルタは、他の進行パターンに従うことができる。
Claims (15)
- 入力信号をそれぞれが複数のサンプルを含む複数のフレームに分割する解析回路と、雑音評価を計算する回路と、前記雑音評価を前記入力信号から減算する回路と、前記フレームを出力信号に再構成する合成回路とを含む雑音抑制回路であって、
入力信号を複数の帯域に分割する複数の帯域通過フィルタと、
それぞれの帯域におけるそれぞれのフレームの信号対雑音比と逆比例する雑音抑制ファクタを計算する手段と、
を含むことを特徴とする雑音抑制回路。 - 請求項1記載の雑音抑制回路において、前記帯域通過フィルタはバーク帯域を定義することを特徴とする雑音抑制回路。
- 請求項2記載の雑音抑制回路において、雑音評価を計算する前記回路におけるスペクトル・ゲインを制限する回路を更に含むことを特徴とする雑音抑制回路。
- 請求項3記載の雑音抑制回路において、音声検出器を更に含んでおり、前記スペクトル・ゲインの制限は、音声が検出されないときよりも音声が検出されるときの方が高いことを特徴とする雑音抑制回路。
- 請求項3記載の雑音抑制回路において、雑音評価を計算する前記回路に結合された第1の平滑化回路を更に含んでおり、前記第1の平滑化回路は前記入力信号の周波数スペクトルにおけるゲインを平滑化することを特徴とする雑音抑制回路。
- 請求項5記載の雑音抑制回路において、前記第1の平滑化回路は約2kHz未満の帯域におけるゲインを平滑化することを特徴とする雑音抑制回路。
- 請求項1記載の雑音抑制回路において、雑音評価を計算する前記回路は、
雑音を含む音声スペクトルの雑音評価からの逸脱が所定の値よりも大きいときには、雑音を含む音声スペクトルの雑音評価からの逸脱が所定の値未満であるときよりも小さな時定数でフレームの雑音評価を更新することにより、前記雑音評価を減少させフレーム間での評価の変化を低速化する平滑化フィルタを含むことを特徴とする雑音抑制回路。 - 請求項7記載の雑音抑制回路において、前記フィルタは1次指数平均化平滑化フィルタであることを特徴とする雑音抑制回路。
- 入力信号をそれぞれが複数のサンプルを含む複数のフレームに分割する解析回路と、雑音評価を計算する回路と、前記雑音評価を前記入力信号から減算する回路と、前記フレームを出力信号に再構成する合成回路とを含む雑音抑制回路であって、
雑音評価を計算する回路の中に平滑化フィルタを含み、前記平滑化フィルタは、雑音を含む音声スペクトルの雑音評価からの逸脱が所定の値よりも大きいときには、雑音を含む音声スペクトルの雑音評価からの逸脱が所定の値未満であるときよりも小さな時定数でフレームの雑音評価を更新することにより、前記雑音評価を減少させフレーム間での評価の変化を低速化することを特徴とする雑音抑制回路。 - 請求項9記載の雑音抑制回路において、それぞれのフレームの信号対雑音比と逆比例する雑音抑制ファクタを調整する回路を更に含むことを特徴とする雑音抑制回路。
- 請求項10記載の雑音抑制回路において、前記入力信号のそれぞれのフレームの離散フーリエ変換を計算してそれぞれのフレームを周波数領域に変換する回路を更に含むことを特徴とする雑音抑制回路。
- 請求項11記載の雑音抑制回路において、離散フーリエ変換を計算する前記回路は、前記フレームを段々により高い中心周波数を有する複数の帯域に分割することを特徴とする雑音抑制回路。
- 請求項12記載の雑音抑制回路において、前記帯域はバーク帯域であることを特徴とする雑音抑制回路。
- 受信チャネルと送信チャネルとを含む音声処理回路を有する電話機であって、前記チャネルの少なくとも一方に請求項1記載の雑音抑制回路を含むことを特徴とする電話機。
- 受信チャネルと送信チャネルとを含む音声処理回路を有する電話機であって、前記チャネルの少なくとも一方に請求項9記載の雑音抑制回路を含むことを特徴とする電話機。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/830,652 US7492889B2 (en) | 2004-04-23 | 2004-04-23 | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
PCT/US2005/013164 WO2005109404A2 (en) | 2004-04-23 | 2005-04-18 | Noise suppression based upon bark band weiner filtering and modified doblinger noise estimate |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007535698A true JP2007535698A (ja) | 2007-12-06 |
Family
ID=35137588
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007509545A Withdrawn JP2007535698A (ja) | 2004-04-23 | 2005-04-18 | バーク帯域ワイナ・フィルタリング及び修正されたドブリンガ雑音評価に基づく雑音抑制 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7492889B2 (ja) |
EP (1) | EP1745469A4 (ja) |
JP (1) | JP2007535698A (ja) |
KR (1) | KR100851716B1 (ja) |
CN (1) | CN101142800A (ja) |
WO (1) | WO2005109404A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010102199A (ja) * | 2008-10-24 | 2010-05-06 | Yamaha Corp | 雑音抑圧装置及び雑音抑圧方法 |
JP2012231468A (ja) * | 2011-04-26 | 2012-11-22 | Parrot | 特に「ハンズフリー」電話システム向けの近接音声信号を雑音除去するための手段を有するマイクロホンとイヤホンの組合せ型のオーディオ・ヘッドセット |
JP2015529847A (ja) * | 2012-08-01 | 2015-10-08 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ノイズ削減利得の百分位数フィルタリング |
Families Citing this family (145)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7117149B1 (en) | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
EP2242049B1 (en) * | 2001-03-28 | 2019-08-07 | Mitsubishi Denki Kabushiki Kaisha | Noise suppression device |
US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7725315B2 (en) * | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US7885420B2 (en) | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US7895036B2 (en) * | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US7383179B2 (en) * | 2004-09-28 | 2008-06-03 | Clarity Technologies, Inc. | Method of cascading noise reduction algorithms to avoid speech distortion |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8170879B2 (en) | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US8284947B2 (en) * | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
US20060184363A1 (en) * | 2005-02-17 | 2006-08-17 | Mccree Alan | Noise suppression |
US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US8311819B2 (en) * | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
CN100539437C (zh) * | 2005-07-29 | 2009-09-09 | 上海杰得微电子有限公司 | 一种音频编解码器的实现方法 |
JP4172530B2 (ja) * | 2005-09-02 | 2008-10-29 | 日本電気株式会社 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
JP4863713B2 (ja) * | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
GB2437559B (en) * | 2006-04-26 | 2010-12-22 | Zarlink Semiconductor Inc | Low complexity noise reduction method |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
KR100835993B1 (ko) * | 2006-11-30 | 2008-06-09 | 한국전자통신연구원 | 마스킹 확률을 이용한 음성 인식 전처리 방법 및 전처리장치 |
US8335685B2 (en) | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US9966085B2 (en) * | 2006-12-30 | 2018-05-08 | Google Technology Holdings LLC | Method and noise suppression circuit incorporating a plurality of noise suppression techniques |
KR101414233B1 (ko) * | 2007-01-05 | 2014-07-02 | 삼성전자 주식회사 | 음성 신호의 명료도를 향상시키는 장치 및 방법 |
WO2008106036A2 (en) | 2007-02-26 | 2008-09-04 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
JP5186510B2 (ja) * | 2007-03-19 | 2013-04-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | スピーチ明瞭度強化方法と装置 |
JP5260561B2 (ja) * | 2007-03-19 | 2013-08-14 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 知覚モデルを使用した音声の強調 |
DE602007004217D1 (de) * | 2007-08-31 | 2010-02-25 | Harman Becker Automotive Sys | Schnelle Schätzung der Spektraldichte der Rauschleistung zur Sprachsignalverbesserung |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8538763B2 (en) * | 2007-09-12 | 2013-09-17 | Dolby Laboratories Licensing Corporation | Speech enhancement with noise level estimation adjustment |
JP5302968B2 (ja) * | 2007-09-12 | 2013-10-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 音声明瞭化を伴うスピーチ改善 |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
JP5191750B2 (ja) * | 2008-01-25 | 2013-05-08 | 川崎重工業株式会社 | 音響装置 |
US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
US8606573B2 (en) * | 2008-03-28 | 2013-12-10 | Alon Konchitsky | Voice recognition improved accuracy in mobile environments |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
KR101475724B1 (ko) * | 2008-06-09 | 2014-12-30 | 삼성전자주식회사 | 오디오 신호 품질 향상 장치 및 방법 |
JP5453740B2 (ja) * | 2008-07-02 | 2014-03-26 | 富士通株式会社 | 音声強調装置 |
US8538749B2 (en) * | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
EP2164066B1 (en) * | 2008-09-15 | 2016-03-09 | Oticon A/S | Noise spectrum tracking in noisy acoustical signals |
JP5153886B2 (ja) * | 2008-10-24 | 2013-02-27 | 三菱電機株式会社 | 雑音抑圧装置および音声復号化装置 |
JP5157852B2 (ja) * | 2008-11-28 | 2013-03-06 | 富士通株式会社 | 音声信号処理評価プログラム、音声信号処理評価装置 |
US9202456B2 (en) * | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
ES2526126T3 (es) * | 2009-08-14 | 2015-01-07 | Koninklijke Kpn N.V. | Método, producto de programa informático y sistema para determinar una calidad percibida de un sistema de audio |
CN102117618B (zh) * | 2009-12-30 | 2012-09-05 | 华为技术有限公司 | 一种消除音乐噪声的方法、装置及系统 |
US10403302B2 (en) | 2010-04-27 | 2019-09-03 | Yobe, Inc. | Enhancing audio content for voice isolation and biometric identification by adjusting high frequency attack and release times |
US9449612B2 (en) | 2010-04-27 | 2016-09-20 | Yobe, Inc. | Systems and methods for speech processing via a GUI for adjusting attack and release times |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
US8908877B2 (en) | 2010-12-03 | 2014-12-09 | Cirrus Logic, Inc. | Ear-coupling detection and adjustment of adaptive response in noise-canceling in personal audio devices |
JP5937611B2 (ja) | 2010-12-03 | 2016-06-22 | シラス ロジック、インコーポレイテッド | パーソナルオーディオデバイスにおける適応ノイズキャンセラの監視制御 |
US20120143604A1 (en) * | 2010-12-07 | 2012-06-07 | Rita Singh | Method for Restoring Spectral Components in Denoised Speech Signals |
US8583429B2 (en) * | 2011-02-01 | 2013-11-12 | Wevoice Inc. | System and method for single-channel speech noise reduction |
CN102208190B (zh) * | 2011-05-06 | 2012-11-28 | 声科科技(南京)有限公司 | 抑制非平稳噪声设备收敛时间的测量方法及装置 |
US9214150B2 (en) | 2011-06-03 | 2015-12-15 | Cirrus Logic, Inc. | Continuous adaptation of secondary path adaptive response in noise-canceling personal audio devices |
US8958571B2 (en) * | 2011-06-03 | 2015-02-17 | Cirrus Logic, Inc. | MIC covering detection in personal audio devices |
US9076431B2 (en) | 2011-06-03 | 2015-07-07 | Cirrus Logic, Inc. | Filter architecture for an adaptive noise canceler in a personal audio device |
US9824677B2 (en) | 2011-06-03 | 2017-11-21 | Cirrus Logic, Inc. | Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC) |
US8948407B2 (en) | 2011-06-03 | 2015-02-03 | Cirrus Logic, Inc. | Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC) |
US9318094B2 (en) | 2011-06-03 | 2016-04-19 | Cirrus Logic, Inc. | Adaptive noise canceling architecture for a personal audio device |
US9711162B2 (en) * | 2011-07-05 | 2017-07-18 | Texas Instruments Incorporated | Method and apparatus for environmental noise compensation by determining a presence or an absence of an audio event |
KR101422984B1 (ko) * | 2011-07-08 | 2014-07-23 | 고어텍 인크 | 잔류 에코를 억제하는 방법 및 장치 |
US9325821B1 (en) * | 2011-09-30 | 2016-04-26 | Cirrus Logic, Inc. | Sidetone management in an adaptive noise canceling (ANC) system including secondary path modeling |
JP2013148724A (ja) * | 2012-01-19 | 2013-08-01 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US9014387B2 (en) | 2012-04-26 | 2015-04-21 | Cirrus Logic, Inc. | Coordinated control of adaptive noise cancellation (ANC) among earspeaker channels |
US9142205B2 (en) | 2012-04-26 | 2015-09-22 | Cirrus Logic, Inc. | Leakage-modeling adaptive noise canceling for earspeakers |
US9318090B2 (en) | 2012-05-10 | 2016-04-19 | Cirrus Logic, Inc. | Downlink tone detection and adaptation of a secondary path response model in an adaptive noise canceling system |
US9082387B2 (en) | 2012-05-10 | 2015-07-14 | Cirrus Logic, Inc. | Noise burst adaptation of secondary path adaptive response in noise-canceling personal audio devices |
US9076427B2 (en) | 2012-05-10 | 2015-07-07 | Cirrus Logic, Inc. | Error-signal content controlled adaptation of secondary and leakage path models in noise-canceling personal audio devices |
US9123321B2 (en) | 2012-05-10 | 2015-09-01 | Cirrus Logic, Inc. | Sequenced adaptation of anti-noise generator response and secondary path response in an adaptive noise canceling system |
US9319781B2 (en) | 2012-05-10 | 2016-04-19 | Cirrus Logic, Inc. | Frequency and direction-dependent ambient sound handling in personal audio devices having adaptive noise cancellation (ANC) |
WO2014039028A1 (en) * | 2012-09-04 | 2014-03-13 | Nuance Communications, Inc. | Formant dependent speech signal enhancement |
US9532139B1 (en) | 2012-09-14 | 2016-12-27 | Cirrus Logic, Inc. | Dual-microphone frequency amplitude response self-calibration |
EP2943954B1 (en) * | 2013-01-08 | 2018-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Improving speech intelligibility in background noise by speech-intelligibility-dependent amplification |
US9349383B2 (en) * | 2013-01-29 | 2016-05-24 | 2236008 Ontario Inc. | Audio bandwidth dependent noise suppression |
US9107010B2 (en) * | 2013-02-08 | 2015-08-11 | Cirrus Logic, Inc. | Ambient noise root mean square (RMS) detector |
US9369798B1 (en) | 2013-03-12 | 2016-06-14 | Cirrus Logic, Inc. | Internal dynamic range control in an adaptive noise cancellation (ANC) system |
US9106989B2 (en) | 2013-03-13 | 2015-08-11 | Cirrus Logic, Inc. | Adaptive-noise canceling (ANC) effectiveness estimation and correction in a personal audio device |
US9414150B2 (en) | 2013-03-14 | 2016-08-09 | Cirrus Logic, Inc. | Low-latency multi-driver adaptive noise canceling (ANC) system for a personal audio device |
US9215749B2 (en) | 2013-03-14 | 2015-12-15 | Cirrus Logic, Inc. | Reducing an acoustic intensity vector with adaptive noise cancellation with two error microphones |
US9635480B2 (en) | 2013-03-15 | 2017-04-25 | Cirrus Logic, Inc. | Speaker impedance monitoring |
US9467776B2 (en) | 2013-03-15 | 2016-10-11 | Cirrus Logic, Inc. | Monitoring of speaker impedance to detect pressure applied between mobile device and ear |
US9208771B2 (en) | 2013-03-15 | 2015-12-08 | Cirrus Logic, Inc. | Ambient noise-based adaptation of secondary path adaptive response in noise-canceling personal audio devices |
US9502020B1 (en) | 2013-03-15 | 2016-11-22 | Cirrus Logic, Inc. | Robust adaptive noise canceling (ANC) in a personal audio device |
US10206032B2 (en) | 2013-04-10 | 2019-02-12 | Cirrus Logic, Inc. | Systems and methods for multi-mode adaptive noise cancellation for audio headsets |
US9066176B2 (en) | 2013-04-15 | 2015-06-23 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation including dynamic bias of coefficients of an adaptive noise cancellation system |
US9462376B2 (en) | 2013-04-16 | 2016-10-04 | Cirrus Logic, Inc. | Systems and methods for hybrid adaptive noise cancellation |
US9478210B2 (en) | 2013-04-17 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for hybrid adaptive noise cancellation |
US9460701B2 (en) | 2013-04-17 | 2016-10-04 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation by biasing anti-noise level |
US9578432B1 (en) | 2013-04-24 | 2017-02-21 | Cirrus Logic, Inc. | Metric and tool to evaluate secondary path design in adaptive noise cancellation systems |
US9264808B2 (en) | 2013-06-14 | 2016-02-16 | Cirrus Logic, Inc. | Systems and methods for detection and cancellation of narrow-band noise |
US10262680B2 (en) * | 2013-06-28 | 2019-04-16 | Adobe Inc. | Variable sound decomposition masks |
US9392364B1 (en) | 2013-08-15 | 2016-07-12 | Cirrus Logic, Inc. | Virtual microphone for adaptive noise cancellation in personal audio devices |
US9666176B2 (en) | 2013-09-13 | 2017-05-30 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation by adaptively shaping internal white noise to train a secondary path |
US9620101B1 (en) | 2013-10-08 | 2017-04-11 | Cirrus Logic, Inc. | Systems and methods for maintaining playback fidelity in an audio system with adaptive noise cancellation |
DE102013111784B4 (de) * | 2013-10-25 | 2019-11-14 | Intel IP Corporation | Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren |
US10219071B2 (en) | 2013-12-10 | 2019-02-26 | Cirrus Logic, Inc. | Systems and methods for bandlimiting anti-noise in personal audio devices having adaptive noise cancellation |
US9704472B2 (en) | 2013-12-10 | 2017-07-11 | Cirrus Logic, Inc. | Systems and methods for sharing secondary path information between audio channels in an adaptive noise cancellation system |
US10382864B2 (en) | 2013-12-10 | 2019-08-13 | Cirrus Logic, Inc. | Systems and methods for providing adaptive playback equalization in an audio device |
ES2941782T3 (es) | 2013-12-19 | 2023-05-25 | Ericsson Telefon Ab L M | Estimación de ruido de fondo en señales de audio |
US9369557B2 (en) | 2014-03-05 | 2016-06-14 | Cirrus Logic, Inc. | Frequency-dependent sidetone calibration |
US9479860B2 (en) | 2014-03-07 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for enhancing performance of audio transducer based on detection of transducer status |
US9648410B1 (en) | 2014-03-12 | 2017-05-09 | Cirrus Logic, Inc. | Control of audio output of headphone earbuds based on the environment around the headphone earbuds |
US9319784B2 (en) | 2014-04-14 | 2016-04-19 | Cirrus Logic, Inc. | Frequency-shaped noise-based adaptation of secondary path adaptive response in noise-canceling personal audio devices |
WO2015191470A1 (en) | 2014-06-09 | 2015-12-17 | Dolby Laboratories Licensing Corporation | Noise level estimation |
US9609416B2 (en) | 2014-06-09 | 2017-03-28 | Cirrus Logic, Inc. | Headphone responsive to optical signaling |
US10181315B2 (en) | 2014-06-13 | 2019-01-15 | Cirrus Logic, Inc. | Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system |
US9478212B1 (en) | 2014-09-03 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device |
US10366703B2 (en) * | 2014-10-01 | 2019-07-30 | Samsung Electronics Co., Ltd. | Method and apparatus for processing audio signal including shock noise |
US9886966B2 (en) * | 2014-11-07 | 2018-02-06 | Apple Inc. | System and method for improving noise suppression using logistic function and a suppression target value for automatic speech recognition |
US9552805B2 (en) | 2014-12-19 | 2017-01-24 | Cirrus Logic, Inc. | Systems and methods for performance and stability control for feedback adaptive noise cancellation |
KR102409536B1 (ko) | 2015-08-07 | 2022-06-17 | 시러스 로직 인터내셔널 세미컨덕터 리미티드 | 오디오 디바이스에서 재생 관리를 위한 사건 검출 |
KR102688257B1 (ko) | 2015-08-20 | 2024-07-26 | 시러스 로직 인터내셔널 세미컨덕터 리미티드 | 피드백 적응적 잡음 소거(anc) 제어기 및 고정 응답 필터에 의해 부분적으로 제공되는 피드백 응답을 갖는 방법 |
US9578415B1 (en) | 2015-08-21 | 2017-02-21 | Cirrus Logic, Inc. | Hybrid adaptive noise cancellation system with filtered error microphone signal |
CN108353225B (zh) * | 2015-10-30 | 2020-09-22 | 三菱电机株式会社 | 免提控制装置 |
US10013966B2 (en) | 2016-03-15 | 2018-07-03 | Cirrus Logic, Inc. | Systems and methods for adaptive active noise cancellation for multiple-driver personal audio device |
GB2558529A (en) * | 2016-09-11 | 2018-07-18 | Continental automotive systems inc | Dynamically increased noise suppression based on input noise characteristics |
DE102017215890B4 (de) * | 2016-09-11 | 2020-01-30 | Continental Automotive Systems, Inc. | Verfahren zur dynamisch erhöhten Geräuschunterdrückung auf der Basis von Eingangsgeräuschkennlinien |
US10242696B2 (en) | 2016-10-11 | 2019-03-26 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications |
US10475471B2 (en) | 2016-10-11 | 2019-11-12 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications using a neural network |
US11373667B2 (en) * | 2017-04-19 | 2022-06-28 | Synaptics Incorporated | Real-time single-channel speech enhancement in noisy and time-varying environments |
US10395667B2 (en) | 2017-05-12 | 2019-08-27 | Cirrus Logic, Inc. | Correlation-based near-field detector |
US10297267B2 (en) | 2017-05-15 | 2019-05-21 | Cirrus Logic, Inc. | Dual microphone voice processing for headsets with variable microphone array orientation |
US10504538B2 (en) * | 2017-06-01 | 2019-12-10 | Sorenson Ip Holdings, Llc | Noise reduction by application of two thresholds in each frequency band in audio signals |
US10540983B2 (en) * | 2017-06-01 | 2020-01-21 | Sorenson Ip Holdings, Llc | Detecting and reducing feedback |
CN107437418A (zh) * | 2017-07-28 | 2017-12-05 | 深圳市益鑫智能科技有限公司 | 车载语音识别电子娱乐控制系统 |
CN108022591B (zh) * | 2017-12-30 | 2021-03-16 | 北京百度网讯科技有限公司 | 车内环境中语音识别的处理方法、装置和电子设备 |
US10885907B2 (en) | 2018-02-14 | 2021-01-05 | Cirrus Logic, Inc. | Noise reduction system and method for audio device with multiple microphones |
CN111508519B (zh) * | 2020-04-03 | 2022-04-26 | 北京达佳互联信息技术有限公司 | 一种音频信号人声增强的方法及装置 |
CN111986660A (zh) * | 2020-08-26 | 2020-11-24 | 深圳信息职业技术学院 | 一种神经网络子带建模的单通道语音增强方法、系统及存储介质 |
US11984107B2 (en) * | 2022-07-13 | 2024-05-14 | Analog Devices International Unlimited Company | Audio signal processing method and system for echo suppression using an MMSE-LSA estimator |
CN117434153B (zh) * | 2023-12-20 | 2024-03-05 | 吉林蛟河抽水蓄能有限公司 | 基于超声波技术的道路无损检测方法及系统 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3180936A (en) | 1960-12-01 | 1965-04-27 | Bell Telephone Labor Inc | Apparatus for suppressing noise and distortion in communication signals |
US3403224A (en) | 1965-05-28 | 1968-09-24 | Bell Telephone Labor Inc | Processing of communications signals to reduce effects of noise |
US4644108A (en) * | 1982-10-27 | 1987-02-17 | International Business Machines Corporation | Adaptive sub-band echo suppressor |
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4811404A (en) | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
IL84948A0 (en) | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
JPH07261797A (ja) * | 1994-03-18 | 1995-10-13 | Mitsubishi Electric Corp | 信号符号化装置及び信号復号化装置 |
US5774846A (en) | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
US6263307B1 (en) | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US6097820A (en) | 1996-12-23 | 2000-08-01 | Lucent Technologies Inc. | System and method for suppressing noise in digitally represented voice signals |
US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
US6088668A (en) | 1998-06-22 | 2000-07-11 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
US6760435B1 (en) * | 2000-02-08 | 2004-07-06 | Lucent Technologies Inc. | Method and apparatus for network speech enhancement |
-
2004
- 2004-04-23 US US10/830,652 patent/US7492889B2/en active Active
-
2005
- 2005-04-18 JP JP2007509545A patent/JP2007535698A/ja not_active Withdrawn
- 2005-04-18 CN CNA2005800127571A patent/CN101142800A/zh active Pending
- 2005-04-18 KR KR1020067024494A patent/KR100851716B1/ko not_active IP Right Cessation
- 2005-04-18 WO PCT/US2005/013164 patent/WO2005109404A2/en active Application Filing
- 2005-04-18 EP EP05738461A patent/EP1745469A4/en not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010102199A (ja) * | 2008-10-24 | 2010-05-06 | Yamaha Corp | 雑音抑圧装置及び雑音抑圧方法 |
JP2012231468A (ja) * | 2011-04-26 | 2012-11-22 | Parrot | 特に「ハンズフリー」電話システム向けの近接音声信号を雑音除去するための手段を有するマイクロホンとイヤホンの組合せ型のオーディオ・ヘッドセット |
JP2015529847A (ja) * | 2012-08-01 | 2015-10-08 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ノイズ削減利得の百分位数フィルタリング |
Also Published As
Publication number | Publication date |
---|---|
EP1745469A2 (en) | 2007-01-24 |
KR100851716B1 (ko) | 2008-08-11 |
US7492889B2 (en) | 2009-02-17 |
WO2005109404A2 (en) | 2005-11-17 |
US20050240401A1 (en) | 2005-10-27 |
KR20070037439A (ko) | 2007-04-04 |
CN101142800A (zh) | 2008-03-12 |
WO2005109404A3 (en) | 2007-11-22 |
EP1745469A4 (en) | 2008-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100851716B1 (ko) | 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제 | |
US7649988B2 (en) | Comfort noise generator using modified Doblinger noise estimate | |
US7454010B1 (en) | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation | |
AU756511B2 (en) | Signal noise reduction by spectral subtraction using linear convolution and causal filtering | |
US6549586B2 (en) | System and method for dual microphone signal noise reduction using spectral subtraction | |
US8326616B2 (en) | Dynamic noise reduction using linear model fitting | |
US8249861B2 (en) | High frequency compression integration | |
EP1252796B1 (en) | System and method for dual microphone signal noise reduction using spectral subtraction | |
EP1046273B1 (en) | Methods and apparatus for providing comfort noise in communications systems | |
US8521530B1 (en) | System and method for enhancing a monaural audio signal | |
CN111554315B (zh) | 单通道语音增强方法及装置、存储介质、终端 | |
EP1080463B1 (en) | Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging | |
US6510224B1 (en) | Enhancement of near-end voice signals in an echo suppression system | |
JP2002541753A (ja) | 固定フィルタを用いた時間領域スペクトラル減算による信号雑音の低減 | |
JP2010532879A (ja) | アダプティブ・インテリジェント・ノイズ抑制システム及び方法 | |
US6507623B1 (en) | Signal noise reduction by time-domain spectral subtraction | |
JP2002521945A (ja) | 通信端末 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20090723 |