JP4989967B2 - ノイズ低減のための方法および装置 - Google Patents
ノイズ低減のための方法および装置 Download PDFInfo
- Publication number
- JP4989967B2 JP4989967B2 JP2006517910A JP2006517910A JP4989967B2 JP 4989967 B2 JP4989967 B2 JP 4989967B2 JP 2006517910 A JP2006517910 A JP 2006517910A JP 2006517910 A JP2006517910 A JP 2006517910A JP 4989967 B2 JP4989967 B2 JP 4989967B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- signal
- filter
- reference signal
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000009467 reduction Effects 0.000 title description 36
- 238000001914 filtration Methods 0.000 claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims description 54
- 230000002829 reductive effect Effects 0.000 claims description 17
- 230000000903 blocking effect Effects 0.000 claims description 16
- 230000005236 sound signal Effects 0.000 claims 14
- 239000000872 buffer Substances 0.000 description 23
- 230000000694 effects Effects 0.000 description 19
- 239000013598 vector Substances 0.000 description 19
- 230000006870 function Effects 0.000 description 17
- 230000003044 adaptive effect Effects 0.000 description 16
- 238000010606 normalization Methods 0.000 description 16
- 230000035945 sensitivity Effects 0.000 description 12
- 238000012935 Averaging Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000003491 array Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 230000003111 delayed effect Effects 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 230000007774 longterm Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000002821 scintillation proximity assay Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/25—Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/407—Circuits for combining signals of a plurality of transducers
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
先行技術の開示
一般化されたサイドローブ・キャンセラー(GSC)
ビームを望ましい信号の方向へ導くことにより、固定ビームフォーマーA(z)(例えば遅延および合計)は、発話寄与y0 s[k]およびノイズ寄与y0 n[k]を含む、いわゆる発話参照
を作成する。ブロッキング・マトリックスB(z)は、ノイズ寄与yi n[k]が発話リーク寄与yi s[k]と比較して支配的となるように望ましい信号ソースの方向をゼロに導くことにより、いわゆるノイズ参照M−1
を作成する。のちほど、サブスクリプトのsおよびnは、発話および信号のノイズ寄与を参照するために使用される。発話+ノイズの期間において、ノイズ参照yi[k], i=0...M-1は発話+ノイズを含む。ノイズのみの期間において、ノイズ参照はノイズ成分のみからなり、すなわち、yi[k]=yi n[k]である。ノイズ信号の二次統計は、それらがノイズのみの期間において推定できるように極めて固定されているとみなされる。
ここで、
が、ノイズのみの期間において適合される。(時間が支配要素となる実施において、適合フィルタW1:M-1およびフィルタW1:M-1の入力信号は実数となる。のちほど、式が複素数の入力信号に一般化され、それらはサブバンドの実施にもまた適応することができる。)そのため、ANCフィルタW1:M-1は出力ノイズパワーを最少化する、例えば、
続いて
ここで
であり、Δは発話参照がフィルタW1:M-1における一般的でない盗聴を許すよう発話参照に適用される遅延である。遅延Δは通常[L/2]に設定されており、ここで、[x]はxと同じまたはそれ以上の最も小さい整数を示す。W1:M-1およびY1:M-1中のサブスクリプト1:M-1は、適合フィルタおよび入力ベクトルの最初と最後のチャンネル成分のサブスクリプトをそれぞれ参照する。
また、固定ビームフォーマーA(Z)は、全ての可能性のあるモデルエラーに対し、発話参照y0 s[k]中の歪みが最小となるよう設計されるべきである。結局、遅延/合計ビームフォーマーが使用される。小さいサイズのアレイにおいて、このビームフォーマーは信号モデルエラーに対する十分なローバスト性を提供し、それはノイズ感度を最小化する。ノイズ感度は、望ましい信号の利得に対する空間的なホワイトノイズの利得の比として定義され、しばしば、仮定された信号モデル中のエラーに対するアルゴリズムの感度を定量化するために使用される。実際に起きる信号モデルのエラーについて統計的な知識が与えられると、固定ビームフォーマーおよびブロック・マトリックスをさらに最適化することができる。
QICはフィルタの係数W1:M-1の過度の成長を阻害する。そのため、発話がノイズ参照中へ漏れた場合に望ましくない発話歪みを減少させる。QIC−GSCは、それぞれのアップデートステップで、WH 1:M-1W1:M-1がβ2を超えた時に、二次元の制限を
でフィルタの係数をスケーリングすることで新たに得られたANCフィルタに適用する:適合スケール・プロジェクション・アルゴリズム(SPA)を使用することで、実行することができる。最近、Tian et al.は、バリアブル・ローディングを使用して二次元の制限を実行した('Recursive quadratic implementation for LCMP Beamforming under quadratic constraint', IEEE Trans. Signal Processing, vol. 49, no. 6, pp. 1138-1145, June 2001)。帰納的な最小2乗法(RLS)に対し、この技術は、スケールド・プロジェクション・アルゴリズムよりも最適解(式11)に対しより良い近似を与える。
複数チャンネル・ウィナー・フィルタリング(MWF)
は、i番目(例えば1番目)のマイクロフォンでの(未知の)発話信号ui s[k-Δ]の遅延させたバージョンとMフィルタリング処理したマイクロフォン信号の合計
との間の平均2乗誤差(MSE)を最小化し、すなわち、以下のように表すことができる:
この式から以下の式となる;
ここで、
であり、また、ui[k]は発話成分とノイズ成分とを備える。
である。発話成分ui s[k-Δ]の推定値z[k]は、遅延させたi番目のマイクロフォン信号ui[k-Δ]からui n[k-Δ]の推定値w1:M Hu1:M[k]を引くことによって以下のように得られる:すなわち、
これは図2においてui n[k-Δ]=u1 n[k-Δ]として記載される。
以下の式に分解される:
ここで、εd 2は発話歪みエネルギーと同じであり、εn 2は残余ノイズエネルギーと同じである。MWFの設計基準は、重み付け因子μをμ∈[0,∞]で内挿することによって、以下の式のように、発話歪みとノイズ・リダクションとの間のトレードオフを許すように一般化されることができる:
(式23)の解は以下の式によって与えられる:
結果として、以下の式が得られる:
結局、(式26)は発話歪みで重み付けした複数チャンネル・ウィナー・フィルタ(SDW−MWF)として参照される。要素μ∈[0,∞]は発話歪みとノイズ・リダクションとをトレードオフする。μ=1のとき、MMSEの基準となる(式12)または(式17)が得られる。μ>1のとき、残存ノイズのレベルは、増加した発話歪みにより減少する。μを∞にセットすることで、ノイズ・リダクションが強調され、発話歪みは完全に無視される。これに対しμを0にセットすることで、ノイズ・リダクションが全く行われない結果となる。
は知られていない。発話期間の間、入力であるui[k]は、発話+ノイズすなわち
から構成される。ノイズ期間間、ノイズ成分であるui n[k]のみが観察される。発話信号とノイズ信号とが相関しないと仮定すると、
を以下の式のように推定できる:
ここで、二次統計量
は発話+ノイズの間評価され、二次統計量
はノイズの期間の間でのみ評価される。GSCでは、そのためローバスト性の発話検知が必要となる。(式27)、(式24)および(式26)を使用して、以下のように書き直すことができる:
および
ウィナー・フィルタは、発話+ノイズおよびノイズデータマトリックスの一般化されたシンギュラー・バリュー・デコンポジション(GSVD)によって、各時間点kで計算することができる。QRデコンポジションに基づくより安価な再帰的な手段を用いることもできる。また、サブバンドでの実行は、結果としての発話理解度を増加して複雑さを減少し、補聴器の応用としてそれを好適とする。
発明の目的
発明の要約
ノイズを有する少なくとも2種類(バージョン)の発話信号(音声信号)を第1のフィルタに適用する工程であって、第1のフィルタが、発話参照信号と少なくとも1つのノイズ参照信号とを出力する工程と、
少なくとも1つのノイズ参照信号の各々にフィルタリング操作を適用する工程と、
発話参照信号からフィルタリング処理したノイズ参照信号の各々を差し引く工程と、を備える方法であって、
フィルタリング操作が、少なくとも1つのノイズ参照信号中の発話リークの寄与を考慮して決定されるフィルタ係数を有するフィルタを用いて実行されることを特徴とするノイズを有する発話信号のノイズを低減するための方法に関するものである。
・少なくとも2つの入力を有し、発話参照信号および少なくとも1つのノイズ参照信号を出力するために設けられた第1のフィルタと、
・そこへ発話参照信号を適用するフィルタおよびそこへ少なくとも1つのノイズ参照信号を適用するフィルタと、
・発話参照信号から、フィルタリングされた発話参照信号およびフィルタリングされたノイズ参照信号の各々を差し引くための加算手段と、を備え、
ノイズを有する発話信号におけるノイズを減少するための信号処理回路に関する。
本発明を、以下詳細に記載する。まず第1に、本発明で提案される適合複数チャンネル・リダクション技術を、空間的に前処理された発話歪みで重み付けされた複数チャンネル・ウィナー・フィルタを参照して、記載する。
空間的に前処理されたSDW複数チャンネル・ウィナー・フィルタ
概念
を与えると、固定ビームフォーマーA(z)は、いわゆる発話参照
を、ビームを望ましい信号の方向に向けることで作り出し、上記発話参照は発話寄与y0 s[k]およびノイズ寄与y0 n[k]を備えている。MWFのローバスト性の効果を維持するために、固定ビームフォーマーA(z)は、発話参照y0 s[k]中の歪みが、マイクロフォンミスマッチのように、仮定した信号モデルにおけるすべての可能なエラーが最小となるよう設計すべきである。その後、遅延/合計ビームフォーマーが使用される。小さいサイズのアレイに対し、このビームフォーマーは、ノイズ感度を最小にすることで、信号モデルエラーに対し十分なローバスト性を提供する。実際に起きる信号モデルエラーについての統計的な知識を与えることで、より最適化されたフィルタ/合計ビームフォーマーA(z)を設計することができる。ブロッキングマトリックスB(z)は、M−1個のいわゆるノイズ参照
を、ノイズ寄与yi n[k]が発話漏れ寄与yi s[k]と比べて優性となるように、ゼロを興味のある方向に向けることによって、作り出す。ノイズ参照を作り出すシンプルな技術は、時間列のマイクロフォン信号をペアで差し引くことから構成される。さらに最適化されたノイズ参照は、例えば、興味のある方向のみに代えて興味のある方向の近くの特性の角度領域(例えば、興味のある方向近くの−20℃から20℃の角度領域)に対する発話漏れを最小にすることによって、作り出される。また、実際に起きる信号モデルエラーについての統計的な知識を与えることで、発話漏れを考え得る信号モデルエラーのすべてに対し最小化することができる。
を最小化することによって、発話参照中のノイズ寄与y0 n[k-Δ]の推定値wH 0:M-1y0:M-1[k]提供する。
w0:M-1およびy0:M-1中のサブスクリプト(下側の添え字)0:M-1は、適合フィルタおよび入力ベクトルのぞれぞれの最初と最後のチャンネル構成要素のサブスクリプトを参照する。εd 2の項は発話歪みエネルギーを表し、εn 2は残留ノイズエネルギーを示す。コスト関数(式38)の(1/μ)εd 2の項は、SP−SDW−MWFの出力での発話歪みの取り得る量を制限する。そのため、SP−SDW−MWFは、適合ステージでの設計基準において発話歪みを明示的に考慮することで、信号モデルエラーに対するローバスト性をDSCに付加する。パラメータ(1/μ)∈[0,∞]はノイズ・リダクションおよび発話歪みをトレードオフし、大きい場合は1/μであり、小さい場合は取り得る発話歪みの量である。μ=0において、Δサンプルによって遅延された固定ビームフォーマーA(z)の出力が得られる。適合性は、μを0まで減少することで、SP−SDW−MWF中で簡単に減少または排除させることができる(例えば、−10dBの大変に低い信号/ノイズ比(SNR)を有するノイズシナリオにおいては、固定ビームフォーマーが好適である)。また、適合性はQICをw0:M-1に適用することによって制限することができる。
受信したマイクロフォン信号ui[k], i=1,...M上で動作するオリジナルのSDW−MWFが得られることに注意のこと。
SDR−GSC、すなわち、w 0 なしのSP−SDW−MWF
ここで、εd 2は発話歪みエネルギーであり、εn 2は残留ノイズエネルギーである。
が付加されている。この正規化項は、発話がノイズ参照に漏れる、すなわち、yi s[k]≠0, i=1,...M-1のとき、フィルタw1:M-1によって発生する発話歪みの量を制限する。その後、L0=0を備えるSP−SDW−MWFは、そのため、発話歪みで規則化したGSC(SDR−GSC)として参照される。μが小さくなると、発話歪みの起こる量は少なくなる。μ=0においては、z[k]がΔサンプルで遅延された固定ビームフォーマーA(z)の出力であるように、発話歪みにすべての重点を置く。μ=∽において、ノイズ歪みにすべての重点を置き、発話歪みは考慮されない。これは基準GSCに対応する。そのため、SDR−GSCは特別なケースとしてGSCを包含する。
・発話漏れのない場合、すなわち、yi s[k]=0, i=1,..,M-1の場合、正規化項はすべてのw1:M-1に対し0と等しくなり、そのため、残留ノイズエネルギーεn 2は効果的に最小化される。言い換えると、発話漏れのない場合、GSCの解が得られる。
・発話漏れが存在する場合、すなわち、yi s[k]≠0, i=1,..,M-1の場合、適合フィルタw1:M-1に対する最適化基準(式41)において、発話歪みが明示的に考慮され、発話歪みを限定し、一方、ノイズを減少する。
交互に発話歪みを限定するために、QICは、しばしば、フィルタw1:M-1に義務を負わす。SDR−GSCとは異なり、QICは、存在する発話漏れys[k]の量とは関係なく動作する。(式11)中の制限値β2は、発生するであろう最大化モデルエラーに基づき選択されなければならない。結果として、ノイズリダクション性能は、モデルエラーが全く存在しないあるいは大変少ししか存在しないときでさえ、妥協される。そのため、QICは、実験結果で示されるように、SDR−GSCよりもより堅実である。
フィルタw 0 を備えるSP−SDW−MWF
ここで、
が(式33)によって与えられる。
また、発話漏れの存在しない場合、すなわち、yi s[k]=0, i=1,...,M-1の場合、そして、無限に長いフィルタwi, i=1,...,M-1に対し、SP−SDW−MWF(w0を備える)が、SDR−GSCおよびSDWシングルチャンネルWF(SDW−SWF)のカスケード表示に対応することが、観察される。発話漏れが存在する場合、SP−SDW−MWF(w0を備える)は、その性能を維持しようと試みる:SP−SDW−MWFは、そのため、発話漏れに基づく性能の劣化を補償する特別のフィルタリング操作を含んでいる。これは図4に記載されている。無限のフィルタ長に対し、SP−SDW−MWF(w0を備える)の性能が、固定ビームフォーマーA(z)の出力で望ましい発話要素が変化せず残っている限り、マイクロフォン・ミスマッチによって影響を受けないことが照明される。
実験結果
はマイクロフォン信号のクリーンな発話寄与によって推定される。実際に、
は(式27)を使用して近似される。性能上の近似(式27)の影響は、与えられたデータセットに対し小さかった(言い換えると、認識性に重きを置いたSNRの改良では最大でも0.5dBの相違である)。QIC−GSCは種々のロード用RLSを使用して実行される。チャンネル当たりのフィルタ長lLは96と同じである。
ここで、バンド重要性関数Iiは、認識性に対し中央周波数fi cを備えるi番目の3分の1オクターブバンドの従量制を表現し、SNRi,outは出力SNR(in dB)であり、SNRi,inはi番目の3分の1オクターブバンドにおける入力SNR(in dB)である('ANSI S3.5-1997, American National Standard Methods for Calculation of the Speech Intelligibility Index')。認識性で重み付けされたSNRは、発話歪みを考慮しないノイズ・リダクション・アルゴリズムによってどれだけ認識性が改良されたかをしめしている。
測定量は、以下の式により測定されたSDi、i番目の3分の1バンドにおける平均スペクトル歪み(dB)を備えており;
ここで、Gs(f)は、ノイズリダクション・アルゴリズムの入力から出力までの発話のパワー・トランスファー関数である。空間的なプリプロセッサの影響を排除するために、性能の測定は、固定ビームフォーマーの出力に対して計算される。
w 0 無しのSP−SDW−MWF(SDR−GSC)
フィルタw 0 を備えるSP−SDW−MWF
・w0なしで、SP−SDW−MWFはSDR−GSCに対応する:ANC設計基準が、信号モデルエラーによる発話歪みを限定する一般化項で実行される。1/μが大きくなると、歪み量は少なくなる。1/μ=0において、GSCの解に対応する歪みは完全に無視される。SDR−GSCはGSCの感度を信号モデルエラーまで減少させるQIC−GSCに対する他の技術となる。QIC−GSCと比べて、SDR−GSCは、発話漏れの量が増えると、発話歪みに重点をシフトする。信号モデルエラーが存在する場合、GSCの性能は保持される。その結果、小さなモデルエラーに対してより良いノイズリダクション性能が得られ、一方大きなモデルエラーに対するローバスト性も保証される。
・SP−SDW−MWFは発話歪みを明らかに考慮しているため、発話参照上のフィルタw0が付加される。(発話漏れの存在しない状態で、無限の長さのフィルタ長に対し)、SP−SDW−MWFは、SDW−SWFポストフィルタを備えるSDR−GSCのカスケード表示に対応する。発話漏れの存在する状態で、w0を備えるSP−SDW−MWFはその性能を維持するよう試み:SP−SDW−MWFは、発話漏れによる性能劣化を補償するお特別なフィルタリング操作を含む。SDR−GSC(およびそのためGSC)と比べて、性能はマイクロフォンミスマッチにより劣化しない。
補聴器の応用に対する実験結果は、理論結果を確認する。SP−SDW−MWFは、実際に、信号モデルエラーに対しGSCのローバスト性を増加する。広く研究されたQIC−GSCとの比較は、SP−SDW−MWFが与えられた最大許容発話歪みに対するより良いノイズリダクション性能を達成することを、示している。
確率的勾配の実行
確率的勾配アルゴリズム
誘導
を備え、ここで、Nは適合フィルタに対する入力チャンネルの数を示し、Lはチャンネル毎にフィルタタップの数を示す。繰り返し指数nを時間指数kに置き換え、予想値E{.}を除外することで、以下の更新式が得られる。
発話参照において1/μ=0およびフィルタw0がない場合、(式49)は、ノイズのみの期間(すなわち、yi[k]=yi n[k], i=1,..,M-1のとき)GSCで使用される更新公式まで減少する。傾きの推定値における付加項r[k]は、考え得る信号モデルエラーにより発話歪みを限定する。
項の以下の近似を使用して、更新され、
結果として更新公式は以下のようになる。
その後、以下の式の一般化ステップサイズρが使用され、
ここで、δは小さい正の定数である。絶対値
が、きれいな発話エネルギーyS,H[k]yS[k]の正の値の推定値を保証するために、挿入される。第2バッファB2∈RMxLbuf2におけるノイズのみのベクトルybuf2の付加的な記憶は、以下の式を使用して、発話+ノイズの期間中もまたwを適合させることを許す。
である。
簡潔さのみの理由で、ノイズのみの期間における時間領域の確率的勾配アルゴリズムの更新手続がその後考慮され、ここではy[k]=yn[k]である。第2のノイズのみのバッファB2を使用した発話+ノイズ期間中の更新操作に対する継続は複雑でなく:ノイズのみの入力ベクトルy[k]をybufs2[k]で置き換え、発話+ノイズベクトルybuf1[k]を入力発話+ノイズベクトルy[k]で置き換えることで、式を得ることができる。
アルゴリズム(式51)−(式52)は、ステップサイズρが
の最大固有値であるλmaxを有する2/λmaxより小さい場合に、収束する。標準的なNLMSを備える(式51)の類似性から、λi, i=1,..,NLを有する
のセッティング、
の固有値、または、−FIRフィルタの場合−以下の式のセッティングは、
平均平方における収束を保証する。式(55)はステップサイズρに対する(式52)および(式54)の正規化を説明する。
(式51)における瞬間の傾き推定は、−(式49)と比較して−以下の式によって付加的に乱される、
ここで1/μ≠0である。そのため、1/μ≠0において、更新式(式51)−(式54)は、(式49)より大きい残留過剰エラーを受ける。この付加的な過剰エラーは、μの減少、ステップサイズρの増加、ベクトルyのベクトル長LNの増加に対し、増加する。高い非静止ノイズ、例えば複数話者バブルノイズに対し特に大きくなることが予想される。
μ>1において、いくつかの独立的な仮定を行うことによって、アルゴリズム(式51)−(式54)から引き出されることに注意のこと。同時に、しかしながら、これらの独立的な仮定がかなりの性能の劣化の結果となり、一方、計算の複雑性をほとんど減少させないことがわかる。
周波数領域での実行
を、以下の式で置き換えることで改良することができる:
ここで、
は発話+ノイズの期間において更新され、
はノイズのみの期間において更新される。しかしながら、これは高価なマトリックス演算を必要とする。ブロックに基づく実行は、元来、この平均化を行う:
勾配そしてそのため
は、wに対する調整を行う前にk回以上の繰り返しで、平均化される。これは減少(すなわち係数kによって)された収束速度の犠牲にして達成される。
が、ノイズのみの期間において、付加的なバッファ
に記憶されるべきであり、このことは、(N=Mにおいて)、時間領域のベクトルがバッファB1およびB2に記憶されるときと比較して、Lbuf2/2ワードの付加的な記憶量の結果となる。
アルゴリズム1において、共通のトレードオフパラメータμがすべての周波数ビンにおいて使用されていることに注意のこと。あるいは、μに対する異なるセッティングを異なる周波数ビンにおいて使用することができる。例えば、w0=0を有するSP−SDW−MWFに対し、1/μは、GSCが十分なローバスト性を有する周波数で、例えば、高い周波数の小さいサイズのアレイに対し、0にセットすることができる。これに対し、正規化項Ri[k], i=M-N,..,M-1の極まれな周波数要素は計算されることが必要で、計算の複雑性を減少させる。
アルゴリズム1:オーバーラップセーブに基づく周波数領域での確率的勾配SP−SDW−MWF
初期化:
マトリックスの定義:
NL入力サンプルの各新規ブロックに対し:
◆ノイズが検出された場合は:
発話+ノイズバッファB1中のデータからYi[k]を作成する。
◆発話が検出された場合は:
ノイズバッファB2,0およびB2からd[k]およびYi n[k]を作成する。
◆更新のための公式:
◆出力:
・ノイズが検出された場合:yout[k]=y0[k]-yout,1[k]
・発話が検出された場合:yout[k]=y0[k]-yout,2[k]
改良1:ローパスフィルタを有する確率的勾配アルゴリズム
長時間のスペクトルおよび空間特性が、少なくともKの発話+ノイズサンプルとKのノイズサンプルにおいて擬似静止状態であると仮定する。長時間の発話相関マトリックスE{ysys,H}の信頼性のある推定が、K>>Lにおいて(式59)によって得られる。高価なマトリックスの計算を避けるため、r[k]を以下の式に近似することができる。
確率的勾配アルゴリズムのフィルタ係数wは時間的にゆっくり変化するため、(式62)は、特に小さいステップサイズρ’に対し、r[k]と良い近似を示す。平均化操作(式62)は、(式51)においてローパスフィルタをr[k]に適用することによって行われる:
ここで、
である。これは、約
のサンプルの平均化ウィンドウKに対応する。この一般化されたステップサイズρは、以下の式に変更される、
(式51)と比較して、(式63)は、3NL-1の付加的なMACおよびNLx1ベクトルr[k]の特別な記録装置を必要とする。
ここで、
アルゴリズム1と比較して、(式66)−(式69)は、特別の2L点のFFTと8NL-2N-2Lの特別のLに対するMACサンプルと、2NLx1の実数データベクトルの付加的な記憶装置とを必要とする。K=1の時間領域でのバージョンと同様の平均化操作における時間定数を得るために、λは
と等しくなるべきである。
以下の実験結果は、確率的勾配アルゴリズムの性能が特に大きなλに対しローパスフィルタによってかなり改良されることを示している。
表1は、フィルタw0を備えていないTD−SGアルゴリズムおよびSPAが、標準のANCより、約2倍複雑であることを示している。正規化項にローパスフィルタ(LP)を適用したときは、TD−SGアルゴリズムはANCの約3倍の複雑性を有している。周波数領域での実行の複雑性の増加はほとんどない。
表1および図9において、時間領域および周波数領域でのNLMS ANCおよびNLMSに基づくSPAの複雑性は、適合フィルタのみがノイズのみの期間に更新されるときの複雑性を表す。適合フィルタがノイズバッファからのデータを使用して発話+ノイズ期間にも更新される場合は、時間領域の実行は付加的にサンプル毎のNL MACを必要とし、周波数領域の実行は付加的に2FFTおよびLサンプル毎の(4L(M−1)−2(M−1)+L)のMACを必要とする。
を示す。
SPAおよび確率的勾配に基づくSP−SDW−MWFは両者とも、GSCのローバスト性を増加する(すなわち、w0なしで1/μ=0のSP−SDW−MWF)。与えられた最大値として取り得る発話歪みSDintellingに対し、w0を有するおよび有さないSP−SDW−MWFは、SPAよりもより良好なノイズリダクション性能を達成する。w0を有するSP−SDW−MWFの性能は、(w0を有さないSP−SDW−MWFと比べて)、マイクロフォンミスマッチの影響を受けない。モデルエラーがない場合は、w0を有するSP−SDW−MWFは、w0を有さないSP−SDW−MWFより幾分悪い性能となる。これは、w0を有する場合、(1/μ)E{ysys,H}の推定が、(1/μ)E{ysys,H}の大きな規模により、正確でなくなるとの事実によって、説明できる(図11を参照)。最後に、SP−SDW−MWFの提案された確率的勾配の実行が、QIC−GSCを超えるSP−SDW−MWFの効果を維持する。
改良2:相関マトリックスを使用する周波数領域での確率的勾配アルゴリズム
ここで、
は指数重み付け要素である。静止状態のノイズに対し、小さい
すなわち
が満たされる。しかしながら、実際には、発話およびノイズ信号はスペクトル的に非常に非静止状態(例えば、複数話者バブルノイズ)であり、そのため、それらの長時間のスペクトルおよび空間特性は、通常、時間的により遅く変化する。スペクトル的に非常に非静止状態のノイズは、なお、r[k]における長時間相関マトリックスの推定すなわち
を使用することで、空間的に抑制される。
計算のための高価なマトリックス操作(式75)を避けるために、予め、w[k]が時間的に遅く変化するすなわちw[k]≒w[k]であると仮定し、その結果、(式75)は、直接的にローパスフィルタを正規化項r[k]に適用することで、マトリックスの操作の代わりにベクトルで近似することができる、(式63)を参照のこと、
しかしながら、この仮定は、これから示すように、周波数領域での実行を実際には必要としない。
・正規化項を計算するために(式77)の代わりに(式75)を使用するとき、データサンプルの代わりの相関マトリックスを記憶する必要がある。結果としてのアルゴリズムの周波数領域の実行は、アルゴリズム3に要約され、ここでは、2L×2Lの大きさの発話およびノイズ相関マトリックスSij[k]およびSij n[k], i,j=M-N..M-1が、正規化項Ri[k]およびステップサイズΛ[k](の部分)を計算するために使用される。これらの相関マトリックスは、発話+ノイズ期間では望ましい信号がノイズバッファB2からこれ以上構成されないため、発話+ノイズ期間およびノイズのみの期間のそれぞれにおいて更新される。相関マトリックスが対角上でないため、この第1のステップは、しかしながら、メモリーの使用を必然的に減少するわけではなく(データバッファに対するNLbuf1対相関マトリックスに対する2(NL)2)、計算上の複雑性を増加しさえする。
・周波数領域での相関マトリックスは、アルゴリズム3中のFkTkF-1がI2L/2によって良く近似できるため、対角マトリックスによって近似することができる。そのため、発話およびノイズ相関マトリックスは以下のように更新され、
メモリー使用量および計算上の複雑性のかなりの減少となり、一方、性能およびローバスト性について最小の影響しが与えない。このアルゴリズムは、アルゴリズム4として参照される。
アルゴリズム3 相関マトリックス(近似なし)を有する周波数領域での実行
初期化およびマトリックスの定義
F=2L×2Lの大きさのDFTマトリックス
0L=L×Lの大きさのゼロマトリックス、IL=L×Lの大きさの単位マトリックス
Lサンプル(チャンネル毎)の各新規ブロックに対し:
出力信号:
発話が検出された場合:
ノイズが検出された場合:Yi[k]=Yi n[k]
更新のための公式(ノイズのみの期間のみ):
・フィルタw0を有するSP−SDW−MWF(アルゴリズム2)の計算上の複雑性は、QIC−GSCの複雑性の約2倍である(そして、フィルタw0を使用しない場合はそれ以下である)。アルゴリズム4中の正規化項の近似は、さらに、計算上の複雑性を減少する。しかしながら、これは、近似は2次の項0(N2)を導くため、唯一、入力チャンネルの小さい数に対し正しく残る。
・循環発話+ノイズバッファB1中のデータサンプルの記憶により、SP−SDW−MWF(アルゴリズム2)のメモリー使用量は、QIC−GSC(もちろんデータバッファLbuf1のサイズによるが)と比較して、非常に大きくなる。アルゴリズム4の正規化項の近似を使用することによって、データバッファの代わりに対角相関マトリックスを記憶することとなるため、メモリー使用量を劇的に減少させることができる。しかしながら、メモリー使用量に対し、二次の項0(N2)が存在することに注意のこと。
周波数領域での確率的勾配アルゴリズムの性能は、チャンネル毎にフィルタ長L=32、ρ’=0.8、γ=0.95およびλ=0.998に対し、評価される。考慮したすべてのアルゴリズムに対し、ノイズのみの期間においてフィルタの適合化のみ行われる。空間プリプロセッサの影響を排除するために、性能の測定は、固定ビームフォーマーの出力に対し計算される。仮定した信号モデルのエラーに対するアルゴリズムの感度は、マイクロフォンミスマッチすなわち第2マイクロフォンでの利得ミスマッチΥ2=4dBに対し、記載される。
Claims (21)
- 音声信号における雑音を低減させる方法であって、
少なくとも2つのバージョンの前記音声信号を第1のフィルタで受け取るステップと、
前記第1のフィルタが、所望の信号およびノイズ寄与を含む音声参照信号と、音声漏れ寄与およびノイズ寄与を含む少なくとも一つのノイズ参照信号とを出力するステップと、
前記少なくとも1つのノイズ参照信号にフィルタリング操作を行うステップと、
前記音声参照信号から前記少なくとも一つのノイズ参照信号を差し引き、低減されたノイズを有する前記音声信号の出力バージョンを提供するステップと、を含み、
前記少なくとも一つのノイズ参照信号の前記フィルタリング操作は、前記音声信号の前記出力バージョンにおける音声歪みエネルギおよび残留ノイズエネルギの加重和を最小にするよう構成されたフィルタ係数をもつ一つまたは複数のフィルタで行われ、前記音声歪みエネルギは前記音声漏れ寄与のエネルギであり、前記残留ノイズエネルギは前記音声参照信号および少なくとも一つのノイズ参照信号中のノイズ寄与のエネルギである、ノイズを低減するための方法。 - 少なくとも2つのマイクロホンが使用され、
前記少なくとも2つのマイクロホンで前記音声信号を受け取るステップと、
前記少なくとも2つのマイクロホンのそれぞれから前記音声信号の一つのバージョンを前記第1のフィルタに提供するステップと、
を含む、請求項1に記載のノイズを低減するための方法。 - 前記第1のフィルタが、ビームフォーマー・フィルタおよびブロッキング・マトリックス・フィルタを含む空間プリプロセッサ・フィルタである、請求項1または2に記載のノイズを低減するための方法。
- 前記音声参照信号が前記ビームフォーマー・フィルタにより出力されるステップと、
前記少なくとも一つのノイズ参照信号が前記ブロッキング・マトリックス・フィルタにより出力されるステップと、
を含む、請求項3に記載のノイズを低減するための方法。 - 前記音声参照信号からフィルタされた少なくとも一つのノイズ参照信号を差し引くステップを実施する前に前記音声参照信号を遅延させるステップを含む、請求項1から4のいずれか1項に記載のノイズを低減するための方法。
- 前記音声参照信号にフィルタリング操作を行うステップを含み、
前記音声信号の前記出力バージョンは、前記音声参照信号から前記フィルタ操作された音声参照信号および前記少なくとも一つのノイズ参照信号を差し引いて提供される、請求項1から5のいずれか1項に記載のノイズを低減するための方法。 - 一つまたは複数の前記音声漏れ寄与および前記所望の信号を考慮するよう前記フィルタ係数を適合させるステップを含む、請求項1から6のいずれか1項に記載のノイズを低減するための方法。
- 発話を増大する応用における、請求項1から7のいずれか1項に記載のノイズを低減するための方法の使用。
- 2つのバージョンの音声信号を受け取り、音声参照信号および少なくとも一つのノイズ参照信号を出力するよう構成された第1のフィルタを備え、
前記音声参照信号は、所望の信号およびノイズ寄与を含み、前記少なくとも一つのノイズ参照信号は、音声漏れ寄与およびノイズ寄与を含み、
前記ノイズ参照信号をフィルタするよう構成された第2のフィルタと、
前記音声参照信号から、前記少なくとも一つのフィルタされたノイズ参照信号を差し引き、ノイズが低減された前記音声信号の出力バージョンを提供するよう構成された加算器と、を備え、
前記第2のフィルタは、前記音声漏れ寄与のエネルギおよび前記音声信号の前記出力バージョンにおける前記ノイズ寄与のエネルギの加重和を最小にするよう構成されたフィルタ係数をもつ、音声信号におけるノイズを減少するための信号プロセッサ。 - 前記第1のフィルタが、ビームフォーマー・フィルタおよびブロッキング・マトリックス・フィルタを備える、空間プリプロセッサ・フィルタである、請求項9に記載の信号プロセッサ。
- 前記ビームフォーマー・フィルタが遅延/合計ビームフォーマーである、請求項10に記載の信号プロセッサ。
- 補聴器で使用するための請求項9に記載の信号プロセッサ。
- 前記第2のフィルタが前記音声参照信号をフィルタするよう構成され、前記加算器が前記音声参照信号から前記フィルタされた音声参照信号および前記少なくとの一つのフィルタされたノイズ参照信号を差し引いて前記音声信号の前記出力バージョンを提供する、請求項9に記載の信号プロセッサ。
- 前記フィルタ係数を一つまたは複数の前記音声漏れ寄与および前記所望の信号を考慮するよう適合させる、請求項9に記載の信号プロセッサ。
- 少なくとも2つのバージョンの音声信号をフィルタするフィルタ手段を備え、
該フィルタ手段は、所望の信号およびノイズ寄与を含む音声参照信号、および音声漏れ寄与およびノイズ寄与を含む少なくとも一つのノイズ参照信号を出力するよう構成されており、
前記少なくとも一つのノイズ参照信号をフィルタするためのフィルタ手段と、
前記音声参照信号から、前記少なくとも一つのフィルタされたノイズ参照信号を差し引き、ノイズが低減された前記音声信号の出力バージョンを提供するための手段と、を備え、
前記少なくとも一つのノイズ参照信号をフィルタするフィルタ手段は、前記音声漏れ寄与のエネルギおよび前記音声信号の前記出力バージョンにおける前記ノイズ寄与のエネルギの加重和を最小にするよう構成されている、音声信号におけるノイズを減少するよう構成された信号プロセッサ。 - 少なくとも2つのバージョンの音声信号をフィルタするフィルタ手段が、ビームフォーマー・フィルタおよびブロッキング・マトリックス・フィルタを備える、空間プリプロセッサ・フィルタである、請求項15に記載の信号プロセッサ。
- 前記音声参照信号が前記ビームフォーマー・フィルタにより出力され、前記少なくとも一つのノイズ参照信号が前記ブロッキング・マトリックス・フィルタにより出力される、請求項16に記載の信号プロセッサ。
- 前記音声参照信号からフィルタされた少なくとも一つのノイズ参照信号を差し引く前に前記音声参照信号を遅延させる手段を有する、請求項15に記載のプロセッサ。
- 前記音声参照信号をフィルタリングする手段と、
フィルタリングされた前記音声参照信号および前記少なくとも一つのノイズ参照信号を前記音声参照信号から差し引き、前記音声信号の出力バージョンを提供する手段と、
を備える、請求項15に記載の信号プロセッサ。 - 一つまたは複数の前記音声漏れ寄与および前記所望の信号を考慮するよう前記ノイズ参照信号のフィルタリングを適合させる手段を有する、請求項15に記載の信号プロセッサ。
- 請求項9から20のいずれかに記載の信号プロセッサを備えた聴取装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2003903575 | 2003-07-11 | ||
AU2003903575A AU2003903575A0 (en) | 2003-07-11 | 2003-07-11 | Multi-microphone adaptive noise reduction techniques for speech enhancement |
AU2004901931A AU2004901931A0 (en) | 2004-04-08 | Multi-microphone Adaptive Noise Reduction Techniques for Speech Enhancement | |
AU2004901931 | 2004-04-08 | ||
PCT/BE2004/000103 WO2005006808A1 (en) | 2003-07-11 | 2004-07-12 | Method and device for noise reduction |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007525865A JP2007525865A (ja) | 2007-09-06 |
JP4989967B2 true JP4989967B2 (ja) | 2012-08-01 |
Family
ID=34063961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006517910A Expired - Fee Related JP4989967B2 (ja) | 2003-07-11 | 2004-07-12 | ノイズ低減のための方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7657038B2 (ja) |
EP (1) | EP1652404B1 (ja) |
JP (1) | JP4989967B2 (ja) |
AT (1) | ATE487332T1 (ja) |
DE (1) | DE602004029899D1 (ja) |
WO (1) | WO2005006808A1 (ja) |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8260430B2 (en) | 2010-07-01 | 2012-09-04 | Cochlear Limited | Stimulation channel selection for a stimulating medical device |
AUPS318202A0 (en) | 2002-06-26 | 2002-07-18 | Cochlear Limited | Parametric fitting of a cochlear implant |
US8190268B2 (en) | 2004-06-15 | 2012-05-29 | Cochlear Limited | Automatic measurement of an evoked neural response concurrent with an indication of a psychophysics reaction |
US7801617B2 (en) | 2005-10-31 | 2010-09-21 | Cochlear Limited | Automatic measurement of neural response concurrent with psychophysics measurement of stimulating device recipient |
WO2005122887A2 (en) | 2004-06-15 | 2005-12-29 | Cochlear Americas | Automatic determination of the threshold of an evoked neural response |
US9807521B2 (en) | 2004-10-22 | 2017-10-31 | Alan J. Werner, Jr. | Method and apparatus for intelligent acoustic signal processing in accordance with a user preference |
US20060088176A1 (en) * | 2004-10-22 | 2006-04-27 | Werner Alan J Jr | Method and apparatus for intelligent acoustic signal processing in accordance wtih a user preference |
US8543390B2 (en) * | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
JP2006210986A (ja) * | 2005-01-25 | 2006-08-10 | Sony Corp | 音場設計方法および音場合成装置 |
US8285383B2 (en) | 2005-07-08 | 2012-10-09 | Cochlear Limited | Directional sound processing in a cochlear implant |
JP4765461B2 (ja) * | 2005-07-27 | 2011-09-07 | 日本電気株式会社 | 雑音抑圧システムと方法及びプログラム |
US20070043608A1 (en) * | 2005-08-22 | 2007-02-22 | Recordant, Inc. | Recorded customer interactions and training system, method and computer program product |
US7472041B2 (en) * | 2005-08-26 | 2008-12-30 | Step Communications Corporation | Method and apparatus for accommodating device and/or signal mismatch in a sensor array |
WO2007028250A2 (en) | 2005-09-09 | 2007-03-15 | Mcmaster University | Method and device for binaural signal enhancement |
DE102005047047A1 (de) * | 2005-09-30 | 2007-04-12 | Siemens Audiologische Technik Gmbh | Mikrofonkalibrierung bei einem RGSC-Beamformer |
CN100535993C (zh) * | 2005-11-14 | 2009-09-02 | 北京大学科技开发部 | 用于助听器的语音增强方法 |
US8571675B2 (en) | 2006-04-21 | 2013-10-29 | Cochlear Limited | Determining operating parameters for a stimulating medical device |
US7783260B2 (en) * | 2006-04-27 | 2010-08-24 | Crestcom, Inc. | Method and apparatus for adaptively controlling signals |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
WO2008106649A1 (en) * | 2007-03-01 | 2008-09-04 | Recordant, Inc. | Calibration of word spots system, method, and computer program product |
WO2008115435A1 (en) * | 2007-03-19 | 2008-09-25 | Dolby Laboratories Licensing Corporation | Noise variance estimator for speech enhancement |
WO2008116264A1 (en) | 2007-03-26 | 2008-10-02 | Cochlear Limited | Noise reduction in auditory prostheses |
DE602007003220D1 (de) * | 2007-08-13 | 2009-12-24 | Harman Becker Automotive Sys | Rauschverringerung mittels Kombination aus Strahlformung und Nachfilterung |
US20090073950A1 (en) * | 2007-09-19 | 2009-03-19 | Callpod Inc. | Wireless Audio Gateway Headset |
US8054874B2 (en) * | 2007-09-27 | 2011-11-08 | Fujitsu Limited | Method and system for providing fast and accurate adaptive control methods |
ATE551692T1 (de) * | 2008-02-05 | 2012-04-15 | Phonak Ag | Verfahren zur verringerung von rauschen in einem eingangssignal eines hörgeräts sowie ein hörgerät |
US8374854B2 (en) * | 2008-03-28 | 2013-02-12 | Southern Methodist University | Spatio-temporal speech enhancement technique based on generalized eigenvalue decomposition |
US8503669B2 (en) * | 2008-04-07 | 2013-08-06 | Sony Computer Entertainment Inc. | Integrated latency detection and echo cancellation |
US9318232B2 (en) * | 2008-05-02 | 2016-04-19 | University Of Maryland | Matrix spectral factorization for data compression, filtering, wireless communications, and radar systems |
KR20100003530A (ko) * | 2008-07-01 | 2010-01-11 | 삼성전자주식회사 | 전자기기에서 음성 신호의 잡음 제거 장치 및 방법 |
DK2148525T3 (da) * | 2008-07-24 | 2013-08-19 | Oticon As | Kodebogsbaseret estimering af tilbagekoblingsvej |
US9253568B2 (en) * | 2008-07-25 | 2016-02-02 | Broadcom Corporation | Single-microphone wind noise suppression |
EP2237271B1 (en) | 2009-03-31 | 2021-01-20 | Cerence Operating Company | Method for determining a signal component for reducing noise in an input signal |
US8249862B1 (en) * | 2009-04-15 | 2012-08-21 | Mediatek Inc. | Audio processing apparatuses |
KR101587844B1 (ko) * | 2009-08-26 | 2016-01-22 | 삼성전자주식회사 | 마이크로폰의 신호 보상 장치 및 그 방법 |
CH702399B1 (fr) * | 2009-12-02 | 2018-05-15 | Veovox Sa | Appareil et procédé pour la saisie et le traitement de la voix. |
US8565446B1 (en) * | 2010-01-12 | 2013-10-22 | Acoustic Technologies, Inc. | Estimating direction of arrival from plural microphones |
US20110178800A1 (en) * | 2010-01-19 | 2011-07-21 | Lloyd Watts | Distortion Measurement for Noise Suppression System |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US8737654B2 (en) * | 2010-04-12 | 2014-05-27 | Starkey Laboratories, Inc. | Methods and apparatus for improved noise reduction for hearing assistance devices |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US9378754B1 (en) * | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
US20110288860A1 (en) * | 2010-05-20 | 2011-11-24 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for processing of speech signals using head-mounted microphone pair |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101702561B1 (ko) * | 2010-08-30 | 2017-02-03 | 삼성전자 주식회사 | 음원출력장치 및 이를 제어하는 방법 |
US8861756B2 (en) | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
TWI419149B (zh) * | 2010-11-05 | 2013-12-11 | Ind Tech Res Inst | 抑制雜訊系統與方法 |
US10418047B2 (en) | 2011-03-14 | 2019-09-17 | Cochlear Limited | Sound processing with increased noise suppression |
US9131915B2 (en) | 2011-07-06 | 2015-09-15 | University Of New Brunswick | Method and apparatus for noise cancellation |
US9666206B2 (en) * | 2011-08-24 | 2017-05-30 | Texas Instruments Incorporated | Method, system and computer program product for attenuating noise in multiple time frames |
PT105880B (pt) * | 2011-09-06 | 2014-04-17 | Univ Do Algarve | Cancelamento controlado de ruído predominantemente multiplicativo em sinais no espaço tempo-frequência |
EP2761892B1 (en) * | 2011-09-27 | 2020-07-15 | Starkey Laboratories, Inc. | Methods and apparatus for reducing ambient noise based on annoyance perception and modeling for hearing-impaired listeners |
US9241228B2 (en) * | 2011-12-29 | 2016-01-19 | Stmicroelectronics Asia Pacific Pte. Ltd. | Adaptive self-calibration of small microphone array by soundfield approximation and frequency domain magnitude equalization |
US9026451B1 (en) * | 2012-05-09 | 2015-05-05 | Google Inc. | Pitch post-filter |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
US11019414B2 (en) * | 2012-10-17 | 2021-05-25 | Wave Sciences, LLC | Wearable directional microphone array system and audio processing method |
US9078057B2 (en) | 2012-11-01 | 2015-07-07 | Csr Technology Inc. | Adaptive microphone beamforming |
DE102013207161B4 (de) * | 2013-04-19 | 2019-03-21 | Sivantos Pte. Ltd. | Verfahren zur Nutzsignalanpassung in binauralen Hörhilfesystemen |
US20140337021A1 (en) * | 2013-05-10 | 2014-11-13 | Qualcomm Incorporated | Systems and methods for noise characteristic dependent speech enhancement |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
US9437212B1 (en) * | 2013-12-16 | 2016-09-06 | Marvell International Ltd. | Systems and methods for suppressing noise in an audio signal for subbands in a frequency domain based on a closed-form solution |
EP2897378B1 (en) * | 2014-01-21 | 2020-08-19 | Oticon Medical A/S | Hearing aid device using dual electromechanical vibrator |
KR101580868B1 (ko) * | 2014-04-02 | 2015-12-30 | 한국과학기술연구원 | 잡음 환경에서 음원 위치를 추정하는 장치 및 방법 |
US10149047B2 (en) * | 2014-06-18 | 2018-12-04 | Cirrus Logic Inc. | Multi-aural MMSE analysis techniques for clarifying audio signals |
US9949041B2 (en) * | 2014-08-12 | 2018-04-17 | Starkey Laboratories, Inc. | Hearing assistance device with beamformer optimized using a priori spatial information |
CN106797512B (zh) | 2014-08-28 | 2019-10-25 | 美商楼氏电子有限公司 | 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质 |
US9997170B2 (en) * | 2014-10-07 | 2018-06-12 | Samsung Electronics Co., Ltd. | Electronic device and reverberation removal method therefor |
EP3007170A1 (en) | 2014-10-08 | 2016-04-13 | GN Netcom A/S | Robust noise cancellation using uncalibrated microphones |
US9311928B1 (en) * | 2014-11-06 | 2016-04-12 | Vocalzoom Systems Ltd. | Method and system for noise reduction and speech enhancement |
US9607603B1 (en) * | 2015-09-30 | 2017-03-28 | Cirrus Logic, Inc. | Adaptive block matrix using pre-whitening for adaptive beam forming |
US20170164102A1 (en) * | 2015-12-08 | 2017-06-08 | Motorola Mobility Llc | Reducing multiple sources of side interference with adaptive microphone arrays |
US9641935B1 (en) * | 2015-12-09 | 2017-05-02 | Motorola Mobility Llc | Methods and apparatuses for performing adaptive equalization of microphone arrays |
EP3416407B1 (en) * | 2017-06-13 | 2020-04-08 | Nxp B.V. | Signal processor |
WO2019005885A1 (en) * | 2017-06-27 | 2019-01-03 | Knowles Electronics, Llc | POST-LINEARIZATION SYSTEM AND METHOD USING A TRACKING SIGNAL |
DE102018117557B4 (de) * | 2017-07-27 | 2024-03-21 | Harman Becker Automotive Systems Gmbh | Adaptives nachfiltern |
US10200540B1 (en) * | 2017-08-03 | 2019-02-05 | Bose Corporation | Efficient reutilization of acoustic echo canceler channels |
US10418048B1 (en) * | 2018-04-30 | 2019-09-17 | Cirrus Logic, Inc. | Noise reference estimation for noise reduction |
US11488615B2 (en) | 2018-05-21 | 2022-11-01 | International Business Machines Corporation | Real-time assessment of call quality |
US11335357B2 (en) * | 2018-08-14 | 2022-05-17 | Bose Corporation | Playback enhancement in audio systems |
US11277685B1 (en) * | 2018-11-05 | 2022-03-15 | Amazon Technologies, Inc. | Cascaded adaptive interference cancellation algorithms |
US10964314B2 (en) * | 2019-03-22 | 2021-03-30 | Cirrus Logic, Inc. | System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array |
US11070907B2 (en) | 2019-04-25 | 2021-07-20 | Khaled Shami | Signal matching method and device |
US11514883B2 (en) | 2019-08-02 | 2022-11-29 | Rda Microelectronics (Shanghai) Co., Ltd. | Active noise reduction system and method, and storage medium |
US11025324B1 (en) * | 2020-04-15 | 2021-06-01 | Cirrus Logic, Inc. | Initialization of adaptive blocking matrix filters in a beamforming array using a priori information |
CN112235691B (zh) * | 2020-10-14 | 2022-09-16 | 南京南大电子智慧型服务机器人研究院有限公司 | 一种混合式的小空间声重放品质提升方法 |
CN117037830A (zh) * | 2021-05-21 | 2023-11-10 | 中科上声(苏州)电子有限公司 | 一种麦克风阵列的拾音方法、电子设备及存储介质 |
CN115694425A (zh) * | 2021-07-23 | 2023-02-03 | 澜至电子科技(成都)有限公司 | 一种波束形成器、方法及芯片 |
US11349206B1 (en) | 2021-07-28 | 2022-05-31 | King Abdulaziz University | Robust linearly constrained minimum power (LCMP) beamformer with limited snapshots |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3279612B2 (ja) * | 1991-12-06 | 2002-04-30 | ソニー株式会社 | 雑音低減装置 |
JP2720845B2 (ja) * | 1994-09-01 | 1998-03-04 | 日本電気株式会社 | 適応アレイ装置 |
CA2157418C (en) * | 1994-09-01 | 1999-07-13 | Osamu Hoshuyama | Beamformer using coefficient restrained adaptive filters for detecting interference signals |
JP2882364B2 (ja) | 1996-06-14 | 1999-04-12 | 日本電気株式会社 | 雑音消去方法及び雑音消去装置 |
US6178248B1 (en) * | 1997-04-14 | 2001-01-23 | Andrea Electronics Corporation | Dual-processing interference cancelling system and method |
JP3216704B2 (ja) * | 1997-08-01 | 2001-10-09 | 日本電気株式会社 | 適応アレイ装置 |
EP1131892B1 (en) * | 1998-11-13 | 2006-08-02 | Bitwave Private Limited | Signal processing apparatus and method |
DE10195933T1 (de) * | 2000-03-14 | 2003-04-30 | Audia Technology Inc | Adaptiver Mikrophonabgleich in einem Richtsystem mit mehreren Mikrophonen |
US7206418B2 (en) * | 2001-02-12 | 2007-04-17 | Fortemedia, Inc. | Noise suppression for a wireless communication device |
-
2004
- 2004-07-12 US US10/564,182 patent/US7657038B2/en active Active
- 2004-07-12 AT AT04737686T patent/ATE487332T1/de not_active IP Right Cessation
- 2004-07-12 JP JP2006517910A patent/JP4989967B2/ja not_active Expired - Fee Related
- 2004-07-12 WO PCT/BE2004/000103 patent/WO2005006808A1/en active Application Filing
- 2004-07-12 EP EP04737686A patent/EP1652404B1/en not_active Not-in-force
- 2004-07-12 DE DE602004029899T patent/DE602004029899D1/de active Active
Also Published As
Publication number | Publication date |
---|---|
US7657038B2 (en) | 2010-02-02 |
US20070055505A1 (en) | 2007-03-08 |
WO2005006808A1 (en) | 2005-01-20 |
ATE487332T1 (de) | 2010-11-15 |
DE602004029899D1 (de) | 2010-12-16 |
JP2007525865A (ja) | 2007-09-06 |
EP1652404B1 (en) | 2010-11-03 |
EP1652404A1 (en) | 2006-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4989967B2 (ja) | ノイズ低減のための方法および装置 | |
Spriet et al. | Spatially pre-processed speech distortion weighted multi-channel Wiener filtering for noise reduction | |
Doclo et al. | Frequency-domain criterion for the speech distortion weighted multichannel Wiener filter for robust noise reduction | |
US10079026B1 (en) | Spatially-controlled noise reduction for headsets with variable microphone array orientation | |
US9723422B2 (en) | Multi-microphone method for estimation of target and noise spectral variances for speech degraded by reverberation and optionally additive noise | |
CN110085248B (zh) | 个人通信中降噪和回波消除时的噪声估计 | |
Cornelis et al. | Performance analysis of multichannel Wiener filter-based noise reduction in hearing aids under second order statistics estimation errors | |
KR101597752B1 (ko) | 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치 | |
JP5762956B2 (ja) | ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法 | |
Florêncio et al. | Multichannel filtering for optimum noise reduction in microphone arrays | |
CN111354368B (zh) | 补偿处理后的音频信号的方法 | |
Spriet et al. | Stochastic gradient-based implementation of spatially preprocessed speech distortion weighted multichannel Wiener filtering for noise reduction in hearing aids | |
Leese | Microphone arrays | |
Habets | A distortionless subband beamformer for noise reduction in reverberant environments | |
Gode et al. | Adaptive dereverberation, noise and interferer reduction using sparse weighted linearly constrained minimum power beamforming | |
Schepker et al. | A robust null-steering beamformer for acoustic feedback cancellation for a multi-microphone earpiece | |
US20230186934A1 (en) | Hearing device comprising a low complexity beamformer | |
Seltzer et al. | A Log-MMSE Adaptive Filter Using a non-Linear Spatial Filter | |
Spriet et al. | Stochastic gradient implementation of spatially preprocessed multi-channel Wiener filtering for noise reduction in hearing aids | |
Gustafsson et al. | Dual-Microphone Spectral Subtraction | |
ESAT et al. | Stochastic Gradient based Implementation of Spatially Pre-processed Speech Distortion Weighted Multi-channel Wiener Filtering for Noise Reduction in Hearing Aids | |
Togami et al. | Subband nonstationary noise reduction based on multichannel spatial prediction under reverberant environments | |
Doclo et al. | Design of a robust multi-microphone noise reduction algorithm for hearing instruments | |
CN117099361A (zh) | 用于经滤波参考声学回声消除的装置和方法 | |
Mohammed et al. | Real-time implementation of new adaptive beamformer sensor array for speech enhancement in hearing aid |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070710 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110118 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110406 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20110414 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110418 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110510 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20110414 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110512 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120306 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120403 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120501 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |