JP2004520616A - 雑音低減法および装置 - Google Patents
雑音低減法および装置 Download PDFInfo
- Publication number
- JP2004520616A JP2004520616A JP2002561819A JP2002561819A JP2004520616A JP 2004520616 A JP2004520616 A JP 2004520616A JP 2002561819 A JP2002561819 A JP 2002561819A JP 2002561819 A JP2002561819 A JP 2002561819A JP 2004520616 A JP2004520616 A JP 2004520616A
- Authority
- JP
- Japan
- Prior art keywords
- noise reduction
- frame
- impulse response
- reduction filter
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title claims description 51
- 238000012546 transfer Methods 0.000 claims abstract description 41
- 238000001228 spectrum Methods 0.000 claims abstract description 23
- 230000004044 response Effects 0.000 claims description 62
- 238000001914 filtration Methods 0.000 claims description 28
- 230000001419 dependent effect Effects 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 description 50
- 238000012545 processing Methods 0.000 description 24
- 238000011156 evaluation Methods 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 7
- 230000001629 suppression Effects 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000009499 grossing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000007704 transition Effects 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 4
- 238000010183 spectrum analysis Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 2
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 2
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 2
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01L—MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
- G01L21/00—Vacuum gauges
- G01L21/02—Vacuum gauges having a compression chamber in which gas, whose pressure is to be measured, is compressed
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Superconductors And Manufacturing Methods Therefor (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
Description
【0001】
本発明は入力信号中に存在する雑音レベルを低減するために用いられる信号処理技術に関するものである。
【0002】
重要な応用分野は、
・雑音の多い環境における電話会議またはテレビ会議(専用室内またはマルチメディア・コンピュータからでさえ、等);
・電話:固定電話または携帯電話等の端末器と、伝送ネットワークとの少なくとも一方における処理;
・特に事務所、車両または携帯端末機におけるハンドフリー端末機;
・公共の場所(駅、空港、等)における音を拾うこと;
・車両内で両手を使用せずに音を拾うこと;
・騒がしい環境内で音声を確実に認識すること;
・映画およびメディア(たとえば、スポーツ報道または演奏会のための、ラジオ、テレビジョン、等)のために音響を拾うこと;
を非限定的に含めた、オーディオ信号(音声または音楽)処理の分野である。
【0003】
本発明は、雑音を含んでいる観察から有用な情報を取り出す必要がある分野であればどのような分野にも応用できる。特に、次の分野を引用できる:水中画像観測、水中リモートセンシング、バイオメディカル信号処理(EEG、ECG、バイオメディカル画像形成、等)。
【背景技術】
【0004】
集音の特徴的な問題は、集音マイクロホンが設置される音響環境に関連し、更に詳しくいえばその環境を完全に管理統制することは不可能であるので、観測信号中には妨害信号(雑音と呼ばれる)も存在する。
【0005】
信号の質を高めるために、雑音が含まれている観測信号を処理することにより有用な情報を取り出す目的で雑音低減装置が開発されている。オーディオ信号が遠く離れた所から送られてきた音声信号である場合は、それらの装置を用いてそれの了解度を高め、通信相手に及ぼす負担を軽減するためにそれらの装置を使用できる。会話通信のそれらの応用に加えて、音声信号の質を高めることによって音声認識に有用なことが判明もした。使用者が騒がしい環境に居ると音声認識性が大きく損なわれる。
【0006】
雑音低減操作を実行するための信号処理技術の選択は、まず、処理の入力側において利用できる観測数に依存する。ここでの説明では、ただ1つの観測信号を利用できる場合について考えることにする。この単一獲得問題に適用される雑音低減法は、時間進み/時間遅れを伴う適応濾波、パラメトリック・カルマン濾波、または短時間スペクトル変更による濾波までも、などの信号処理技術に主として依存する。
【0007】
後者の集り(短時間スペクトル変更による濾波)は、包含されている概念が簡単で、それらをプログラムするために要する基本的なツール(たとえば、離散フーリェ変換)の有用性が広いために、産業機器に使用されているほぼ全ての解決技術を組合わせている。しかし、それらの雑音低減技術の急速な進歩は、処理操作の出力側で使用できる信号を大きく歪ませることなしに、信号処理プロセッサでそれらの処理操作を実時間で容易に実行する可能性に大きく依存している。この集まりの方法では、処理は、雑音低減フィルタの伝達関数を評価することと、その後でブロックごとの処理でスペクトル領域内での乗算を基にして濾波を行うことにのみ最もしばしばある。スペクトル領域内での乗算によって短時間スペクトル減衰による雑音低減が可能にされる。
【0008】
所望の信号s(n)と妨害信号b(n)との混合から生ずる、雑音を含んでいる観測信号はx(n)と記される。ここにnは離散時間内での時間指標を示す。離散時間における表現の選択は、信号のデジタル処理へ向けられる手法に関連させられるが、上記方法は連続時間信号にも適用されることに気が付くであろう。信号は一定長さの指標kの連続する区画すなわちフレームで解析される。離散時間領域および離散周波数領域での表現のために現在使用されている記法は:
・X(k,f):解析される信号x(n)のk番目のフレーム(kはフレーム指標)のフーリェ変換(fは周波数指標);
・S(k,f):所望の信号s(n)のk番目のフレームのフーリェ変換;
・
【0009】
【数1】
【0010】
:量(時間領域内または周波数領域内の)vの評価;たとえば、
【0011】
【数2】
【0012】
は所望の信号のフーリェ変換の評価である;
・γuu(f):信号u(n)のパワースペクトル密度(PSD)である。
【0013】
ほとんどの雑音低減技術では、雑音を含んでいる信号x(n)は周波数領域内で濾波を受けて、いかなる妨害も受けていない元の信号s(n)にできるだけ近い有用な評価された信号
【0014】
【数3】
【0015】
を生ずる。前に示したように、この濾波操作は、雑音を含んでいる信号の各周波数成分fを減少することにあり、その信号にはその周波数成分中の評価された信号対雑音比(SNR)を与えられている。周波数fに依存する、このSNRをここではフレームkに対してη(k,f)と記すことにする。
【0016】
各フレームに対して、雑音低減フィルタを計算するために求められるスペクトル量の後での評価を改善するために、信号に重み付けウィンドウをまず乗ずる。そのようにしてウィンドウ化された各フレームをその後でスペクトル領域内で解析する(それの最初の実行では離散フーリェ変換を一般に用いる)。この操作は短時間フーリェ変換(STFT)と呼ばれている。観測された信号のこの周波数領域表現X(k,f)は、雑音低減フィルタの伝達関数H(k,f)を同時に評価するため、およびこのフィルタを、この伝達関数に雑音を含んでいる信号の短時間スペクトルを単に乗ずることにより、スペクトル領域に適用するために、使用できる。すなわち、
【0017】
【数4】
【0018】
である。
【0019】
このようにして得られた信号はその後で簡単な逆スペクトル変換により時間領域へ戻される。雑音を除去された信号はブロックの重ね合わせおよび加え合わせの技術(OLA、「重ね合わせ−加え合わせ」)またはブロックをセーブする技術(OLS、「重ね合わせ−セーブ」)により一般に合成される。時間領域内の信号を再構成するこの操作は逆短時間フーリェ変換(ISTFT)と呼ばれる。
【0020】
短時間スペクトル減衰法についての詳細な説明が次の文献に見出される:J.S.Lim、A.V.Oppenheim、「雑音を含む音声の強調および帯域幅圧縮(Enhancement and bandwith compression of noisy speech)」Proceeding of the IEEE、67巻、1586〜1604ページ、1979;R.E.Crochiere、L.R.Rabiner、「マルチレート・デジタル信号処理(Multirate digital signal processing)」Prentice Hall、1983。
【0021】
そのような雑音低減装置により実行される主な作業は:
・有声検出(VAD);
・無声期間中の雑音のパワースペクトル密度(PSD)の評価;
・雑音のスペクトル成分を抑制するための規則を基にして評価された短時間スペクトル減衰の適用;
・処理された信号のOLS型またはOLA型技術を基にした合成。
【0022】
雑音成分を抑制する規則は伝送される信号の質を決定するので、その規則の選択は重要である。それらの抑制技術は雑音を含んでいる信号のスペクトル成分の位相ではなくて振幅|X(k,f)|のみを一般に変更する。一般に、下記の仮定が行われる:
・雑音と有用な信号とは統計的に相関していない;
・有用な雑音は断続的である(雑音を評価できる期間であるような沈黙期間の存在);
・人の耳は信号の位相を感知しない(D.L.Wang、J.S.Lim、「音声強調における位相の非重要性(The unimportance of phase in speech enhancement)」、IEEE Trans. on ASSP、30巻、4号、679〜681、1982、参照)。
【0023】
周波数領域成分fにおけるインデックスkのフレーム上の観測信号X(k,f)に適用される短時間スペクトル減衰H(k,f)は、局部的な信号対雑音比η(k,f)の評価を基にして一般に決定される。全ての抑制規則に共通の特徴は、
【0024】
【数5】
【0025】
により与えられるそれらの規則の漸近的な挙動である。
【0026】
現在採用されている抑制規則は:
・パワースペクトル差し引き(J.S.Lim、A.V.Oppenheimによる上記文献参照)。これに対しては雑音低減フィルタの伝達関数H(k,f)は
【0027】
【数6】
【0028】
として表される。
・振幅スペクトル差し引き(S.F.Boll、「スペクトル差し引きを用いる音声の雑音抑制(Suppression of acoustic noise in speech using spectral subtraction)」、IEEE Trans. on Audio,Speech and Signal Processing、27巻、2号、113〜120ページ、1979年4月、参照)。それに対しては伝達関数H(k,f)は
【0029】
【数7】
【0030】
として表される。
・ウィーナーフィルタの直接適用(J.S.Lim、A.V.Oppenheimにより上記文献参照)。これに対しては雑音低減フィルタの伝達関数H(k, f)は
【0031】
【数8】
【0032】
として表される。
【0033】
それらの表現では、γss(k,f)とγbb(k,f)は有用な信号と、インデックスkのフレーム上の観察信号X(k,f)の周波数領域成分f内に存在する雑音とのパワースペクトル密度をそれぞれ表す。
【0034】
式(3)〜(5)から、与えられた周波数領域成分fについて測定された局部的な信号対雑音比に従って、雑音を含む信号に加えられるスペクトル減衰の挙動を研究することが可能である。局部的な信号対雑音比が高い時に、あらゆる規則が同一の減衰を生ずることが注目される。パワー差し引き規則はガウスモデルに対して最大限起きやすいという意味で最適である(O.Cappe、「EphraimおよびMalah雑音抑制器による楽音ノイズ音(musical noise)現象除去(Elimination of the musicalnoise phenomenon with the Ephraim and Malah noise suppressor)」、IEEE Trans.on Speech and Audio Processing、2巻、3号、345〜349ページ、1994年4月、参照)。しかし、それは処理の出力側において雑音パワーが最大のままであるという規則である。全ての抑制規則に対して、遮断値付近の局部的な信号対雑音比の小さい変化が、完全な減衰
【0035】
【数9】
【0036】
の場合から無視できるスペクトル変更
【0037】
【数10】
【0038】
の場合まで変更させるのに十分である。
【0039】
後者の特性は「楽音ノイズ」として知られている現象の原因の1つを構成する。実際に、決定論的な成分およびランダムな成分により特徴付けられる、周囲の雑音は無音期間中にのみ特徴付けることができる。それらのランダムな成分が存在するために、有声期間中の雑音の周波数領域成分fの寄与と、無声期間中のいくつかのフレームにわたって行われるそれの平均評価との間に非常に著しい変動がある。この違いのために、局部的な信号対雑音比の評価が遮断レベルを中心として変動することがある、すなわち、したがって、それは、出現し、その後で消失するスペクトル成分を、処理の出力側に、生ずることができ、それらの成分の平均寿命は考察している解析ウィンドウの大きさ程度を統計的に超えない。この挙動を全通過帯域にわたって一般化すると、「楽音ノイズ」として知られている、いらいらさせる可聴残留雑音が導入される。
【0040】
この雑音の影響を減少するために多くの研究が行われている。推奨されている解決策は種々の線に沿って開発されている。それらは、:
・短時間評価の平均化(S.F.Bollによる前記論文参照);
・雑音電力スペクトルの過大評価(M.Berouti他、「雑音に埋もれている音声の増強(Enhanncement of speech corrupted by acoustic noise)」、Int. Conf. on Speech,Signal Processing、208〜211ページ、1979、およびP.Lockwood、J.Boudy、「非直線スペクトル除去器による実験、隠されたマルコフモデルおよび車両における強固な音声認識(Experiments with a non‐linear spectral subtractor,hidden Markov models and the projection for robust speech recognition in cars)」、Proc. of EUSIPCO’91、79〜82ページ、1991、参照);
・最低雑音スペクトル密度のトラッキング(R.Martin、「最小統計を基にしたスペクトル除去(Spectaral subtraction based on minimum statistics)」、in Signal Processing VII:Theories and Applications,EUSIPCO’94、1182〜1185ページ、1994、9月、参照);
音声信号と付加雑音との統計モデルを基にした新規な抑制規則についての多くの研究も行われてきた。それらの研究によって新規な「ソフト決定」アルゴリズムが導入されるようになった。その理由は、従来の方法と比較してそれらのアルゴリズムが自由度を余分に有しているからである(R.J.MacAulay、M.L.Malpass、「ソフト決定雑音抑制フィルタを用いる音声強調(Speech enhancement using a soft‐decision noise suppression filter)」、IEEE trans. on Audio,Speech and Signal Processing、28巻、2号、138〜145ページ、1980、4月、Y.Ephraim、D.Malah、「最適非直線スペクトル振幅評価を用いる音声強調(Speech enhandement using optimal non‐linear spectral amplitude estimation)、Int.Conf.on Speech,Signal Processing、1118〜1121ページ、1983、Y.Ephraim、D.Malah、「最小平均二乗誤差短時間スペクトル振幅評価子を用いる音声強調(Speech enhandement using a minimum mean square error short‐time spectral amplitude estimator)、IEEE trans. on ASSP、32巻、6号、1109〜1121ページ、1984、参照)。
【0041】
上記短時間スペクトル変更規則は次の特徴を有する:
・短時間スペクトル減衰の計算は各スペクトル成分における雑音レベルの評価に依存し、各等式は量
【0042】
【数11】
【0043】
を含んでいる。したがって、この雑音低減技術(歪み、雑音レベルの効果的な低減)の性能は信号対雑音比のこの評価子の適切さにより支配される。
・それらの技術はブロックごとの処理を基にしており(連続するブロックの間で重なり合う可能性がある)、その処理は、雑音低減装置の入力端子に存在する、所与のフレームの全ての標本を単一のスペクトル減衰で濾波することにある。この特性は、フィルタがスペクトル領域内で乗算を適用されるという事実にある。これは、たとえば、ある語の始まりまたは終わりの場合、あるいは有声/無声が混じったフレームの場合でさえ、現在のフレームに存在する信号が第2種の静止仮定を満たさない場合に特に制限する。
・スペクトル領域内で行われる乗算は実際には周期的なくりこみ演算に相当する。実際には、歪みを避けるために、試みられる操作は線形くりこみである。それはある数の零標本を各入力フレームに加えること(零パッディングと呼ばれる技術)と、雑音低減フィルタのインパルス応答の時間領域サポートを制限することを目的とした付加処理を実行することとを要する。そのために、時間領域くりこみ制約はスペクトル変換の次数を、したがって、雑音低減処理の数学的な複雑さを、必然的に増加する。雑音低減フィルタのインパルス応答の時間領域サポートを制限するために最も用いられる技術は時間領域内に制約を導入することにある。それは(i)フィルタの伝達関数H(k,f)についての知識を基にしてインパルス応答h(k,n)を得るために第1の「逆」スペクトル変換と、(ii)このインパルス応答の点の数を制限すること、これによって切り詰められた時間領域フィルタh′(k,f)になる、その後で、(iii)変更された伝達関数H′(k,f)を得るために切り詰められたインパルス応答h′(k,n)を基にして第2の「直接」スペクトル変換とを要する。
・実際には、スペクトル変換演算を行う前に、各解析フレームには解析ウィンドウw(n)が乗ぜられる。雑音低減フィルタが全通過型(すなわち、
【0044】
【数12】
【0045】
であると、完全な再構成の条件が満たされることを希望するならば、解析ウィンドウは次の条件
【0046】
【数13】
【0047】
を満たさねばならない。この式では、パラメータDは連続する2つの解析フレームの間の移動(標本の数で)を表す。他方、重み付けウィンドウw(n)の選択(典型的にはHanning型、Hamming型、Blackman型等の)がW(f)の主ローブの幅と第2のローブの振幅(第1のローブの振幅に対する)を決定する。主ローブが広いとすると、元の信号の変換の速い遷移が非常に悪く近似される。第2のローブの相対的な振幅が大きいとすると、得られる近似は、特に不連続部を中心として、いらいらさせる発振を行うものである。したがって、関連するスペクトル解析要求(主ローブの幅の選択と、副ローブの振幅の選択)と、雑音低減濾波過程により導入される小さい遅延(処理の入力端子と出力端子とにおける信号の間の時間のずれ)の要求とを満たすことは困難である。第2の要求を満たすと、なんら重なり合うことのない連続するフレーム、したがって、長方形型解析ウィンドウを使用することになる。それによって関連するスペクトル解析を実行する結果となることはない。それらの要求を同時に満たす唯一のやり方は、適切な解析ウィンドウにより重み付けられているフレームに対して行われる第1のスペクトル変換を基にしてスペクトル解析を行い、かつウィンドウ化されていないデータに対して第2のスペクトル変換を並行に行う(スペクトル乗算によりくりこみ操作を行うために)ことである。実際には、そのような技術は数学的な複雑さの面で費用がかかり過ぎることが判明している。
【0048】
EP‐A‐0 710 947がエコー打ち消し器に結合されている雑音低減装置を開示している。雑音低減は、スペクトル解析中に信号対雑音比に従って評価される伝達関数H(k,f)の逆フーリェ変換により得られるインパルス応答によって、時間領域内でのブロックごとの濾波により実行される。
【発明の開示】
【課題を解決するための手段】
【0049】
本発明の主な目的は雑音低減法の性能を向上することである。
【0050】
したがって、本発明は、入力信号の引き続くフレーム中の雑音を低減する方法であって、下記のステップ、
‐周波数領域へ変換することにより入力信号のスペクトラムを計算することと、
‐周波数依存雑音レベル評価子を得ることと、
‐そのフレームに対する第1の有用な周波数依存信号レベル評価子を計算することと、
‐第1の雑音低減フィルタの伝達関数を、第1の有用な信号レベル評価子および雑音レベル評価子を基にして計算することと、
‐入力信号のスペクトラムと第1の雑音低減フィルタの伝達関数を組合わせることにより、そのフレームに対する第2の有用な周波数依存信号レベル評価子を計算することと、
‐第2の雑音低減フィルタの伝達関数を、第2の有用な信号レベル評価子および雑音レベル評価子を基にして計算することと、
‐雑音が低減された信号を生ずるために、フレーム濾波操作で第2の雑音低減フィルタの伝達関数を使用することと、
をフレームの少なくともいくつかに対して備える、入力信号の引き続くフレーム中の雑音を低減する方法を提供するものである。
【0051】
評価される雑音のレベルと有用な信号のレベルは通常はPSDsであり、またはより一般的にはそれらのPSDsに相関させられている量である。
【0052】
2つの操作における計算、それの特定の面が有用な信号のPSD γss(k,f)のより速い更新にある、によって従来の方法よりも大きな2つの利点を得る第2の雑音低減フィルタをもたらす結果となる。第1に、特に有用な信号の時間的な包絡線のより速い変化中に、有用な信号の非静止性のより速いトラッキングがある(たとえば、無声/音声遷移中にある音声信号を冒すすなわち消去する)。第2に、雑音低減フィルタはより良く評価される。これによってこの方法の性能が向上する結果となる(雑音が一層著しく低減しかつ有用な信号の劣化が減少する)。
【0053】
この方法は、3つ以上の操作が実行される場合に一般化できる。得られたp番目(p≧2)の伝達関数を基にして、有用な信号レベル評価子がその後で再計算され、(p+1)番目の伝達関数がその雑音低減のために再評価される。この方法の上記定義は、P>2の操作が行われる場合にも適用される。すなわち、この定義に従って「第1の有用な信号レベル評価子」を(p−1)番目の操作中に得られたものとして単に考察する必要がある。実際には、この方法の満足できる性能はP=2で観察される。
【0054】
この方法の1つの有利な実施形態では、スペクトラムの計算が、入力信号フレームをウィンドウ化関数により重み付けすることと、重み付けられたフレームを周波数領域へ変換することとで構成され、フレームのより近い半分に対してフレームのより近くない半分よりも強い重み付けを行うように、ウィンドウ化関数は非対称である。
【0055】
そのようなウィンドウ化関数の選択は、スペクトル評価の重みを最も近い標本へ向かって集中でき、一方では良いスペクトル特性を持つウィンドウを提供する(第2のローブの制御されている増加)ことを意味する。これによって信号の変化に迅速に追従できるようにされる。周波数を基にした解析のためのスペクトルのこの計算モードは、雑音低減フィルタの伝達関数の評価がただ1つの操作で行われる場合に適用することもできることに注目すべきである。
【0056】
この方法は、上記短時間スペクトル減衰法により、周波数領域内で入力信号がブロックごとに濾波される場合に使用できる。その後で、雑音を除去された信号がそれのスペクトル成分
【0057】
【数14】
【0058】
の形で発生される。それは直接利用でき(たとえば、符号化応用または音声認識応用において)、または信号
【0059】
【数15】
【0060】
を明確に得るために時間領域へ変換できる。
【0061】
しかし、この方法の1つの好適な実施形態では、雑音低減フィルタ・インパルス応答が、第2の雑音低減フィルタの伝達関数の時間領域への変換を基にして、現在のフレームに対して決定され、その時間領域内のフレームに対する濾波操作が前記フレームに対して決定されたインパルス応答により実行され、時間領域内のフレームに対する濾波操作は前記フレームに対して決定されたインパルス応答により実行される。
【0062】
有利なことに、そうすると、現在のフレームに対する雑音低減フィルタ・インパルス応答の決定は:
‐第2の雑音低減フィルタの伝達関数を時間領域へ変換して第1のインパルス応答を得るステップと、
‐第1のインパルス応答を、時間領域への変換の点の数より十分少ない(通常は少なくとも5分の1)標本数に対応する打ち切り長さに打ち切るステップと、
を備えている。
【0063】
雑音低減フィルタの時間領域サポートにおけるこの制限は2倍の利点をもたらす。まず、それは時間領域エイリアシング問題が避けられることを意味する(線形くりこみに従う)。第2に、有用な信号を劣化させることがある、強すぎるフィルタの作用を避けることを可能にする滑らかな作用を提供することである。それには、ウィンドウ化機能により切り詰められたインパルス応答が切り詰め長さに対応する標本の数に及ぼす重み付けが付随することがある。フィルタの時間領域サポートにおけるこの制限は、伝達関数の評価が単一の操作で行われる時に適用することもできる。
【0064】
濾波が時間領域において行われる時は、現在のフレームをいくつかのサブフレームに細分し、補間されたインパルス応答を各サブフレームに対して、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答と、少なくとも1つの以前のフレームに対して決定された雑音低減フィルタ・インパルス応答とを基にして計算すると有利である。そうするとフレームの濾波操作は、前記サブフレームに対して計算された補間されたインパルス応答に従って、時間領域内の各サブフレームの信号の濾波を含む。
【0065】
サブフレームへのこの処理によって、同じフレーム内で変化する雑音低減フィルタを適用することが可能になり、したがって、処理された信号の非静止性に良く適する。ボイス信号を処理する場合には、この状況には混合されているフレーム(すなわち、有声音と無声音を有するフレーム)で特に遭遇させられる。サブフレームへのこの処理は、フィルタの伝達関数の評価が単一の操作で行われる時にも適用できることが注目される。
【0066】
本発明の他の面は上記方法を実現するために構成された雑音低減装置に関する。
【0067】
本発明のその他の特徴およびその他の利点は、添付図面を参照しての、非限定的実施形態についての以下の説明で明らかになるであろう。
【発明を実施するための最良の形態】
【0068】
図1ないし図3は本発明の装置を別々のユニットの形で表したものである。この方法の1つの典型的な実現では、信号処理操作は、上記ユニットに対応する種々の機能モジュールを有するデジタル信号プロセッサ実行プログラムにより、通常のものとして、実行される。
【0069】
図1を参照して、本発明の雑音低減装置は、デジタル・オーディオ信号などの、入力信号x(n)を長さLの標本(整数kにより示されている)の引き続くフレームに分配するユニット1を有する。指標kの各フレームにウィンドウ化関数w(n)を乗ずることにより、それは重み付けられ(乗数2)て信号xw(k,n)=w(n).x(k,n)(0≦n<Lに対して)を生ずる。
【0070】
周波数領域への移行は、離散フーリェ変換(DFT)を、現在のフレームのフーリェ変換X(k,f)を行うユニット3により、重み付けられているフレームxw(k,n)に施すことによって行われる。
【0071】
本発明に含まれている、時間‐周波数領域遷移、およびその逆、のために、必要があれば下流側(ユニット7)で用いられるDFTおよび時間領域への逆変換(IDFT)は、有利なことに高速フーリェ変換(FFT)および逆高速フーリェ変換(IFFT)である。ウェーブレット(wavelet)変換などの、その他の時間‐周波数変換も使用できる。
【0072】
雑音のみのフレームを音声フレームから弁別し、現在のフレームに2進発声活動指示δを与えるために、ボイス活動検出(VAD)ユニット4が用いられる。信号x(k,n)を基にして時間領域において動作しるか、破線で示すように、信号X(k,f)を基にして周波数領域において動作するかによらず、いかなる既知のVAD法でも使用できる。
【0073】
VADはユニット5による雑音のPSDの評価を制御する。したがって、ユニット4により検出された各「雑音のみ」フレームkbに対して(δ=0)、雑音パワースペクトル密度
【0074】
【数16】
【0075】
は次の回帰式により計算される。
【0076】
【数17】
【0077】
ここにkbは、δ=0であれば現在の雑音フレーム、δ=1であれば最後の雑音フレームであり(kは有用な信号のフレームとして検出される)、α(kb)は時間的に変化できる平滑化パラメータである。
【0078】
【数18】
【0079】
の計算法は指数平滑化を行うこの評価子に限定されるものではなく、ユニット5で判定状態のいかなるPSD評価子も使用できることに気が付くであろう。
【0080】
現在のフレームのスペクトラムX(k,f)および雑音レベル評価
【0081】
【数19】
【0082】
を用いて、他のユニット6が雑音低減フィルタ
【0083】
【数20】
【0084】
の伝達関数(TF)を評価する。ユニット7はこのTFにIDFTを施して対応するインパルス応答
【0085】
【数21】
【0086】
を得る。
【0087】
ウィンドウ化関数wfilt(n)が乗算器8によりこのインパルス応答
【0088】
【数22】
【0089】
に乗ぜられて、雑音低減装置の時間領域フィルタのインパルス応答
【0090】
【数23】
【0091】
を得る。雑音を除去された時間領域信号
【0092】
【数24】
【0093】
を生ずるために濾波ユニット9により行われる操作は、それの原理として、現在のフレームに対して決定されたインパルス応答
【0094】
【数25】
【0095】
による入力信号のくりこみである。
【0096】
ウィンドウ化関数wfilt(n)はフレームの長さより著しく短いサポートを有する。いいかえると、IDFTの結果としてのインパルス応答
【0097】
【数26】
【0098】
が、関数wfilt(n)による重み付けがそれに適用される前に、切り詰められる。好ましいのは、標本の数として表される、切り詰め長さLfiltはフレームの長さの少なくとも5分の1である。それは通常はこのフレーム長さの10分の1の長さ程度である。
【0099】
インパルス応答の最上位のLfilt係数は、ウィンドウwfilt(n)による重み付けの主体であり、それはたとえば長さLfiltのHammingまたはHanningウィンドウである。
【0100】
【数27】
【0101】
雑音低減フィルタの時間領域サポートにおける制限は、線形くりこみを満たすために、時間領域エイリアシング問題を避けることを可能にする。更に、それは平滑化を行って、有用な信号を劣化させることがある、フィルタのあまりにも強過ぎる作用を避けることを可能する。
【0102】
図2は雑音低減フィルタの伝達関数
【0103】
【数28】
【0104】
を評価するユニット6の好適な構成を示す。その伝達関数は雑音b(n)のPSDと有用な信号s(n)のPSDに依存する。
【0105】
ユニット5が雑音のPSD
【0106】
【数29】
【0107】
をどのようにして評価できるかについて説明してきた。しかし、発声活動期間中は信号と雑音が混合されているので有用な信号のPSD γss(k,f)は直接得ることができない。それを予め評価するために、図2のユニット6のモジュール11は、下記の式に従って、たとえば、指令された決定評価子を使用する(Y.Ephraim、D.Malah、「最小平均二乗誤差短時間スペクトル振幅評価子を用いる音声強調(Speech enhandement using a minimummean square error short‐time spectral amplitude estimator)、IEEE trans. on ASSP、32巻、6号、1109〜1121ページ、1984、参照」。
【0108】
【数30】
【0109】
ここにβ(k)は時間的に変化できる重心パラメータ、
【0110】
【数31】
【0111】
は指標k−1の先行フレームに対して評価された有用な信号のスペクトラムである(たとえば、図2の乗算器12により得られた、
【0112】
【数32】
【0113】
)。関数Pは、評価の誤りの場合に負となる危険を招く量
【0114】
【数33】
【0115】
のしきい値化を行う。それは、
【0116】
【数34】
【0117】
により与えられる。
【0118】
【数35】
【0119】
の計算はこの指定された決定評価子に限定されないことに注意すべきである。実際に、指数平滑化評価子または他の任意のパワースペクトル密度評価子を使用できる。
【0120】
現在のフレームに対する雑音低減フィルタのTFの予評価がモジュール13によって、評価されたPSDs
【0121】
【数36】
【0122】
の関数として計算される:
【0123】
【数37】
【0124】
このモジュール13は、振幅スペクトル差し引き((4)に従って
【0125】
【数38】
【0126】
)のパワースペクトル差し引き((3)に従って
【0127】
【数39】
【0128】
)の規則、または開ループ・ウィーナーフィルタ((5)に従ってF(y,z)=y/(y+z)の規則を特に実現できる。
【0129】
通常は、雑音低減フィルタの最後の伝達関数は式(4)を用いて得られる。このフィルタの性能を向上するために、2回の操作に反復手順を用いてそれを評価することが提案されている。最初の操作はモジュール11ないし13により行われる動作で構成されている。
【0130】
そのようにして得られた伝達関数
【0131】
【数40】
【0132】
を再び用いて有用な信号のPSDの評価を改善する。ユニット6(乗算器14とモジュール15)は、このために、
【0133】
【数41】
【0134】
により与えられる量
【0135】
【数42】
【0136】
を計算する。そうすると第2の操作は、モジュール16に対しては、雑音低減フィルタの伝達関数の最後の評価子
【0137】
【数43】
【0138】
を、有用な信号のPSDの改善された評価を基にして計算することにある。
【0139】
【数44】
【0140】
関数Fはモジュール13により使用されたものと同じにできる。
【0141】
2回の操作におけるこの計算によって有用な信号のPSD
【0142】
【数45】
【0143】
のより速い更新とフィルタのより良い評価が可能にされる。
【0144】
図3はN個のサブフレームへの細分を基にした、したがって、同じ信号フレーム内で展開できる雑音低減機能の応用を可能にする時間領域濾波ユニット9の好適な構成を示す。
【0145】
モジュール21が、サブフレーム
【0146】
【数46】
【0147】
(iは1からNまで増大する)のフィルタのN≧2のセットのインパルス応答を得るために、切り詰められ、かつ重みづけられインパルス応答
【0148】
【数47】
【0149】
の補間を行う。
【0150】
サブフレームを基にした濾波は長さLfiltの横型フィルタ(transverse filter)23を用いて実現できる。それの係数
【0151】
【数48】
【0152】
(0≦n≦Lfilt、1≦i≦N)は、現在のフレームの指標iを基にしてセレクタ22により縦続して提供される。濾波すべき信号のサブフレームは入力フレームx(k,n)の細分により得られる。横型フィルタ23は、現在のサブフレームに関連させられている係数
【0153】
【数49】
【0154】
を持つ入力信号x(n)のくりこみにより雑音が低減された信号
【0155】
【数50】
【0156】
をこのようにして計算する。
【0157】
サブフレーム・フィルタの応答
【0158】
【数51】
【0159】
はモジュール21により、現在のフレームに対して決定されたインパルス応答
【0160】
【数52】
【0161】
の重み付けられた和と、以前のフレームに対して決定されたインパルス応答
【0162】
【数53】
【0163】
の重み付けられた和として計算できる。サブフレームがフレーム内で規則的に分割されると、重み付けられた混合関数を特に
【0164】
【数54】
【0165】
とすることができる。フィルタ
【0166】
【数55】
【0167】
が直接適用される場合がN=1(サブフレーム無し)に対応することが観察される。
【0168】
実施例 1
この実施例は会話による通信、特に低ビット速度の音声符号器の前処理に、適用するのに適する。
【0169】
処理により導入される遅延を理論的な最大まで短縮し、しかも適用に適切なウィンドウを選択する可能性を利用者に提供するために、重なり合わないウィンドウが使用される。これは、装置の入力信号のウィンドウ化が完全な再構成制約を受けないので、可能である。
【0170】
そのような応用では、あまり近くない半分よりも一層近い半分に対してより大きな重み付けを行うために、乗算器2により適用されるウィンドウ化関数w(n)は非対称であることが有利である。
【0171】
図4に示されているように、異なるサイズL1とL2の2つのHanning半ウィンドウを用いて非対称解析ウィンドウw(n)を構成できる。
【0172】
【数56】
【0173】
移動用の多数の音声符号器は長さが20msのフレームを使用し、Fe=8kHzの標本化周波数(すなわち、フレーム当り160お標本)で動作する。図4に示されている実施例では、次の値が選択されている。L=160、L1=120およびL2=40。
【0174】
そのようなウィンドウの選択は、スペクトル評価の重みを最も近い標本へ向かって集中して、良いスペクトル・ウィンドウを確保できることを意味する。提案されている方法によってそのような選択が可能にされる。その理由は、合成における信号の完全な再構成の制約がないからである(時間領域濾波による出力端子における信号再構成)。
【0175】
周波数分解を一層良くするために、ユニット3と7は長さLFFT=256のFFTを使用する。この選択の背後にはある理由も存在する。その理由は、長さが2のべきであるフレームにFFTが適用される時に、FFTが数値的に最適であるからである。したがって、ウィンドウ・ブロックxw(k,n)をLFFT−L=96零標本(零パッディング)だけ前もって拡張する必要がある。
xw(k,n)=0 L≦n<LFFTに対して (19)
この実施例で用いられるボイス活動は、信号における短期間/長期間エネルギー比較を基にする従来の方法である。雑音パワースペクトル密度γbb(k,f)の評価は、信頼できる評価と雑音統計量の時間領域変動のトラッキングとの間の妥協を確保するために十分であるとみなされる、128msの時定数に対応する、α(kb)=0.8553である式(10)に従って、指数的平滑化により更新される。
【0176】
雑音低減フィルタ
【0177】
【数57】
【0178】
のTFは、β(k)=0.98である(12)で定められている指定された決定評価子に従って有用な信号のPSDを前に評価した後で、式(5)(開ループ・ウィーナーフィルタ)に従って予め評価される。TFの最後の評価
【0179】
【数58】
【0180】
を生ずるために同じ関数Fがモジュール16により再び使用される。
【0181】
【数59】
【0182】
は実数値にされたTFであるので、時間領域フィルタは、
【0183】
【数60】
【0184】
により原因にされる。
【0185】
その後でこのフィルタのLfilt=21係数を選択する。それは長さLfilt、この応用のための重要な標本に対応する値である、のHanningウィンドウwfilt(n)により重み付けられている。
【0186】
【数61】
【0187】
ここに
【0188】
【数62】
【0189】
時間領域濾波は、(17)により得られたサブフレーム
【0190】
【数63】
【0191】
のN=4個のフィルタにより行われる。それら4個のフィルタはその後で長さLfilt=21の横濾波(transverse filtering)を用いて入力信号x(i)(k,n)に適用される。それらのサブフレームは観察信号x(k,n)
のサイズL/4=40個の標本の連続抽出により得られている。
【0192】
実施例 2
この実施例の装置は高性能の音声認識(騒がしい環境内での)への応用に適している。
【0193】
この実施例では、連続する2つのフレームの間のL/2個の標本の相互に重なり合っている長さLの解析フレームが用いられ、用いられるウィンドウはHanninng型のものである。
【0194】
【数64】
【0195】
フレーム長さは20msに固定される、すなわち、標本化周波数Fe=8kHzにおいてL=160であり、フレームはFFTのために96の零標本が補充される(「零パッディング」。
【0196】
この実施例では、雑音低減フィルタのTFの計算は、雑音
【0197】
【数65】
【0198】
のパワースペクトル密度の平方根と有用な信号
【0199】
【数66】
【0200】
のパワースペクトル密度の平方根との比を基にしており、したがって、雑音
【0201】
【数67】
【0202】
の評価の係数と有用な信号
【0203】
【数68】
【0204】
の評価の係数との比を基にしている。
【0205】
この実施例で使用されるボイス活動検出は、信号における短期間/長期間エネルギー比較を基にしている既存の従来方法である。雑音信号
【0206】
【数69】
【0207】
【数70】
【0208】
により更新される。ここにkbは現在の雑音フレームまたは最後の雑音フレームである(kが有用な信号フレームとして検出されるならば)。平滑化量αは定数として選択され、0.99に等しい。これは1.6sの時定数である。
【0209】
雑音低減フィルタ
【0210】
【数71】
【0211】
のTFは、
【0212】
【数72】
【0213】
に従ってモジュール13により予め評価される。ここに、
F(y,z)=y/(y+z) (26)
である。
【0214】
平方根を計算するとその係数に対して評価を行うことが可能にされる。それは、
【0215】
【数73】
【0216】
によりSNR η(k,f)に関連させられている。
【0217】
係数
【0218】
【数74】
【0219】
としての有用な信号の評価子は、
【0220】
【数75】
【0221】
により得られる。ここにβ(k)=0.98である。
【0222】
乗算器14は予め評価されたTF
【0223】
【数76】
【0224】
とスペクトラムX(k,f)の乗算を行い、その結果の係数(そしてそれの二乗ではない)は15で得られて、
【0225】
【数77】
【0226】
の改善された評価を提供し、それを基にして係数16は(25)におけるのと同じ関数Fを用いてTFの最後の評価
【0227】
【数78】
【0228】
を生ずる。
【0229】
その後で時間領域応答
【0230】
【数79】
【0231】
が実施例1と全く同じやり方で得られる(時間領域への遷移、因果関係の復帰、重要な標本の選択およびウィンドウ化)。唯一の違いは、係数Lfiltの選択された数の選択にある。それはこの実施例ではLfilt=17に固定される。
【0232】
入力フレームx(k,n)は、得られた雑音低減フィルタ時間領域応答
【0233】
【数80】
【0234】
に直接加えることにより、濾波される。サブフレームで濾波を行わないと式(17)でN=1を取ることになる。
【図面の簡単な説明】
【0235】
【図1】本発明の方法を実施するために構成された雑音低減装置のブロック図である。
【図2】図1の装置で使用できる雑音低減フィルタの伝達関数を評価するユニットのブロック図である。
【図3】図1の装置で使用できる時間領域濾波ユニットのブロック図である。
【図4】この方法の特定の実施形態で使用できるウィンドウ化関数のグラフである。
Claims (18)
- 入力信号(x(n))の引き続くフレーム中の雑音を低減する方法であって、下記のステップ、
‐周波数領域へ変換することにより入力信号(x(n))のスペクトラム(X(k,f))を計算することと、
‐周波数依存雑音レベル評価子を得ることと、
‐そのフレームに対する第1の有用な周波数依存信号レベル評価子を計算することと、
‐第1の雑音低減フィルタの伝達関数
‐入力信号のスペクトラムと第1の雑音低減フィルタの伝達関数を組合わせることにより、そのフレームに対する第2の有用な周波数依存信号レベル評価子を計算することと、
‐第2の雑音低減フィルタの伝達関数
‐雑音が低減された信号を生ずるために、フレーム濾波操作で第2の雑音低減フィルタの伝達関数を使用することと、
をフレームの少なくともいくつかに対して備える、入力信号(x(n))の引き続くフレーム中の雑音を低減する方法。 - スペクトラム(X(k,f))の計算が、入力信号フレームをウィンドウ化関数(w(n))により重み付けすることと、重み付けられたフレームを周波数領域へ変換することとを備え、フレームのより近い半分に対してフレームのより近くない半分よりも強い重み付けを行うように、ウィンドウ化関数は非対称である請求項1に記載の方法。
- 入力信号(x(n))がオーディオ信号である請求項1から請求項8のいずれか1項に記載の方法。
- ‐周波数領域への変換により入力信号のフレームのスペクトラム(X(k,f))を計算する手段(1〜3)と、
‐周波数依存雑音レベル評価子を得る手段(5)と、
‐そのフレームに対する第1の有用な周波数依存信号レベル評価子を計算する手段(11)と、
‐第1の雑音低減フィルタの伝達関数
‐入力信号のスペクトラムと第1の雑音低減フィルタの伝達関数を組合わせることにより、フレームに対する第2の有用な周波数依存信号レベル評価子を計算する手段(14〜15)と、
‐第2の雑音低減フィルタの伝達関数
‐雑音が低減されている信号を生ずるためにフレームを第2の雑音低減フィルタの伝達関数により濾波する手段(7〜9)と、
を備える入力信号(x(n))中の雑音を低減する装置。 - スペクトラム計算手段が、入力信号フレームをウィンドウ化関数(w(n))により重み付けする手段(2)と、重み付けられたフレームを周波数領域へ変換する手段(3)とを備え、フレームのより近い半分に対してフレームのより近くない半分よりも強い重み付けを行うように、ウィンドウ化関数は非対称である請求項10に記載の装置。
- 雑音低減フィルタ・インパルス応答を決定する手段(8)が、打ち切られているインパルス応答に、前記打ち切り長さに対応する標本の数で、ウィンドウ化関数(wfilt(n))により重み付けする手段(8)を備えている請求項13に記載の装置。
- 入力信号(x(n))がオーディオ信号である請求項10から請求項17のいずれか1項に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0101220A FR2820227B1 (fr) | 2001-01-30 | 2001-01-30 | Procede et dispositif de reduction de bruit |
PCT/FR2001/003624 WO2002061731A1 (fr) | 2001-01-30 | 2001-11-19 | Procede et dispositif de reduction de bruit |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004520616A true JP2004520616A (ja) | 2004-07-08 |
JP2004520616A5 JP2004520616A5 (ja) | 2005-11-17 |
JP4210521B2 JP4210521B2 (ja) | 2009-01-21 |
Family
ID=8859390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002561819A Expired - Fee Related JP4210521B2 (ja) | 2001-01-30 | 2001-11-19 | 雑音低減法および装置 |
Country Status (14)
Country | Link |
---|---|
US (1) | US7313518B2 (ja) |
EP (1) | EP1356461B1 (ja) |
JP (1) | JP4210521B2 (ja) |
KR (1) | KR100549133B1 (ja) |
CN (1) | CN1284139C (ja) |
AT (1) | ATE472794T1 (ja) |
BR (1) | BRPI0116844B1 (ja) |
CA (1) | CA2436318C (ja) |
DE (1) | DE60142490D1 (ja) |
ES (1) | ES2347760T3 (ja) |
FR (1) | FR2820227B1 (ja) |
HK (1) | HK1057639A1 (ja) |
MX (1) | MXPA03006667A (ja) |
WO (1) | WO2002061731A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9613631B2 (en) | 2005-07-27 | 2017-04-04 | Nec Corporation | Noise suppression system, method and program |
JP2021149084A (ja) * | 2020-03-13 | 2021-09-27 | ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド | オーディオ信号処理方法および装置、記憶媒体 |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7885420B2 (en) | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US8073689B2 (en) * | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US7725315B2 (en) | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US7949522B2 (en) * | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US7895036B2 (en) | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7778425B2 (en) * | 2003-12-24 | 2010-08-17 | Nokia Corporation | Method for generating noise references for generalized sidelobe canceling |
US7516069B2 (en) * | 2004-04-13 | 2009-04-07 | Texas Instruments Incorporated | Middle-end solution to robust speech recognition |
EP1591995B1 (en) * | 2004-04-29 | 2019-06-19 | Harman Becker Automotive Systems GmbH | Indoor communication system for a vehicular cabin |
ATE476733T1 (de) * | 2004-09-16 | 2010-08-15 | France Telecom | Verfahren zum verarbeiten eines rauschbehafteten tonsignals und einrichtung zur implementierung des verfahrens |
US7383179B2 (en) * | 2004-09-28 | 2008-06-03 | Clarity Technologies, Inc. | Method of cascading noise reduction algorithms to avoid speech distortion |
KR100565086B1 (ko) * | 2004-10-13 | 2006-03-30 | 삼성전자주식회사 | 뮤지컬 잡음을 감쇄하는 스펙트럼 잡음 제거 방법 및 그장치 |
JP5202960B2 (ja) | 2005-01-31 | 2013-06-05 | スカイプ | 通信システムにおけるフレームの連結方法 |
FR2888458A1 (fr) * | 2005-07-11 | 2007-01-12 | France Telecom | Procede et dispositif de prise de son, notamment dans des terminaux telephoniques en "mains libres" |
US8358866B2 (en) * | 2006-01-31 | 2013-01-22 | Canadian Space Agency | Method and system for increasing signal-to-noise ratio |
JP4827661B2 (ja) * | 2006-08-30 | 2011-11-30 | 富士通株式会社 | 信号処理方法及び装置 |
JP4653059B2 (ja) * | 2006-11-10 | 2011-03-16 | オリンパス株式会社 | 撮像システム、画像処理プログラム |
ATE454696T1 (de) * | 2007-08-31 | 2010-01-15 | Harman Becker Automotive Sys | Schnelle schätzung der spektraldichte der rauschleistung zur sprachsignalverbesserung |
ATE456130T1 (de) * | 2007-10-29 | 2010-02-15 | Harman Becker Automotive Sys | Partielle sprachrekonstruktion |
US20100151118A1 (en) * | 2008-12-17 | 2010-06-17 | Eastman Chemical Company | Carrier solvent compositions, coatings compositions, and methods to produce thick polymer coatings |
WO2013046055A1 (en) * | 2011-09-30 | 2013-04-04 | Audionamix | Extraction of single-channel time domain component from mixture of coherent information |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
CN102783043B (zh) * | 2012-05-04 | 2014-07-30 | 华为技术有限公司 | 一种信号发送方法、通信设备及系统 |
CN103916730B (zh) * | 2013-01-05 | 2017-03-08 | 中国科学院声学研究所 | 一种能够改善音质的声场聚焦方法及系统 |
CN103916733B (zh) * | 2013-01-05 | 2017-09-26 | 中国科学院声学研究所 | 基于均方误差最小准则的声能量对比控制方法及系统 |
US9318125B2 (en) * | 2013-01-15 | 2016-04-19 | Intel Deutschland Gmbh | Noise reduction devices and noise reduction methods |
ES2635027T3 (es) | 2013-06-21 | 2017-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para el desvanecimiento de señales mejorado para sistemas de codificación de audio cambiados durante el ocultamiento de errores |
US10149047B2 (en) * | 2014-06-18 | 2018-12-04 | Cirrus Logic Inc. | Multi-aural MMSE analysis techniques for clarifying audio signals |
WO2017193264A1 (en) | 2016-05-09 | 2017-11-16 | Harman International Industries, Incorporated | Noise detection and noise reduction |
CN108848435B (zh) * | 2018-09-28 | 2021-03-09 | 广州方硅信息技术有限公司 | 一种音频信号的处理方法和相关装置 |
CN110010144A (zh) * | 2019-04-24 | 2019-07-12 | 厦门亿联网络技术股份有限公司 | 语音信号增强方法及装置 |
CN111968615A (zh) * | 2020-08-31 | 2020-11-20 | Oppo广东移动通信有限公司 | 降噪处理方法及装置、终端设备和可读存储介质 |
US12062369B2 (en) * | 2020-09-25 | 2024-08-13 | Intel Corporation | Real-time dynamic noise reduction using convolutional networks |
CN112489615B (zh) * | 2020-10-29 | 2024-06-18 | 宁波方太厨具有限公司 | 降噪方法、降噪系统、降噪装置及吸油烟机 |
CN112960012B (zh) * | 2021-02-03 | 2022-05-31 | 中国铁道科学研究院集团有限公司节能环保劳卫研究所 | 基于阈值归一化短时功率谱密度的高速铁路钢轨波磨声学诊断方法 |
CN116952356B (zh) * | 2023-07-24 | 2024-08-06 | 中国人民解放军海军工程大学 | 基于浅海环境水下声全息技术的近场辐射噪声测量方法 |
CN116952355B (zh) * | 2023-07-24 | 2024-05-14 | 中国人民解放军海军工程大学 | 一种浅海环境近场辐射噪声测量系统及终端 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5630013A (en) * | 1993-01-25 | 1997-05-13 | Matsushita Electric Industrial Co., Ltd. | Method of and apparatus for performing time-scale modification of speech signals |
FR2726392B1 (fr) * | 1994-10-28 | 1997-01-10 | Alcatel Mobile Comm France | Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant |
FR2729247A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
JP2760373B2 (ja) * | 1995-03-03 | 1998-05-28 | 日本電気株式会社 | 雑音消去装置 |
JP2874679B2 (ja) | 1997-01-29 | 1999-03-24 | 日本電気株式会社 | 雑音消去方法及びその装置 |
US5999561A (en) * | 1997-05-20 | 1999-12-07 | Sanconix, Inc. | Direct sequence spread spectrum method, computer-based product, apparatus and system tolerant to frequency reference offset |
FR2771542B1 (fr) * | 1997-11-21 | 2000-02-11 | Sextant Avionique | Procede de filtrage frequentiel applique au debruitage de signaux sonores mettant en oeuvre un filtre de wiener |
US6549586B2 (en) * | 1999-04-12 | 2003-04-15 | Telefonaktiebolaget L M Ericsson | System and method for dual microphone signal noise reduction using spectral subtraction |
US6792405B2 (en) * | 1999-12-10 | 2004-09-14 | At&T Corp. | Bitstream-based feature extraction method for a front-end speech recognizer |
-
2001
- 2001-01-30 FR FR0101220A patent/FR2820227B1/fr not_active Expired - Fee Related
- 2001-11-19 US US10/466,816 patent/US7313518B2/en not_active Expired - Lifetime
- 2001-11-19 KR KR1020037010104A patent/KR100549133B1/ko active IP Right Grant
- 2001-11-19 ES ES01273554T patent/ES2347760T3/es not_active Expired - Lifetime
- 2001-11-19 CN CNB018223583A patent/CN1284139C/zh not_active Expired - Lifetime
- 2001-11-19 AT AT01273554T patent/ATE472794T1/de not_active IP Right Cessation
- 2001-11-19 MX MXPA03006667A patent/MXPA03006667A/es active IP Right Grant
- 2001-11-19 DE DE60142490T patent/DE60142490D1/de not_active Expired - Lifetime
- 2001-11-19 BR BRPI0116844-4A patent/BRPI0116844B1/pt active IP Right Grant
- 2001-11-19 CA CA002436318A patent/CA2436318C/fr not_active Expired - Lifetime
- 2001-11-19 EP EP01273554A patent/EP1356461B1/fr not_active Expired - Lifetime
- 2001-11-19 JP JP2002561819A patent/JP4210521B2/ja not_active Expired - Fee Related
- 2001-11-19 WO PCT/FR2001/003624 patent/WO2002061731A1/fr active IP Right Grant
-
2003
- 2003-12-11 HK HK03109037.3A patent/HK1057639A1/xx not_active IP Right Cessation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9613631B2 (en) | 2005-07-27 | 2017-04-04 | Nec Corporation | Noise suppression system, method and program |
JP2021149084A (ja) * | 2020-03-13 | 2021-09-27 | ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド | オーディオ信号処理方法および装置、記憶媒体 |
JP7062727B2 (ja) | 2020-03-13 | 2022-05-06 | ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド | オーディオ信号処理方法および装置、記憶媒体 |
US11490200B2 (en) | 2020-03-13 | 2022-11-01 | Beijing Xiaomi Pinecone Electronics Co., Ltd. | Audio signal processing method and device, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
KR100549133B1 (ko) | 2006-02-03 |
ES2347760T3 (es) | 2010-11-04 |
US20040064307A1 (en) | 2004-04-01 |
ATE472794T1 (de) | 2010-07-15 |
BR0116844A (pt) | 2003-12-16 |
WO2002061731A1 (fr) | 2002-08-08 |
FR2820227B1 (fr) | 2003-04-18 |
CA2436318A1 (fr) | 2002-08-08 |
BRPI0116844B1 (pt) | 2015-07-28 |
KR20030074762A (ko) | 2003-09-19 |
CA2436318C (fr) | 2007-09-04 |
US7313518B2 (en) | 2007-12-25 |
HK1057639A1 (en) | 2004-04-08 |
JP4210521B2 (ja) | 2009-01-21 |
EP1356461B1 (fr) | 2010-06-30 |
EP1356461A1 (fr) | 2003-10-29 |
FR2820227A1 (fr) | 2002-08-02 |
CN1284139C (zh) | 2006-11-08 |
CN1488136A (zh) | 2004-04-07 |
DE60142490D1 (de) | 2010-08-12 |
MXPA03006667A (es) | 2003-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4210521B2 (ja) | 雑音低減法および装置 | |
JP5068653B2 (ja) | 雑音のある音声信号を処理する方法および該方法を実行する装置 | |
US8010355B2 (en) | Low complexity noise reduction method | |
EP1169883B1 (en) | System and method for dual microphone signal noise reduction using spectral subtraction | |
KR100594563B1 (ko) | 선형 컨벌루션 및 인과 필터링을 사용하는 스펙트럼 감산에 의한 신호 잡음 감소 | |
US6487257B1 (en) | Signal noise reduction by time-domain spectral subtraction using fixed filters | |
CN111554315B (zh) | 单通道语音增强方法及装置、存储介质、终端 | |
RU2768514C2 (ru) | Процессор сигналов и способ обеспечения обработанного аудиосигнала с подавленным шумом и подавленной реверберацией | |
Soon et al. | Improved noise suppression filter using self-adaptive estimator of probability of speech absence | |
US8218780B2 (en) | Methods and systems for blind dereverberation | |
CN102347028A (zh) | 双麦克风语音增强装置及方法 | |
JP2004502977A (ja) | サブバンド指数平滑雑音消去システム | |
AT509570B1 (de) | Methode und apparat zur einkanal-sprachverbesserung basierend auf einem latenzzeitreduzierten gehörmodell | |
Ghribi et al. | A wavelet-based forward BSS algorithm for acoustic noise reduction and speech enhancement | |
EP1995722B1 (en) | Method for processing an acoustic input signal to provide an output signal with reduced noise | |
Li et al. | A block-based linear MMSE noise reduction with a high temporal resolution modeling of the speech excitation | |
Upadhyay et al. | A perceptually motivated stationary wavelet packet filterbank using improved spectral over-subtraction for enhancement of speech in various noise environments | |
Djendi | A new efficient wavelet-based adaptive algorithm for automatic speech quality enhancement | |
Buragohain et al. | Single Channel Speech Enhancement System using Convolutional Neural Network based Autoencoder for Noisy Environments | |
Arslan et al. | Speech enhancement for crosstalk interference | |
Krishnamoorthy et al. | Processing noisy speech for enhancement | |
Tsukamoto et al. | Speech enhancement based on MAP estimation with a variable speech distribution | |
Goli et al. | Adaptive speech noise cancellation using wavelet transforms | |
Leibrich et al. | A TF distribution for disturbed and undisturbed speech signals and its application to noise reduction | |
Nakatani et al. | Real-time speech enhancement in noisy reverberant multi-talker environments based on a location-independent room acoustics model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040408 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070613 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070910 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081008 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081027 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4210521 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111031 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111031 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121031 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121031 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131031 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |