JP2004520616A - 雑音低減法および装置 - Google Patents

雑音低減法および装置 Download PDF

Info

Publication number
JP2004520616A
JP2004520616A JP2002561819A JP2002561819A JP2004520616A JP 2004520616 A JP2004520616 A JP 2004520616A JP 2002561819 A JP2002561819 A JP 2002561819A JP 2002561819 A JP2002561819 A JP 2002561819A JP 2004520616 A JP2004520616 A JP 2004520616A
Authority
JP
Japan
Prior art keywords
noise reduction
frame
impulse response
reduction filter
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002561819A
Other languages
English (en)
Other versions
JP4210521B2 (ja
JP2004520616A5 (ja
Inventor
パスカル スカラル、
クロード マロ、
ローラン モウアリ、
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=8859390&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2004520616(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2004520616A publication Critical patent/JP2004520616A/ja
Publication of JP2004520616A5 publication Critical patent/JP2004520616A5/ja
Application granted granted Critical
Publication of JP4210521B2 publication Critical patent/JP4210521B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01LMEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
    • G01L21/00Vacuum gauges
    • G01L21/02Vacuum gauges having a compression chamber in which gas, whose pressure is to be measured, is compressed

Abstract

本発明は、周波数領域内で入力信号を解析する際に、入力信号フレーム中の雑音レベル評価子と有用な信号レベル評価子を決定することにより、第1の雑音低減フィルタの伝達関数を計算可能にすること、信号スペクトラムと第1の伝達関数を組合わせることにより有用な信号を微調整するため、その後で、微調整された有用な信号レベル評価子および雑音レベル評価子を基にして第2の雑音低減フィルタの伝達関数を計算するために第2の操作を行うこととにある方法に関するものである。その後で前記第2の雑音低減フィルタを用いてフレーム中の雑音レベルを低減する。

Description

【技術分野】
【0001】
本発明は入力信号中に存在する雑音レベルを低減するために用いられる信号処理技術に関するものである。
【0002】
重要な応用分野は、
・雑音の多い環境における電話会議またはテレビ会議(専用室内またはマルチメディア・コンピュータからでさえ、等);
・電話:固定電話または携帯電話等の端末器と、伝送ネットワークとの少なくとも一方における処理;
・特に事務所、車両または携帯端末機におけるハンドフリー端末機;
・公共の場所(駅、空港、等)における音を拾うこと;
・車両内で両手を使用せずに音を拾うこと;
・騒がしい環境内で音声を確実に認識すること;
・映画およびメディア(たとえば、スポーツ報道または演奏会のための、ラジオ、テレビジョン、等)のために音響を拾うこと;
を非限定的に含めた、オーディオ信号(音声または音楽)処理の分野である。
【0003】
本発明は、雑音を含んでいる観察から有用な情報を取り出す必要がある分野であればどのような分野にも応用できる。特に、次の分野を引用できる:水中画像観測、水中リモートセンシング、バイオメディカル信号処理(EEG、ECG、バイオメディカル画像形成、等)。
【背景技術】
【0004】
集音の特徴的な問題は、集音マイクロホンが設置される音響環境に関連し、更に詳しくいえばその環境を完全に管理統制することは不可能であるので、観測信号中には妨害信号(雑音と呼ばれる)も存在する。
【0005】
信号の質を高めるために、雑音が含まれている観測信号を処理することにより有用な情報を取り出す目的で雑音低減装置が開発されている。オーディオ信号が遠く離れた所から送られてきた音声信号である場合は、それらの装置を用いてそれの了解度を高め、通信相手に及ぼす負担を軽減するためにそれらの装置を使用できる。会話通信のそれらの応用に加えて、音声信号の質を高めることによって音声認識に有用なことが判明もした。使用者が騒がしい環境に居ると音声認識性が大きく損なわれる。
【0006】
雑音低減操作を実行するための信号処理技術の選択は、まず、処理の入力側において利用できる観測数に依存する。ここでの説明では、ただ1つの観測信号を利用できる場合について考えることにする。この単一獲得問題に適用される雑音低減法は、時間進み/時間遅れを伴う適応濾波、パラメトリック・カルマン濾波、または短時間スペクトル変更による濾波までも、などの信号処理技術に主として依存する。
【0007】
後者の集り(短時間スペクトル変更による濾波)は、包含されている概念が簡単で、それらをプログラムするために要する基本的なツール(たとえば、離散フーリェ変換)の有用性が広いために、産業機器に使用されているほぼ全ての解決技術を組合わせている。しかし、それらの雑音低減技術の急速な進歩は、処理操作の出力側で使用できる信号を大きく歪ませることなしに、信号処理プロセッサでそれらの処理操作を実時間で容易に実行する可能性に大きく依存している。この集まりの方法では、処理は、雑音低減フィルタの伝達関数を評価することと、その後でブロックごとの処理でスペクトル領域内での乗算を基にして濾波を行うことにのみ最もしばしばある。スペクトル領域内での乗算によって短時間スペクトル減衰による雑音低減が可能にされる。
【0008】
所望の信号s(n)と妨害信号b(n)との混合から生ずる、雑音を含んでいる観測信号はx(n)と記される。ここにnは離散時間内での時間指標を示す。離散時間における表現の選択は、信号のデジタル処理へ向けられる手法に関連させられるが、上記方法は連続時間信号にも適用されることに気が付くであろう。信号は一定長さの指標kの連続する区画すなわちフレームで解析される。離散時間領域および離散周波数領域での表現のために現在使用されている記法は:
・X(k,f):解析される信号x(n)のk番目のフレーム(kはフレーム指標)のフーリェ変換(fは周波数指標);
・S(k,f):所望の信号s(n)のk番目のフレームのフーリェ変換;

【0009】
【数1】
Figure 2004520616
【0010】
:量(時間領域内または周波数領域内の)vの評価;たとえば、
【0011】
【数2】
Figure 2004520616
【0012】
は所望の信号のフーリェ変換の評価である;
・γuu(f):信号u(n)のパワースペクトル密度(PSD)である。
【0013】
ほとんどの雑音低減技術では、雑音を含んでいる信号x(n)は周波数領域内で濾波を受けて、いかなる妨害も受けていない元の信号s(n)にできるだけ近い有用な評価された信号
【0014】
【数3】
Figure 2004520616
【0015】
を生ずる。前に示したように、この濾波操作は、雑音を含んでいる信号の各周波数成分fを減少することにあり、その信号にはその周波数成分中の評価された信号対雑音比(SNR)を与えられている。周波数fに依存する、このSNRをここではフレームkに対してη(k,f)と記すことにする。
【0016】
各フレームに対して、雑音低減フィルタを計算するために求められるスペクトル量の後での評価を改善するために、信号に重み付けウィンドウをまず乗ずる。そのようにしてウィンドウ化された各フレームをその後でスペクトル領域内で解析する(それの最初の実行では離散フーリェ変換を一般に用いる)。この操作は短時間フーリェ変換(STFT)と呼ばれている。観測された信号のこの周波数領域表現X(k,f)は、雑音低減フィルタの伝達関数H(k,f)を同時に評価するため、およびこのフィルタを、この伝達関数に雑音を含んでいる信号の短時間スペクトルを単に乗ずることにより、スペクトル領域に適用するために、使用できる。すなわち、
【0017】
【数4】
Figure 2004520616
【0018】
である。
【0019】
このようにして得られた信号はその後で簡単な逆スペクトル変換により時間領域へ戻される。雑音を除去された信号はブロックの重ね合わせおよび加え合わせの技術(OLA、「重ね合わせ−加え合わせ」)またはブロックをセーブする技術(OLS、「重ね合わせ−セーブ」)により一般に合成される。時間領域内の信号を再構成するこの操作は逆短時間フーリェ変換(ISTFT)と呼ばれる。
【0020】
短時間スペクトル減衰法についての詳細な説明が次の文献に見出される:J.S.Lim、A.V.Oppenheim、「雑音を含む音声の強調および帯域幅圧縮(Enhancement and bandwith compression of noisy speech)」Proceeding of the IEEE、67巻、1586〜1604ページ、1979;R.E.Crochiere、L.R.Rabiner、「マルチレート・デジタル信号処理(Multirate digital signal processing)」Prentice Hall、1983。
【0021】
そのような雑音低減装置により実行される主な作業は:
・有声検出(VAD);
・無声期間中の雑音のパワースペクトル密度(PSD)の評価;
・雑音のスペクトル成分を抑制するための規則を基にして評価された短時間スペクトル減衰の適用;
・処理された信号のOLS型またはOLA型技術を基にした合成。
【0022】
雑音成分を抑制する規則は伝送される信号の質を決定するので、その規則の選択は重要である。それらの抑制技術は雑音を含んでいる信号のスペクトル成分の位相ではなくて振幅|X(k,f)|のみを一般に変更する。一般に、下記の仮定が行われる:
・雑音と有用な信号とは統計的に相関していない;
・有用な雑音は断続的である(雑音を評価できる期間であるような沈黙期間の存在);
・人の耳は信号の位相を感知しない(D.L.Wang、J.S.Lim、「音声強調における位相の非重要性(The unimportance of phase in speech enhancement)」、IEEE Trans. on ASSP、30巻、4号、679〜681、1982、参照)。
【0023】
周波数領域成分fにおけるインデックスkのフレーム上の観測信号X(k,f)に適用される短時間スペクトル減衰H(k,f)は、局部的な信号対雑音比η(k,f)の評価を基にして一般に決定される。全ての抑制規則に共通の特徴は、
【0024】
【数5】
Figure 2004520616
【0025】
により与えられるそれらの規則の漸近的な挙動である。
【0026】
現在採用されている抑制規則は:
・パワースペクトル差し引き(J.S.Lim、A.V.Oppenheimによる上記文献参照)。これに対しては雑音低減フィルタの伝達関数H(k,f)は
【0027】
【数6】
Figure 2004520616
【0028】
として表される。
・振幅スペクトル差し引き(S.F.Boll、「スペクトル差し引きを用いる音声の雑音抑制(Suppression of acoustic noise in speech using spectral subtraction)」、IEEE Trans. on Audio,Speech and Signal Processing、27巻、2号、113〜120ページ、1979年4月、参照)。それに対しては伝達関数H(k,f)は
【0029】
【数7】
Figure 2004520616
【0030】
として表される。
・ウィーナーフィルタの直接適用(J.S.Lim、A.V.Oppenheimにより上記文献参照)。これに対しては雑音低減フィルタの伝達関数H(k, f)は
【0031】
【数8】
Figure 2004520616
【0032】
として表される。
【0033】
それらの表現では、γss(k,f)とγbb(k,f)は有用な信号と、インデックスkのフレーム上の観察信号X(k,f)の周波数領域成分f内に存在する雑音とのパワースペクトル密度をそれぞれ表す。
【0034】
式(3)〜(5)から、与えられた周波数領域成分fについて測定された局部的な信号対雑音比に従って、雑音を含む信号に加えられるスペクトル減衰の挙動を研究することが可能である。局部的な信号対雑音比が高い時に、あらゆる規則が同一の減衰を生ずることが注目される。パワー差し引き規則はガウスモデルに対して最大限起きやすいという意味で最適である(O.Cappe、「EphraimおよびMalah雑音抑制器による楽音ノイズ音(musical noise)現象除去(Elimination of the musicalnoise phenomenon with the Ephraim and Malah noise suppressor)」、IEEE Trans.on Speech and Audio Processing、2巻、3号、345〜349ページ、1994年4月、参照)。しかし、それは処理の出力側において雑音パワーが最大のままであるという規則である。全ての抑制規則に対して、遮断値付近の局部的な信号対雑音比の小さい変化が、完全な減衰
【0035】
【数9】
Figure 2004520616
【0036】
の場合から無視できるスペクトル変更
【0037】
【数10】
Figure 2004520616
【0038】
の場合まで変更させるのに十分である。
【0039】
後者の特性は「楽音ノイズ」として知られている現象の原因の1つを構成する。実際に、決定論的な成分およびランダムな成分により特徴付けられる、周囲の雑音は無音期間中にのみ特徴付けることができる。それらのランダムな成分が存在するために、有声期間中の雑音の周波数領域成分fの寄与と、無声期間中のいくつかのフレームにわたって行われるそれの平均評価との間に非常に著しい変動がある。この違いのために、局部的な信号対雑音比の評価が遮断レベルを中心として変動することがある、すなわち、したがって、それは、出現し、その後で消失するスペクトル成分を、処理の出力側に、生ずることができ、それらの成分の平均寿命は考察している解析ウィンドウの大きさ程度を統計的に超えない。この挙動を全通過帯域にわたって一般化すると、「楽音ノイズ」として知られている、いらいらさせる可聴残留雑音が導入される。
【0040】
この雑音の影響を減少するために多くの研究が行われている。推奨されている解決策は種々の線に沿って開発されている。それらは、:
・短時間評価の平均化(S.F.Bollによる前記論文参照);
・雑音電力スペクトルの過大評価(M.Berouti他、「雑音に埋もれている音声の増強(Enhanncement of speech corrupted by acoustic noise)」、Int. Conf. on Speech,Signal Processing、208〜211ページ、1979、およびP.Lockwood、J.Boudy、「非直線スペクトル除去器による実験、隠されたマルコフモデルおよび車両における強固な音声認識(Experiments with a non‐linear spectral subtractor,hidden Markov models and the projection for robust speech recognition in cars)」、Proc. of EUSIPCO’91、79〜82ページ、1991、参照);
・最低雑音スペクトル密度のトラッキング(R.Martin、「最小統計を基にしたスペクトル除去(Spectaral subtraction based on minimum statistics)」、in Signal Processing VII:Theories and Applications,EUSIPCO’94、1182〜1185ページ、1994、9月、参照);
音声信号と付加雑音との統計モデルを基にした新規な抑制規則についての多くの研究も行われてきた。それらの研究によって新規な「ソフト決定」アルゴリズムが導入されるようになった。その理由は、従来の方法と比較してそれらのアルゴリズムが自由度を余分に有しているからである(R.J.MacAulay、M.L.Malpass、「ソフト決定雑音抑制フィルタを用いる音声強調(Speech enhancement using a soft‐decision noise suppression filter)」、IEEE trans. on Audio,Speech and Signal Processing、28巻、2号、138〜145ページ、1980、4月、Y.Ephraim、D.Malah、「最適非直線スペクトル振幅評価を用いる音声強調(Speech enhandement using optimal non‐linear spectral amplitude estimation)、Int.Conf.on Speech,Signal Processing、1118〜1121ページ、1983、Y.Ephraim、D.Malah、「最小平均二乗誤差短時間スペクトル振幅評価子を用いる音声強調(Speech enhandement using a minimum mean square error short‐time spectral amplitude estimator)、IEEE trans. on ASSP、32巻、6号、1109〜1121ページ、1984、参照)。
【0041】
上記短時間スペクトル変更規則は次の特徴を有する:
・短時間スペクトル減衰の計算は各スペクトル成分における雑音レベルの評価に依存し、各等式は量
【0042】
【数11】
Figure 2004520616
【0043】
を含んでいる。したがって、この雑音低減技術(歪み、雑音レベルの効果的な低減)の性能は信号対雑音比のこの評価子の適切さにより支配される。
・それらの技術はブロックごとの処理を基にしており(連続するブロックの間で重なり合う可能性がある)、その処理は、雑音低減装置の入力端子に存在する、所与のフレームの全ての標本を単一のスペクトル減衰で濾波することにある。この特性は、フィルタがスペクトル領域内で乗算を適用されるという事実にある。これは、たとえば、ある語の始まりまたは終わりの場合、あるいは有声/無声が混じったフレームの場合でさえ、現在のフレームに存在する信号が第2種の静止仮定を満たさない場合に特に制限する。
・スペクトル領域内で行われる乗算は実際には周期的なくりこみ演算に相当する。実際には、歪みを避けるために、試みられる操作は線形くりこみである。それはある数の零標本を各入力フレームに加えること(零パッディングと呼ばれる技術)と、雑音低減フィルタのインパルス応答の時間領域サポートを制限することを目的とした付加処理を実行することとを要する。そのために、時間領域くりこみ制約はスペクトル変換の次数を、したがって、雑音低減処理の数学的な複雑さを、必然的に増加する。雑音低減フィルタのインパルス応答の時間領域サポートを制限するために最も用いられる技術は時間領域内に制約を導入することにある。それは(i)フィルタの伝達関数H(k,f)についての知識を基にしてインパルス応答h(k,n)を得るために第1の「逆」スペクトル変換と、(ii)このインパルス応答の点の数を制限すること、これによって切り詰められた時間領域フィルタh′(k,f)になる、その後で、(iii)変更された伝達関数H′(k,f)を得るために切り詰められたインパルス応答h′(k,n)を基にして第2の「直接」スペクトル変換とを要する。
・実際には、スペクトル変換演算を行う前に、各解析フレームには解析ウィンドウw(n)が乗ぜられる。雑音低減フィルタが全通過型(すなわち、
【0044】
【数12】
Figure 2004520616
【0045】
であると、完全な再構成の条件が満たされることを希望するならば、解析ウィンドウは次の条件
【0046】
【数13】
Figure 2004520616
【0047】
を満たさねばならない。この式では、パラメータDは連続する2つの解析フレームの間の移動(標本の数で)を表す。他方、重み付けウィンドウw(n)の選択(典型的にはHanning型、Hamming型、Blackman型等の)がW(f)の主ローブの幅と第2のローブの振幅(第1のローブの振幅に対する)を決定する。主ローブが広いとすると、元の信号の変換の速い遷移が非常に悪く近似される。第2のローブの相対的な振幅が大きいとすると、得られる近似は、特に不連続部を中心として、いらいらさせる発振を行うものである。したがって、関連するスペクトル解析要求(主ローブの幅の選択と、副ローブの振幅の選択)と、雑音低減濾波過程により導入される小さい遅延(処理の入力端子と出力端子とにおける信号の間の時間のずれ)の要求とを満たすことは困難である。第2の要求を満たすと、なんら重なり合うことのない連続するフレーム、したがって、長方形型解析ウィンドウを使用することになる。それによって関連するスペクトル解析を実行する結果となることはない。それらの要求を同時に満たす唯一のやり方は、適切な解析ウィンドウにより重み付けられているフレームに対して行われる第1のスペクトル変換を基にしてスペクトル解析を行い、かつウィンドウ化されていないデータに対して第2のスペクトル変換を並行に行う(スペクトル乗算によりくりこみ操作を行うために)ことである。実際には、そのような技術は数学的な複雑さの面で費用がかかり過ぎることが判明している。
【0048】
EP‐A‐0 710 947がエコー打ち消し器に結合されている雑音低減装置を開示している。雑音低減は、スペクトル解析中に信号対雑音比に従って評価される伝達関数H(k,f)の逆フーリェ変換により得られるインパルス応答によって、時間領域内でのブロックごとの濾波により実行される。
【発明の開示】
【課題を解決するための手段】
【0049】
本発明の主な目的は雑音低減法の性能を向上することである。
【0050】
したがって、本発明は、入力信号の引き続くフレーム中の雑音を低減する方法であって、下記のステップ、
‐周波数領域へ変換することにより入力信号のスペクトラムを計算することと、
‐周波数依存雑音レベル評価子を得ることと、
‐そのフレームに対する第1の有用な周波数依存信号レベル評価子を計算することと、
‐第1の雑音低減フィルタの伝達関数を、第1の有用な信号レベル評価子および雑音レベル評価子を基にして計算することと、
‐入力信号のスペクトラムと第1の雑音低減フィルタの伝達関数を組合わせることにより、そのフレームに対する第2の有用な周波数依存信号レベル評価子を計算することと、
‐第2の雑音低減フィルタの伝達関数を、第2の有用な信号レベル評価子および雑音レベル評価子を基にして計算することと、
‐雑音が低減された信号を生ずるために、フレーム濾波操作で第2の雑音低減フィルタの伝達関数を使用することと、
をフレームの少なくともいくつかに対して備える、入力信号の引き続くフレーム中の雑音を低減する方法を提供するものである。
【0051】
評価される雑音のレベルと有用な信号のレベルは通常はPSDsであり、またはより一般的にはそれらのPSDsに相関させられている量である。
【0052】
2つの操作における計算、それの特定の面が有用な信号のPSD γss(k,f)のより速い更新にある、によって従来の方法よりも大きな2つの利点を得る第2の雑音低減フィルタをもたらす結果となる。第1に、特に有用な信号の時間的な包絡線のより速い変化中に、有用な信号の非静止性のより速いトラッキングがある(たとえば、無声/音声遷移中にある音声信号を冒すすなわち消去する)。第2に、雑音低減フィルタはより良く評価される。これによってこの方法の性能が向上する結果となる(雑音が一層著しく低減しかつ有用な信号の劣化が減少する)。
【0053】
この方法は、3つ以上の操作が実行される場合に一般化できる。得られたp番目(p≧2)の伝達関数を基にして、有用な信号レベル評価子がその後で再計算され、(p+1)番目の伝達関数がその雑音低減のために再評価される。この方法の上記定義は、P>2の操作が行われる場合にも適用される。すなわち、この定義に従って「第1の有用な信号レベル評価子」を(p−1)番目の操作中に得られたものとして単に考察する必要がある。実際には、この方法の満足できる性能はP=2で観察される。
【0054】
この方法の1つの有利な実施形態では、スペクトラムの計算が、入力信号フレームをウィンドウ化関数により重み付けすることと、重み付けられたフレームを周波数領域へ変換することとで構成され、フレームのより近い半分に対してフレームのより近くない半分よりも強い重み付けを行うように、ウィンドウ化関数は非対称である。
【0055】
そのようなウィンドウ化関数の選択は、スペクトル評価の重みを最も近い標本へ向かって集中でき、一方では良いスペクトル特性を持つウィンドウを提供する(第2のローブの制御されている増加)ことを意味する。これによって信号の変化に迅速に追従できるようにされる。周波数を基にした解析のためのスペクトルのこの計算モードは、雑音低減フィルタの伝達関数の評価がただ1つの操作で行われる場合に適用することもできることに注目すべきである。
【0056】
この方法は、上記短時間スペクトル減衰法により、周波数領域内で入力信号がブロックごとに濾波される場合に使用できる。その後で、雑音を除去された信号がそれのスペクトル成分
【0057】
【数14】
Figure 2004520616
【0058】
の形で発生される。それは直接利用でき(たとえば、符号化応用または音声認識応用において)、または信号
【0059】
【数15】
Figure 2004520616
【0060】
を明確に得るために時間領域へ変換できる。
【0061】
しかし、この方法の1つの好適な実施形態では、雑音低減フィルタ・インパルス応答が、第2の雑音低減フィルタの伝達関数の時間領域への変換を基にして、現在のフレームに対して決定され、その時間領域内のフレームに対する濾波操作が前記フレームに対して決定されたインパルス応答により実行され、時間領域内のフレームに対する濾波操作は前記フレームに対して決定されたインパルス応答により実行される。
【0062】
有利なことに、そうすると、現在のフレームに対する雑音低減フィルタ・インパルス応答の決定は:
‐第2の雑音低減フィルタの伝達関数を時間領域へ変換して第1のインパルス応答を得るステップと、
‐第1のインパルス応答を、時間領域への変換の点の数より十分少ない(通常は少なくとも5分の1)標本数に対応する打ち切り長さに打ち切るステップと、
を備えている。
【0063】
雑音低減フィルタの時間領域サポートにおけるこの制限は2倍の利点をもたらす。まず、それは時間領域エイリアシング問題が避けられることを意味する(線形くりこみに従う)。第2に、有用な信号を劣化させることがある、強すぎるフィルタの作用を避けることを可能にする滑らかな作用を提供することである。それには、ウィンドウ化機能により切り詰められたインパルス応答が切り詰め長さに対応する標本の数に及ぼす重み付けが付随することがある。フィルタの時間領域サポートにおけるこの制限は、伝達関数の評価が単一の操作で行われる時に適用することもできる。
【0064】
濾波が時間領域において行われる時は、現在のフレームをいくつかのサブフレームに細分し、補間されたインパルス応答を各サブフレームに対して、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答と、少なくとも1つの以前のフレームに対して決定された雑音低減フィルタ・インパルス応答とを基にして計算すると有利である。そうするとフレームの濾波操作は、前記サブフレームに対して計算された補間されたインパルス応答に従って、時間領域内の各サブフレームの信号の濾波を含む。
【0065】
サブフレームへのこの処理によって、同じフレーム内で変化する雑音低減フィルタを適用することが可能になり、したがって、処理された信号の非静止性に良く適する。ボイス信号を処理する場合には、この状況には混合されているフレーム(すなわち、有声音と無声音を有するフレーム)で特に遭遇させられる。サブフレームへのこの処理は、フィルタの伝達関数の評価が単一の操作で行われる時にも適用できることが注目される。
【0066】
本発明の他の面は上記方法を実現するために構成された雑音低減装置に関する。
【0067】
本発明のその他の特徴およびその他の利点は、添付図面を参照しての、非限定的実施形態についての以下の説明で明らかになるであろう。
【発明を実施するための最良の形態】
【0068】
図1ないし図3は本発明の装置を別々のユニットの形で表したものである。この方法の1つの典型的な実現では、信号処理操作は、上記ユニットに対応する種々の機能モジュールを有するデジタル信号プロセッサ実行プログラムにより、通常のものとして、実行される。
【0069】
図1を参照して、本発明の雑音低減装置は、デジタル・オーディオ信号などの、入力信号x(n)を長さLの標本(整数kにより示されている)の引き続くフレームに分配するユニット1を有する。指標kの各フレームにウィンドウ化関数w(n)を乗ずることにより、それは重み付けられ(乗数2)て信号x(k,n)=w(n).x(k,n)(0≦n<Lに対して)を生ずる。
【0070】
周波数領域への移行は、離散フーリェ変換(DFT)を、現在のフレームのフーリェ変換X(k,f)を行うユニット3により、重み付けられているフレームx(k,n)に施すことによって行われる。
【0071】
本発明に含まれている、時間‐周波数領域遷移、およびその逆、のために、必要があれば下流側(ユニット7)で用いられるDFTおよび時間領域への逆変換(IDFT)は、有利なことに高速フーリェ変換(FFT)および逆高速フーリェ変換(IFFT)である。ウェーブレット(wavelet)変換などの、その他の時間‐周波数変換も使用できる。
【0072】
雑音のみのフレームを音声フレームから弁別し、現在のフレームに2進発声活動指示δを与えるために、ボイス活動検出(VAD)ユニット4が用いられる。信号x(k,n)を基にして時間領域において動作しるか、破線で示すように、信号X(k,f)を基にして周波数領域において動作するかによらず、いかなる既知のVAD法でも使用できる。
【0073】
VADはユニット5による雑音のPSDの評価を制御する。したがって、ユニット4により検出された各「雑音のみ」フレームkに対して(δ=0)、雑音パワースペクトル密度
【0074】
【数16】
Figure 2004520616
【0075】
は次の回帰式により計算される。
【0076】
【数17】
Figure 2004520616
【0077】
ここにkは、δ=0であれば現在の雑音フレーム、δ=1であれば最後の雑音フレームであり(kは有用な信号のフレームとして検出される)、α(k)は時間的に変化できる平滑化パラメータである。
【0078】
【数18】
Figure 2004520616
【0079】
の計算法は指数平滑化を行うこの評価子に限定されるものではなく、ユニット5で判定状態のいかなるPSD評価子も使用できることに気が付くであろう。
【0080】
現在のフレームのスペクトラムX(k,f)および雑音レベル評価
【0081】
【数19】
Figure 2004520616
【0082】
を用いて、他のユニット6が雑音低減フィルタ
【0083】
【数20】
Figure 2004520616
【0084】
の伝達関数(TF)を評価する。ユニット7はこのTFにIDFTを施して対応するインパルス応答
【0085】
【数21】
Figure 2004520616
【0086】
を得る。
【0087】
ウィンドウ化関数wfilt(n)が乗算器8によりこのインパルス応答
【0088】
【数22】
Figure 2004520616
【0089】
に乗ぜられて、雑音低減装置の時間領域フィルタのインパルス応答
【0090】
【数23】
Figure 2004520616
【0091】
を得る。雑音を除去された時間領域信号
【0092】
【数24】
Figure 2004520616
【0093】
を生ずるために濾波ユニット9により行われる操作は、それの原理として、現在のフレームに対して決定されたインパルス応答
【0094】
【数25】
Figure 2004520616
【0095】
による入力信号のくりこみである。
【0096】
ウィンドウ化関数wfilt(n)はフレームの長さより著しく短いサポートを有する。いいかえると、IDFTの結果としてのインパルス応答
【0097】
【数26】
Figure 2004520616
【0098】
が、関数wfilt(n)による重み付けがそれに適用される前に、切り詰められる。好ましいのは、標本の数として表される、切り詰め長さLfiltはフレームの長さの少なくとも5分の1である。それは通常はこのフレーム長さの10分の1の長さ程度である。
【0099】
インパルス応答の最上位のLfilt係数は、ウィンドウwfilt(n)による重み付けの主体であり、それはたとえば長さLfiltのHammingまたはHanningウィンドウである。
【0100】
【数27】
Figure 2004520616
【0101】
雑音低減フィルタの時間領域サポートにおける制限は、線形くりこみを満たすために、時間領域エイリアシング問題を避けることを可能にする。更に、それは平滑化を行って、有用な信号を劣化させることがある、フィルタのあまりにも強過ぎる作用を避けることを可能する。
【0102】
図2は雑音低減フィルタの伝達関数
【0103】
【数28】
Figure 2004520616
【0104】
を評価するユニット6の好適な構成を示す。その伝達関数は雑音b(n)のPSDと有用な信号s(n)のPSDに依存する。
【0105】
ユニット5が雑音のPSD
【0106】
【数29】
Figure 2004520616
【0107】
をどのようにして評価できるかについて説明してきた。しかし、発声活動期間中は信号と雑音が混合されているので有用な信号のPSD γss(k,f)は直接得ることができない。それを予め評価するために、図2のユニット6のモジュール11は、下記の式に従って、たとえば、指令された決定評価子を使用する(Y.Ephraim、D.Malah、「最小平均二乗誤差短時間スペクトル振幅評価子を用いる音声強調(Speech enhandement using a minimummean square error short‐time spectral amplitude estimator)、IEEE trans. on ASSP、32巻、6号、1109〜1121ページ、1984、参照」。
【0108】
【数30】
Figure 2004520616
【0109】
ここにβ(k)は時間的に変化できる重心パラメータ、
【0110】
【数31】
Figure 2004520616
【0111】
は指標k−1の先行フレームに対して評価された有用な信号のスペクトラムである(たとえば、図2の乗算器12により得られた、
【0112】
【数32】
Figure 2004520616
【0113】
)。関数Pは、評価の誤りの場合に負となる危険を招く量
【0114】
【数33】
Figure 2004520616
【0115】
のしきい値化を行う。それは、
【0116】
【数34】
Figure 2004520616
【0117】
により与えられる。
【0118】
【数35】
Figure 2004520616
【0119】
の計算はこの指定された決定評価子に限定されないことに注意すべきである。実際に、指数平滑化評価子または他の任意のパワースペクトル密度評価子を使用できる。
【0120】
現在のフレームに対する雑音低減フィルタのTFの予評価がモジュール13によって、評価されたPSDs
【0121】
【数36】
Figure 2004520616
【0122】
の関数として計算される:
【0123】
【数37】
Figure 2004520616
【0124】
このモジュール13は、振幅スペクトル差し引き((4)に従って
【0125】
【数38】
Figure 2004520616
【0126】
)のパワースペクトル差し引き((3)に従って
【0127】
【数39】
Figure 2004520616
【0128】
)の規則、または開ループ・ウィーナーフィルタ((5)に従ってF(y,z)=y/(y+z)の規則を特に実現できる。
【0129】
通常は、雑音低減フィルタの最後の伝達関数は式(4)を用いて得られる。このフィルタの性能を向上するために、2回の操作に反復手順を用いてそれを評価することが提案されている。最初の操作はモジュール11ないし13により行われる動作で構成されている。
【0130】
そのようにして得られた伝達関数
【0131】
【数40】
Figure 2004520616
【0132】
を再び用いて有用な信号のPSDの評価を改善する。ユニット6(乗算器14とモジュール15)は、このために、
【0133】
【数41】
Figure 2004520616
【0134】
により与えられる量
【0135】
【数42】
Figure 2004520616
【0136】
を計算する。そうすると第2の操作は、モジュール16に対しては、雑音低減フィルタの伝達関数の最後の評価子
【0137】
【数43】
Figure 2004520616
【0138】
を、有用な信号のPSDの改善された評価を基にして計算することにある。
【0139】
【数44】
Figure 2004520616
【0140】
関数Fはモジュール13により使用されたものと同じにできる。
【0141】
2回の操作におけるこの計算によって有用な信号のPSD
【0142】
【数45】
Figure 2004520616
【0143】
のより速い更新とフィルタのより良い評価が可能にされる。
【0144】
図3はN個のサブフレームへの細分を基にした、したがって、同じ信号フレーム内で展開できる雑音低減機能の応用を可能にする時間領域濾波ユニット9の好適な構成を示す。
【0145】
モジュール21が、サブフレーム
【0146】
【数46】
Figure 2004520616
【0147】
(iは1からNまで増大する)のフィルタのN≧2のセットのインパルス応答を得るために、切り詰められ、かつ重みづけられインパルス応答
【0148】
【数47】
Figure 2004520616
【0149】
の補間を行う。
【0150】
サブフレームを基にした濾波は長さLfiltの横型フィルタ(transverse filter)23を用いて実現できる。それの係数
【0151】
【数48】
Figure 2004520616
【0152】
(0≦n≦Lfilt、1≦i≦N)は、現在のフレームの指標iを基にしてセレクタ22により縦続して提供される。濾波すべき信号のサブフレームは入力フレームx(k,n)の細分により得られる。横型フィルタ23は、現在のサブフレームに関連させられている係数
【0153】
【数49】
Figure 2004520616
【0154】
を持つ入力信号x(n)のくりこみにより雑音が低減された信号
【0155】
【数50】
Figure 2004520616
【0156】
をこのようにして計算する。
【0157】
サブフレーム・フィルタの応答
【0158】
【数51】
Figure 2004520616
【0159】
はモジュール21により、現在のフレームに対して決定されたインパルス応答
【0160】
【数52】
Figure 2004520616
【0161】
の重み付けられた和と、以前のフレームに対して決定されたインパルス応答
【0162】
【数53】
Figure 2004520616
【0163】
の重み付けられた和として計算できる。サブフレームがフレーム内で規則的に分割されると、重み付けられた混合関数を特に
【0164】
【数54】
Figure 2004520616
【0165】
とすることができる。フィルタ
【0166】
【数55】
Figure 2004520616
【0167】
が直接適用される場合がN=1(サブフレーム無し)に対応することが観察される。
【0168】
実施例 1
この実施例は会話による通信、特に低ビット速度の音声符号器の前処理に、適用するのに適する。
【0169】
処理により導入される遅延を理論的な最大まで短縮し、しかも適用に適切なウィンドウを選択する可能性を利用者に提供するために、重なり合わないウィンドウが使用される。これは、装置の入力信号のウィンドウ化が完全な再構成制約を受けないので、可能である。
【0170】
そのような応用では、あまり近くない半分よりも一層近い半分に対してより大きな重み付けを行うために、乗算器2により適用されるウィンドウ化関数w(n)は非対称であることが有利である。
【0171】
図4に示されているように、異なるサイズLとLの2つのHanning半ウィンドウを用いて非対称解析ウィンドウw(n)を構成できる。
【0172】
【数56】
Figure 2004520616
【0173】
移動用の多数の音声符号器は長さが20msのフレームを使用し、F=8kHzの標本化周波数(すなわち、フレーム当り160お標本)で動作する。図4に示されている実施例では、次の値が選択されている。L=160、L=120およびL=40。
【0174】
そのようなウィンドウの選択は、スペクトル評価の重みを最も近い標本へ向かって集中して、良いスペクトル・ウィンドウを確保できることを意味する。提案されている方法によってそのような選択が可能にされる。その理由は、合成における信号の完全な再構成の制約がないからである(時間領域濾波による出力端子における信号再構成)。
【0175】
周波数分解を一層良くするために、ユニット3と7は長さLFFT=256のFFTを使用する。この選択の背後にはある理由も存在する。その理由は、長さが2のべきであるフレームにFFTが適用される時に、FFTが数値的に最適であるからである。したがって、ウィンドウ・ブロックx(k,n)をLFFT−L=96零標本(零パッディング)だけ前もって拡張する必要がある。
(k,n)=0 L≦n<LFFTに対して (19)
この実施例で用いられるボイス活動は、信号における短期間/長期間エネルギー比較を基にする従来の方法である。雑音パワースペクトル密度γbb(k,f)の評価は、信頼できる評価と雑音統計量の時間領域変動のトラッキングとの間の妥協を確保するために十分であるとみなされる、128msの時定数に対応する、α(k)=0.8553である式(10)に従って、指数的平滑化により更新される。
【0176】
雑音低減フィルタ
【0177】
【数57】
Figure 2004520616
【0178】
のTFは、β(k)=0.98である(12)で定められている指定された決定評価子に従って有用な信号のPSDを前に評価した後で、式(5)(開ループ・ウィーナーフィルタ)に従って予め評価される。TFの最後の評価
【0179】
【数58】
Figure 2004520616
【0180】
を生ずるために同じ関数Fがモジュール16により再び使用される。
【0181】
【数59】
Figure 2004520616
【0182】
は実数値にされたTFであるので、時間領域フィルタは、
【0183】
【数60】
Figure 2004520616
【0184】
により原因にされる。
【0185】
その後でこのフィルタのLfilt=21係数を選択する。それは長さLfilt、この応用のための重要な標本に対応する値である、のHanningウィンドウwfilt(n)により重み付けられている。
【0186】
【数61】
Figure 2004520616
【0187】
ここに
【0188】
【数62】
Figure 2004520616
【0189】
時間領域濾波は、(17)により得られたサブフレーム
【0190】
【数63】
Figure 2004520616
【0191】
のN=4個のフィルタにより行われる。それら4個のフィルタはその後で長さLfilt=21の横濾波(transverse filtering)を用いて入力信号x(i)(k,n)に適用される。それらのサブフレームは観察信号x(k,n)
Figure 2004520616
のサイズL/4=40個の標本の連続抽出により得られている。
【0192】
実施例 2
この実施例の装置は高性能の音声認識(騒がしい環境内での)への応用に適している。
【0193】
この実施例では、連続する2つのフレームの間のL/2個の標本の相互に重なり合っている長さLの解析フレームが用いられ、用いられるウィンドウはHanninng型のものである。
【0194】
【数64】
Figure 2004520616
【0195】
フレーム長さは20msに固定される、すなわち、標本化周波数Fe=8kHzにおいてL=160であり、フレームはFFTのために96の零標本が補充される(「零パッディング」。
【0196】
この実施例では、雑音低減フィルタのTFの計算は、雑音
【0197】
【数65】
Figure 2004520616
【0198】
のパワースペクトル密度の平方根と有用な信号
【0199】
【数66】
Figure 2004520616
【0200】
のパワースペクトル密度の平方根との比を基にしており、したがって、雑音
【0201】
【数67】
Figure 2004520616
【0202】
の評価の係数と有用な信号
【0203】
【数68】
Figure 2004520616
【0204】
の評価の係数との比を基にしている。
【0205】
この実施例で使用されるボイス活動検出は、信号における短期間/長期間エネルギー比較を基にしている既存の従来方法である。雑音信号
【0206】
【数69】
Figure 2004520616
【0207】
【数70】
Figure 2004520616
【0208】
により更新される。ここにkは現在の雑音フレームまたは最後の雑音フレームである(kが有用な信号フレームとして検出されるならば)。平滑化量αは定数として選択され、0.99に等しい。これは1.6sの時定数である。
【0209】
雑音低減フィルタ
【0210】
【数71】
Figure 2004520616
【0211】
のTFは、
【0212】
【数72】
Figure 2004520616
【0213】
に従ってモジュール13により予め評価される。ここに、
F(y,z)=y/(y+z) (26)
である。
【0214】
平方根を計算するとその係数に対して評価を行うことが可能にされる。それは、
【0215】
【数73】
Figure 2004520616
【0216】
によりSNR η(k,f)に関連させられている。
【0217】
係数
【0218】
【数74】
Figure 2004520616
【0219】
としての有用な信号の評価子は、
【0220】
【数75】
Figure 2004520616
【0221】
により得られる。ここにβ(k)=0.98である。
【0222】
乗算器14は予め評価されたTF
【0223】
【数76】
Figure 2004520616
【0224】
とスペクトラムX(k,f)の乗算を行い、その結果の係数(そしてそれの二乗ではない)は15で得られて、
【0225】
【数77】
Figure 2004520616
【0226】
の改善された評価を提供し、それを基にして係数16は(25)におけるのと同じ関数Fを用いてTFの最後の評価
【0227】
【数78】
Figure 2004520616
【0228】
を生ずる。
【0229】
その後で時間領域応答
【0230】
【数79】
Figure 2004520616
【0231】
が実施例1と全く同じやり方で得られる(時間領域への遷移、因果関係の復帰、重要な標本の選択およびウィンドウ化)。唯一の違いは、係数Lfiltの選択された数の選択にある。それはこの実施例ではLfilt=17に固定される。
【0232】
入力フレームx(k,n)は、得られた雑音低減フィルタ時間領域応答
【0233】
【数80】
Figure 2004520616
【0234】
に直接加えることにより、濾波される。サブフレームで濾波を行わないと式(17)でN=1を取ることになる。
【図面の簡単な説明】
【0235】
【図1】本発明の方法を実施するために構成された雑音低減装置のブロック図である。
【図2】図1の装置で使用できる雑音低減フィルタの伝達関数を評価するユニットのブロック図である。
【図3】図1の装置で使用できる時間領域濾波ユニットのブロック図である。
【図4】この方法の特定の実施形態で使用できるウィンドウ化関数のグラフである。

Claims (18)

  1. 入力信号(x(n))の引き続くフレーム中の雑音を低減する方法であって、下記のステップ、
    ‐周波数領域へ変換することにより入力信号(x(n))のスペクトラム(X(k,f))を計算することと、
    ‐周波数依存雑音レベル評価子を得ることと、
    ‐そのフレームに対する第1の有用な周波数依存信号レベル評価子を計算することと、
    ‐第1の雑音低減フィルタの伝達関数
    Figure 2004520616
    を、第2の有用な信号レベル評価子および雑音レベル評価子を基にして計算することと、
    ‐入力信号のスペクトラムと第1の雑音低減フィルタの伝達関数を組合わせることにより、そのフレームに対する第2の有用な周波数依存信号レベル評価子を計算することと、
    ‐第2の雑音低減フィルタの伝達関数
    Figure 2004520616
    を、第2の有用な信号レベル評価子および雑音レベル評価子を基にして計算することと、
    ‐雑音が低減された信号を生ずるために、フレーム濾波操作で第2の雑音低減フィルタの伝達関数を使用することと、
    をフレームの少なくともいくつかに対して備える、入力信号(x(n))の引き続くフレーム中の雑音を低減する方法。
  2. スペクトラム(X(k,f))の計算が、入力信号フレームをウィンドウ化関数(w(n))により重み付けすることと、重み付けられたフレームを周波数領域へ変換することとを備え、フレームのより近い半分に対してフレームのより近くない半分よりも強い重み付けを行うように、ウィンドウ化関数は非対称である請求項1に記載の方法。
  3. 雑音低減フィルタ・インパルス応答
    Figure 2004520616
    が、第2の雑音低減フィルタの伝達関数
    Figure 2004520616
    の時間領域への変換を基にして、現在のフレームに対して決定され、その時間領域内のフレームに対する濾波操作を前記フレームに対して決定されたインパルス応答により実行される請求項1または2に記載の方法。
  4. 現在のフレームに対する雑音低減フィルタ・インパルス応答
    Figure 2004520616
    の決定が、
    ‐第2の雑音低減フィルタの伝達関数
    Figure 2004520616
    を時間領域へ変換するステップと、
    ‐第1のインパルス応答を、時間領域への変換の点の数より十分少ない標本数に対応する打ち切り長さに打ち切るステップと、
    を備えている請求項3に記載の方法。
  5. 現在のフレームに対する雑音低減フィルタ・インパルス応答
    Figure 2004520616
    の決定が、
    ‐打ち切られているインパルス応答に、前記打ち切り長さに対応する標本の数で、ウィンドウ化関数(wfilt(n))により重み付けするステップ、
    を更に備えている請求項4に記載の方法。
  6. 現在のフレームが複数のサブフレームに細分され、各サブフレームに対して補間されたインパルス応答
    Figure 2004520616
    は、現在のフレームに対して決定された雑音低減フィルタインパルス応答と、少なくとも1つの以前のフレームに対して決定された雑音低減フィルタインパルス応答とを基にして計算され、フレームの濾波操作が、時間領域内の各サブフレームの信号を、前記サブフレームに対して計算された補間されたインパルス応答に従って濾波することを含む請求項3から請求項5のいずれか1項に記載の方法。
  7. 補間されたインパルス応答
    Figure 2004520616
    が、現在のフレームの種々のサブフレームに対して、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 2004520616
    の重み付けられた和と、以前のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 2004520616
    の重み付けられた和として計算される請求項6に記載の方法。
  8. 現在のフレームのi番目(1≦i≦N)のサブフレームに対して計算された補間されたインパルス応答
    Figure 2004520616
    は、以前のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 2004520616
    の(N−i)/N倍、プラス現在のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 2004520616
    のi/N倍に等しく、Nは現在のフレームのサブフレームの数である請求項7に記載の方法。
  9. 入力信号(x(n))がオーディオ信号である請求項1から請求項8のいずれか1項に記載の方法。
  10. ‐周波数領域への変換により入力信号のフレームのスペクトラム(X(k,f))を計算する手段(1〜3)と、
    ‐周波数依存雑音レベル評価子を得る手段(5)と、
    ‐そのフレームに対する第1の有用な周波数依存信号レベル評価子を計算する手段(11)と、
    ‐第1の雑音低減フィルタの伝達関数
    Figure 2004520616
    を、第2の有用な信号レベル評価子および雑音レベル評価子を基にして計算する手段(13)と、
    ‐入力信号のスペクトラムと第1の雑音低減フィルタの伝達関数を組合わせることにより、フレームに対する第2の有用な周波数依存信号レベル評価子を計算する手段(14〜15)と、
    ‐第2の雑音低減フィルタの伝達関数
    Figure 2004520616
    を、第2の有用な信号レベル評価子および雑音レベル評価子を基にして計算する手段(16)と、
    ‐雑音が低減されている信号を生ずるためにフレームを第2の雑音低減フィルタの伝達関数により濾波する手段(7〜9)と、
    を備える入力信号(x(n))中の雑音を低減する装置。
  11. スペクトラム計算手段が、入力信号フレームをウィンドウ化関数(w(n))により重み付けする手段(2)と、重み付けられたフレームを周波数領域へ変換する手段(3)とを備え、フレームのより近い半分に対してフレームのより近くない半分よりも強い重み付けを行うように、ウィンドウ化関数は非対称である請求項10に記載の装置。
  12. 現在のフレームに対して雑音低減フィルタ・インパルス応答
    Figure 2004520616
    を、第2の雑音低減フィルタの伝達関数
    Figure 2004520616
    の時間領域への変換を基にして決定する手段(7〜8)を備え、この装置において濾波手段(9)は現在のフレームに対して決定されたインパルス応答によりその時間領域内で動作するより実行される請求項10または11に記載の装置。
  13. 雑音低減フィルタ・インパルス応答
    Figure 2004520616
    を決定する手段が、第1のインパルス応答を得るために、第2の雑音低減フィルタの伝達関数
    Figure 2004520616
    を時間領域へ変換する手段(7)と、第1のインパルス応答を、時間領域への変換の点の数より十分少ない標本数に対応する打ち切り長さに打ち切る手段(8)とを備えている請求項12に記載の装置。
  14. 雑音低減フィルタ・インパルス応答を決定する手段(8)が、打ち切られているインパルス応答に、前記打ち切り長さに対応する標本の数で、ウィンドウ化関数(wfilt(n))により重み付けする手段(8)を備えている請求項13に記載の装置。
  15. 現在のフレームを複数のサブフレームに細分する手段と、各サブフレームに対して補間されたインパルス応答
    Figure 2004520616
    を、現在のフレームに対して決定された雑音低減フィルタインパルス応答と、少なくとも1つの以前のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 2004520616
    とを基にして計算する手段(21)とを更に備え、濾波手段(9)は、時間領域内の各サブフレームの信号を、前記サブフレームに対して計算された補間されたインパルス応答に従って濾波する手段(23)を備えている請求項12から請求項14のいずれか1項に記載の装置。
  16. 補間されたインパルス応答
    Figure 2004520616
    を計算する手段が、現在のフレームの種々のサブフレームに対して、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 2004520616
    の重み付けられた和と、以前のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 2004520616
    の重み付けられた和として計算するために構成されている請求項15に記載の装置。
  17. 現在のフレームのi番目(1≦i≦N)のサブフレームに対して計算された補間されたインパルス応答
    Figure 2004520616
    (h(i)w(k,n))は、以前のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 2004520616
    の(N−i)/N倍、プラス現在のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 2004520616
    のi/N倍に等しく、Nは現在のフレームのサブフレームの数である請求項16に記載の装置。
  18. 入力信号(x(n))がオーディオ信号である請求項10から請求項17のいずれか1項に記載の装置。
JP2002561819A 2001-01-30 2001-11-19 雑音低減法および装置 Expired - Fee Related JP4210521B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0101220A FR2820227B1 (fr) 2001-01-30 2001-01-30 Procede et dispositif de reduction de bruit
PCT/FR2001/003624 WO2002061731A1 (fr) 2001-01-30 2001-11-19 Procede et dispositif de reduction de bruit

Publications (3)

Publication Number Publication Date
JP2004520616A true JP2004520616A (ja) 2004-07-08
JP2004520616A5 JP2004520616A5 (ja) 2005-11-17
JP4210521B2 JP4210521B2 (ja) 2009-01-21

Family

ID=8859390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002561819A Expired - Fee Related JP4210521B2 (ja) 2001-01-30 2001-11-19 雑音低減法および装置

Country Status (14)

Country Link
US (1) US7313518B2 (ja)
EP (1) EP1356461B1 (ja)
JP (1) JP4210521B2 (ja)
KR (1) KR100549133B1 (ja)
CN (1) CN1284139C (ja)
AT (1) ATE472794T1 (ja)
BR (1) BRPI0116844B1 (ja)
CA (1) CA2436318C (ja)
DE (1) DE60142490D1 (ja)
ES (1) ES2347760T3 (ja)
FR (1) FR2820227B1 (ja)
HK (1) HK1057639A1 (ja)
MX (1) MXPA03006667A (ja)
WO (1) WO2002061731A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9613631B2 (en) 2005-07-27 2017-04-04 Nec Corporation Noise suppression system, method and program
JP2021149084A (ja) * 2020-03-13 2021-09-27 ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド オーディオ信号処理方法および装置、記憶媒体

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7885420B2 (en) 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7725315B2 (en) 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7778425B2 (en) * 2003-12-24 2010-08-17 Nokia Corporation Method for generating noise references for generalized sidelobe canceling
US7516069B2 (en) * 2004-04-13 2009-04-07 Texas Instruments Incorporated Middle-end solution to robust speech recognition
EP1591995B1 (en) * 2004-04-29 2019-06-19 Harman Becker Automotive Systems GmbH Indoor communication system for a vehicular cabin
ES2349718T3 (es) * 2004-09-16 2011-01-10 France Telecom Procedimiento de tratamiento de señales acústicas ruidosas y dispositivo para la realización del procedimiento.
US7383179B2 (en) * 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
KR100565086B1 (ko) * 2004-10-13 2006-03-30 삼성전자주식회사 뮤지컬 잡음을 감쇄하는 스펙트럼 잡음 제거 방법 및 그장치
US9047860B2 (en) 2005-01-31 2015-06-02 Skype Method for concatenating frames in communication system
FR2888458A1 (fr) * 2005-07-11 2007-01-12 France Telecom Procede et dispositif de prise de son, notamment dans des terminaux telephoniques en "mains libres"
CA2640683C (en) * 2006-01-31 2014-10-21 Canadian Space Agency Method and system for increasing signal-to-noise ratio
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
JP4653059B2 (ja) * 2006-11-10 2011-03-16 オリンパス株式会社 撮像システム、画像処理プログラム
DE602007004217D1 (de) * 2007-08-31 2010-02-25 Harman Becker Automotive Sys Schnelle Schätzung der Spektraldichte der Rauschleistung zur Sprachsignalverbesserung
EP2058803B1 (en) * 2007-10-29 2010-01-20 Harman/Becker Automotive Systems GmbH Partial speech reconstruction
US20100151118A1 (en) * 2008-12-17 2010-06-17 Eastman Chemical Company Carrier solvent compositions, coatings compositions, and methods to produce thick polymer coatings
US9449611B2 (en) * 2011-09-30 2016-09-20 Audionamix System and method for extraction of single-channel time domain component from mixture of coherent information
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
CN102783043B (zh) * 2012-05-04 2014-07-30 华为技术有限公司 一种信号发送方法、通信设备及系统
CN103916730B (zh) * 2013-01-05 2017-03-08 中国科学院声学研究所 一种能够改善音质的声场聚焦方法及系统
CN103916733B (zh) * 2013-01-05 2017-09-26 中国科学院声学研究所 基于均方误差最小准则的声能量对比控制方法及系统
US9318125B2 (en) * 2013-01-15 2016-04-19 Intel Deutschland Gmbh Noise reduction devices and noise reduction methods
EP3011561B1 (en) 2013-06-21 2017-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improved signal fade out in different domains during error concealment
US10149047B2 (en) * 2014-06-18 2018-12-04 Cirrus Logic Inc. Multi-aural MMSE analysis techniques for clarifying audio signals
WO2017193264A1 (en) * 2016-05-09 2017-11-16 Harman International Industries, Incorporated Noise detection and noise reduction
CN108848435B (zh) * 2018-09-28 2021-03-09 广州方硅信息技术有限公司 一种音频信号的处理方法和相关装置
CN110010144A (zh) * 2019-04-24 2019-07-12 厦门亿联网络技术股份有限公司 语音信号增强方法及装置
CN111968615A (zh) * 2020-08-31 2020-11-20 Oppo广东移动通信有限公司 降噪处理方法及装置、终端设备和可读存储介质
CN112489615A (zh) * 2020-10-29 2021-03-12 宁波方太厨具有限公司 降噪方法、降噪系统、降噪装置及吸油烟机
CN112960012B (zh) * 2021-02-03 2022-05-31 中国铁道科学研究院集团有限公司节能环保劳卫研究所 基于阈值归一化短时功率谱密度的高速铁路钢轨波磨声学诊断方法
KR20240048109A (ko) 2022-10-06 2024-04-15 주식회사 쿱와 센싱신호로부터 노이즈를 제거하기 위한 장치 및 노이즈 제거하기 위한 방법
CN116952356A (zh) * 2023-07-24 2023-10-27 中国人民解放军海军工程大学 基于浅海环境水下声全息技术的近场辐射噪声测量方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0608833B1 (en) * 1993-01-25 2001-10-17 Matsushita Electric Industrial Co., Ltd. Method of and apparatus for performing time-scale modification of speech signals
FR2726392B1 (fr) * 1994-10-28 1997-01-10 Alcatel Mobile Comm France Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
JP2760373B2 (ja) * 1995-03-03 1998-05-28 日本電気株式会社 雑音消去装置
JP2874679B2 (ja) * 1997-01-29 1999-03-24 日本電気株式会社 雑音消去方法及びその装置
US5999561A (en) * 1997-05-20 1999-12-07 Sanconix, Inc. Direct sequence spread spectrum method, computer-based product, apparatus and system tolerant to frequency reference offset
FR2771542B1 (fr) * 1997-11-21 2000-02-11 Sextant Avionique Procede de filtrage frequentiel applique au debruitage de signaux sonores mettant en oeuvre un filtre de wiener
US6549586B2 (en) * 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US6792405B2 (en) * 1999-12-10 2004-09-14 At&T Corp. Bitstream-based feature extraction method for a front-end speech recognizer

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9613631B2 (en) 2005-07-27 2017-04-04 Nec Corporation Noise suppression system, method and program
JP2021149084A (ja) * 2020-03-13 2021-09-27 ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド オーディオ信号処理方法および装置、記憶媒体
JP7062727B2 (ja) 2020-03-13 2022-05-06 ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド オーディオ信号処理方法および装置、記憶媒体
US11490200B2 (en) 2020-03-13 2022-11-01 Beijing Xiaomi Pinecone Electronics Co., Ltd. Audio signal processing method and device, and storage medium

Also Published As

Publication number Publication date
CA2436318C (fr) 2007-09-04
BR0116844A (pt) 2003-12-16
MXPA03006667A (es) 2003-10-24
HK1057639A1 (en) 2004-04-08
US20040064307A1 (en) 2004-04-01
FR2820227B1 (fr) 2003-04-18
JP4210521B2 (ja) 2009-01-21
KR100549133B1 (ko) 2006-02-03
EP1356461A1 (fr) 2003-10-29
EP1356461B1 (fr) 2010-06-30
CN1488136A (zh) 2004-04-07
CN1284139C (zh) 2006-11-08
FR2820227A1 (fr) 2002-08-02
US7313518B2 (en) 2007-12-25
KR20030074762A (ko) 2003-09-19
DE60142490D1 (de) 2010-08-12
ATE472794T1 (de) 2010-07-15
ES2347760T3 (es) 2010-11-04
WO2002061731A1 (fr) 2002-08-08
BRPI0116844B1 (pt) 2015-07-28
CA2436318A1 (fr) 2002-08-08

Similar Documents

Publication Publication Date Title
JP4210521B2 (ja) 雑音低減法および装置
JP5068653B2 (ja) 雑音のある音声信号を処理する方法および該方法を実行する装置
US8010355B2 (en) Low complexity noise reduction method
EP1169883B1 (en) System and method for dual microphone signal noise reduction using spectral subtraction
KR100594563B1 (ko) 선형 컨벌루션 및 인과 필터링을 사용하는 스펙트럼 감산에 의한 신호 잡음 감소
US6487257B1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
CN111554315B (zh) 单通道语音增强方法及装置、存储介质、终端
RU2768514C2 (ru) Процессор сигналов и способ обеспечения обработанного аудиосигнала с подавленным шумом и подавленной реверберацией
US8218780B2 (en) Methods and systems for blind dereverberation
CN102347028A (zh) 双麦克风语音增强装置及方法
CN108172231A (zh) 一种基于卡尔曼滤波的去混响方法及系统
JP2004502977A (ja) サブバンド指数平滑雑音消去システム
AT509570B1 (de) Methode und apparat zur einkanal-sprachverbesserung basierend auf einem latenzzeitreduzierten gehörmodell
Ghribi et al. A wavelet-based forward BSS algorithm for acoustic noise reduction and speech enhancement
EP1995722B1 (en) Method for processing an acoustic input signal to provide an output signal with reduced noise
Li et al. A block-based linear MMSE noise reduction with a high temporal resolution modeling of the speech excitation
Upadhyay et al. A perceptually motivated stationary wavelet packet filterbank using improved spectral over-subtraction for enhancement of speech in various noise environments
Buragohain et al. Single Channel Speech Enhancement System using Convolutional Neural Network based Autoencoder for Noisy Environments
Djendi A new efficient wavelet-based adaptive algorithm for automatic speech quality enhancement
Arslan et al. Speech enhancement for crosstalk interference
Krishnamoorthy et al. Processing noisy speech for enhancement
Tsukamoto et al. Speech enhancement based on MAP estimation with a variable speech distribution
Nakatani et al. Real-time speech enhancement in noisy reverberant multi-talker environments based on a location-independent room acoustics model
Leibrich et al. A TF distribution for disturbed and undisturbed speech signals and its application to noise reduction
Nitnaware Spectral Subtraction based Speech De-noising using Adapted Cascaded Median Filter

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040408

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081008

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081027

R150 Certificate of patent or registration of utility model

Ref document number: 4210521

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131031

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees