JP3849679B2 - 雑音除去方法、雑音除去装置およびプログラム - Google Patents

雑音除去方法、雑音除去装置およびプログラム Download PDF

Info

Publication number
JP3849679B2
JP3849679B2 JP2003332807A JP2003332807A JP3849679B2 JP 3849679 B2 JP3849679 B2 JP 3849679B2 JP 2003332807 A JP2003332807 A JP 2003332807A JP 2003332807 A JP2003332807 A JP 2003332807A JP 3849679 B2 JP3849679 B2 JP 3849679B2
Authority
JP
Japan
Prior art keywords
signal
frame
noise
window width
subtraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003332807A
Other languages
English (en)
Other versions
JP2005099405A (ja
Inventor
雅嗣 岡崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2003332807A priority Critical patent/JP3849679B2/ja
Publication of JP2005099405A publication Critical patent/JP2005099405A/ja
Application granted granted Critical
Publication of JP3849679B2 publication Critical patent/JP3849679B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音声信号の品質改善に用いて好適な雑音除去方法、雑音除去装置およびプログラムに関する。
野外や遮音状態の悪い部屋で収録された音声信号(観測信号)は、本来の信号(元信号)に対して雑音が重畳したものになる。このような観測信号の修復方法として、スペクトル減算法が知られている(非特許文献1〜7)。スペクトル減算法においては、例えば観測信号の雑音のみの区間に対して、時間領域から周波数領域への変換処理が施されることにより、雑音の振幅スペクトルの推定値μ(k)が求められる(kは周波数成分の番号)。次に、観測信号が所定長のフレームに分割され、各フレームに対して時間領域から周波数領域への変換処理が施されることにより、各フレームにおける観測信号の振幅・位相スペクトルYi(k)(iはフレームの番号)が求められる。そして、Yi(k)の位相スペクトルを保持しつつ、Yi(k)の振幅スペクトルから雑音の振幅スペクトルの推定値μ(k)を減算することにより、雑音を除去した元信号の推定信号が得られるのである。ここで、時間領域から周波数領域の信号への変換方法としては、離散フーリエ変換、離散コサイン変換、カルーネンレーベ変換などが用いられる。
S.F. Boll,"Suppression of acoustic noise in Speech using Spectral Subtraction" , IEEE Trans. Acoust.Speech, Signal Process., Vol.27, No.2, pp.113-120,1979 R.J.McAulay and M.L.Malpass,"Speech Enhancement Using a Soft-Decision Noise Suppression Filter ", IEEE Trans. Acoust. Speech,Signal Process.,Vol.28, No.2, pp.137-145,1980 Ephraim and D.Malah," Speech enhancement using a minimum mean-square error short -time spectral amplitude estimator",IEEE Trans. Acoust. Speech, Signal Process.,Vol.32, No.6, pp.1109-1121,1984 Ephraim and D.Malah," Speech enhancement using a minimum mean-square log-spectral amplitude estimator " , IEEE Trans. Acoust. Speech Signal Process., Vol.33, No.2, pp.443-445, 1985 I.Y.Soon, S.N.Koh, C.K.Yeo,"Noisy speech enhancement using discrete cosine transform",Speech Communication. , Vol.24 , pp.249-257, 1998 A.Rezayee and S.Gazor," An Adaptive KLT Approach for Speech Enhancement " , IEEE Trans. Speech, Audio Process., Vol.9, No.2, pp.87-95, 2001 Y.Ephraim and H.L.Van-Trees, " A Signal Subspace approach for Speech Enhancemant ," IEEE Trans. Speech and Audio Process., Vo l.3, No.4, pp.251-266,1995
ところで、スペクトル減算法においては、フレーム長を長くするほど、微細な成分を抽出しやすくなる点で有利である。しかし、フレーム長を長くすると、打楽器音や人間の声の子音など、非定常的でパルス的な成分も雑音とともに減衰されるため、得られた推定信号と元信号との間で聴感上に違いが生ずるという問題があった。
また、フレーム長を長くすると、いわゆるプリエコーが発生するという問題もある。その概要を図4を参照し説明する。図4(a)はサンプリング周波数が「44kHz」の観測信号の波形の一例であり、同図(b)〜(d)は、それぞれ「128」、「1024」、「8192」サンプルのフレーム長を観測信号に適用してスペクトル減算法によって推定信号を求めた結果である。ここで、同図(d)においては、信号が大きく立ち上がる直前に、信号振幅が若干増加していることが解る。このような現象をプリエコーと呼ぶ。これは、信号が大きく立ち上がるタイミングを挟むようにフレームが設けられている場合には、当該フレーム内の振幅スペクトルが平均化されて推定信号が生成されてしまうことに起因する。
この発明は上述した事情に鑑みてなされたものであり、特に非定常的な成分の再現性を高め、高品質な推定信号を得ることができる雑音除去方法、雑音除去装置およびプログラムを提供することを目的としている。
上記課題を解決するため本発明にあっては、下記構成を具備することを特徴とする。なお、括弧内は例示である。
請求項1記載の雑音除去方法にあっては、入力信号(y(t))を第1窓幅のフレーム毎に区切りつつこれら第1窓幅の各フレームにおける周波数成分毎の第1の信号振幅値(|Yi(k)|)を求める第1の変換過程(4)と、前記各第1の信号振幅値から推定雑音の対応する周波数成分における振幅値を減算する第1の減算過程(5)と、該第1の減算過程(5)における各周波数成分毎の減算結果に基づいて第1信号(S1)を合成する第1の逆変換過程(7)と、前記入力信号(y(t))から前記第1信号(S1)を減算した結果(S9)を前記第1窓幅よりも狭い第2窓幅のフレーム毎に区切りつつこれら第2窓幅の各フレームにおける周波数成分毎の第2の信号振幅値を求める第2の変換過程(14)と、前記各第2の信号振幅値から前記推定雑音の対応する周波数成分における振幅値を減算する第2の減算過程(15)と、該第2の減算過程(15)における各周波数成分毎の減算結果に基づいて第2信号(S2)を合成する第2の逆変換過程(17)と、前記第1信号および前記第2信号を合成することによって、雑音を除去した出力信号を得る過程とを有することを特徴とする。
さらに、請求項2記載の構成にあっては、請求項1記載の雑音除去方法において、一の注目フレームとその前後のフレームについて前記第1の減算過程(5)における各周波数成分毎の減算結果に対応する減算結果対応値を比較し、これら減算結果対応値のうち最小のものを前記注目フレームに対する振幅値として選択する選択過程(6)をさらに有し、前記第1の逆変換過程(7)は、該選択過程(6)において選択された振幅値に基づいて前記第1信号(S1)の前記注目フレームに対応する部分を合成する過程であることを特徴とする。
さらに、請求項3記載の構成にあっては、請求項2記載の雑音除去方法において、前記各フレームは、適用される窓幅に応じた所定の遷移幅づつ範囲が異なるように設定され、前記前後のフレームのうち前記注目フレームの前のフレームの数は、前記第1窓幅を該第1窓幅に適用される遷移幅で除算した値に対して±50%の範囲の整数に設定されることを特徴とする。
また、請求項記載の雑音除去装置にあっては、請求項1ないしの何れかに記載の雑音除去方法を実行することを特徴とする。
また、請求項記載のプログラムにあっては、請求項1ないしの何れかに記載の雑音除去方法を処理装置に実行させることを特徴とする。

このように、長い窓幅を用いて生成した第1信号と短い窓幅を用いて生成した第2信号とを合成して出力信号を得る構成によれば、第1信号によって微細な成分を抽出でき、第2信号によって非定常的な成分を抽出できるから、高品位な出力信号を得ることができる。さらに、第1の減算過程における各周波数成分毎の減算結果に対応する減算結果対応値を比較し、これら減算結果対応値のうち最小のものを注目フレームに対する振幅値として選択する構成によれば、プリエコーを防止することができ、注目フレームの前後のフレームにおける減算結果対応値に「1」を超える重み付けを与える構成によれば、元信号に振幅変動が生じている場合に出力信号の振幅低下を防止することができる。
また、入力信号を複数の異なる幅のフレームに区切った結果の各々について分析演算を施し、その分析演算の結果に基づいて適用すべき窓幅を決定する構成によれば、入力信号の状態に応じた最適な窓幅が選択されるから、非定常的な成分が多い場合であっても効率よく雑音を除去することができる。
1.第1実施例
1.1.実施例の構成
以下、この発明の第1実施例の雑音除去装置の構成を図1を参照し説明する。
なお、本実施例の雑音除去装置は、汎用パーソナルコンピュータと、該パーソナルコンピュータ上で動作するアプリケーションプログラムとによって構成されている。図において、2は通信インタフェースであり、ローカルエリアネットワークを介して他の機器との間で波形データのやりとりを行う。4は入力装置であり、文字入力用キーボードおよびマウス等から構成されている。8はディスプレイであり、ユーザに対して各種情報を表示する。10はCPUであり、後述する雑音除去アプリケーションプログラム等に基づいて、バス16を介して他の構成要素を制御する。12はROMであり、雑音除去装置のイニシャルプログラムローダ等が記憶されている。18はリムーバルディスクドライブ装置であり、CD−ROM、MO等のリムーバルディスク20に対して読出し/書込みを行う。22は波形取込インタフェースであり、外部から入力されたアナログ信号をデジタル信号に変換する。24はハードディスクであり、オペレーティングシステム、雑音除去アプリケーションプログラム、波形データ等が格納される。26は波形出力インタフェースであり、バス16を介して供給されたデジタルの楽音信号をアナログ信号に変換する。28はサウンドシステムであり、該楽音信号を発音する。30はRAMであり、CPU10のワークメモリとして用いられる。
1.2.実施例の動作
次に、本実施例の動作を図2を参照し説明する。なお、同図は雑音除去アプリケーションプログラムの機能ブロック図である。このアプリケーションプログラムには、「44.1kHz」で量子化された観測信号y(t)が与えられる。ここで、観測信号y(t)は、雑音の無い元信号s(t)に対して雑音d(t)が重畳されたものであると考えることができる。図2において2は雑音特徴抽出部であり、観測信号y(t)中の雑音d(t)のみの区間を計測することにより、雑音d(t)の特徴(周波数特性等)を測定する。
4は変換部であり、観測信号y(t)を「1/4」窓幅(2028サンプル)づつ遷移させながら所定の第1窓幅(8192サンプル)づつのフレームyi(t)(但しiはフレームの番号)に区切り、各フレームに窓関数(例えばハニング窓)を施し、その結果に対して離散フーリエ変換(DFT)を施すことによって各フレーム毎の観測信号の振幅・位相スペクトルYi(k)を算出する。ここで、振幅・位相スペクトルYi(k)は複素数であり、その絶対値を振幅スペクトル|Yi(k)|、複素空間内の角度を位相スペクトル∠Yi(k)という。8はフィルタ特性決定部であり、雑音特徴抽出部2によって測定された雑音d(t)の周波数特性に基づいて、第1窓幅(8192サンプル)に応じた、雑音の振幅スペクトルの推定値μ(k)を出力する。
すなわち、フィルタ特性決定部8においては、雑音d(t)が第1窓幅毎のフレームに区切られ、各フレームi毎に振幅スペクトル|Di(k)|が計算され、これら振幅スペクトルの周波数成分k毎の分散σ2(k)が計算され、この平方根である標準偏差σ(k)が雑音の振幅スペクトルの推定値μ(k)として出力される。次に、5はスペクトル減算部であり、変換部4およびフィルタ特性決定部8の計算結果に基づいて、元信号の推定スペクトルSpi(k)を下式(1)に従って計算する。

Spi(k)=[|Yi(k)| - μ(k)]・exp(j∠Yi(k)) ……式(1)
なお、式(1)において減算結果が負の値になった場合には、負の値に代えて「0」が推定スペクトルSpi(k)の値になる。上記式(1)以外にも、スペクトル減算法については様々な手法が検討されており、例えば式(1)は、より一般的には

Spi(k)=[|Yi(k)|α - βμ(k)]1/α・exp(j∠Yi(k)) ……式(2)

と表すことができる。ここで、α,βはスペクトル減算法のパラメータであり、α=2の場合は式(2)はパワースペクトル減算法の数式になる。
次に、6は振幅補正部であり、振幅・位相スペクトルSpi(k)の振幅スペクトルを修正し、その結果を振幅・位相スペクトルSpai(k)として出力する。ここで、振幅・位相スペクトルSpai(k)の振幅スペクトル|Spai(k)|は下式(3)によって計算される。

|Spai(k)| = min(|Spi-m(k)|/A-m, |Spi-m+1(k)|/A-m+1,....,
|Spi(k)| /A0, ....,|Spi+n-1(k)|/An-1, |Spi+n(k)|/An) ……式(3)
上式(3)においてminは複数の要素の中から最小値を求める関数であり、m, n, A-m〜Anは定数である。定数mは、窓幅をフレーム毎の窓の遷移幅で除算した値程度にすることにより、プリエコーを防止することができる。好ましくは、定数mは、窓幅をフレーム毎の窓の遷移幅で除算した値±50%以内にするとよい。可聴信号の場合、定数nはそれより小さくてもよい。例えば、上述した例にあっては「窓幅/遷移幅」は「4」であるから「m = n = 4」とし、係数A-m〜Anは「0.1, 0.25, 0.4, 0.6, 1, 0.1, 0.1, 0.1, 0.1」程度の値に設定するとよい。なお、プリエコーが問題になる場合は前半の係数を大きくし、またポストエコーが問題になる場合は後半の係数を大きくすることでこれらの問題に対応することができる
ここで、このような振幅補正を行う理由について説明しておく。先に図4において説明したように、第1窓幅(8192サンプル)のように長いフレーム長が適用された場合には、信号の立ち上がりタイミング前にプリエコーが発生するという問題が生じる。このプリエコーは、例えば振幅スペクトル|Spai(k)|を

|Spai(k)|=min(|Spi-m(k)|, |Spi-m+1(k)|,....,
|Spi(k)|,....,|Spi+n-1(k)|, |Spi+n(k)|) ……式(4)

とすることにより防止することができる。しかし、このように単に前後の振幅スペクトルの最小値を採用する方法では、元信号の定常成分の振幅に緩やかな変化が生じている場合(例えばビブラートがかかっている場合や減衰している場合)には、推定信号の定常成分の振幅が元信号の振幅よりも低くなりすぎるという問題が生じる。このため、観測信号の注目フレームの前後の振幅スペクトルに対して上述したように定数A-m〜Anによる重み付けを施し、注目フレームの振幅スペクトル|Spi|がそのまま補正後の振幅スペクトル|Spai(k)| として採用されやすくしたものである。
次に、7は逆変換部であり、補正後の振幅・位相スペクトルSpai(k)に対して離散フーリエ逆変換(IDFT)を施し、各フレーム毎の離散フーリエ逆変換結果を結合し、結合した結果を信号S1として出力する。従って、この信号S1は、観測信号y(t)の中から比較的長いトーン成分を抽出した信号になる。次に、9は減算器であり、観測信号y(t)から信号S1を減算し、減算結果として信号S9を出力する。従って、この信号S9は、比較的短いトーン成分と、雑音d(t)とを重畳した信号になる。
次に、14は変換部であり、信号S9を「1/4」窓幅(256サンプル)づつ遷移させながら第2窓幅(1024サンプル)づつのフレームに区切り、各フレームに窓関数を施し、その結果に対して離散フーリエ変換を施すことによって各フレーム毎の信号S9の振幅・位相スペクトルを算出する。18はフィルタ特性決定部であり、上述したフィルタ特性決定部8と同様に、第2窓幅(1024サンプル)に応じた雑音の振幅スペクトルの推定値を出力する。15はスペクトル減算部であり、スペクトル減算部5と同様に、信号S9の振幅スペクトルから雑音の振幅スペクトルの推定値を減算する。
17は逆変換部であり、逆変換部7と同様に、スペクトル減算部15の減算結果に対して第2窓幅の各フレーム毎に離散フーリエ逆変換(IDFT)を施し、各フレーム毎の離散フーリエ逆変換結果を結合し、結合した結果を信号S2として出力する。従って、この信号S2は、信号S9に含まれる周波数成分の中から比較的長いトーン成分を抽出した信号になる。次に、19は減算器であり、信号S9から信号S2を減算し、減算結果として信号S19を出力する。従って、この信号S19は、信号S9に含まれるトーン成分の中で比較的短いトーン成分と、雑音d(t)とを重畳した信号になる。
次に、24は変換部、25はスペクトル減算部、28はフィルタ特性決定部、27は逆変換部、29は減算器であり、各々上記変換部14、スペクトル減算部15、フィルタ特性決定部18、逆変換部17、減算器19と同様に構成され、変換部24には上記信号S19が供給される。但し、これらのブロックにおけるフレームは、第2窓幅の「1/8」である第3窓幅(128サンプル)に設定されている。これにより、逆変換部27からは、信号S2よりもさらに短いトーン成分である信号S3が出力される。
同様に、34は変換部、35はスペクトル減算部、38はフィルタ特性決定部、37は逆変換部、39は減算器であり、各々上記変換部14、スペクトル減算部15、フィルタ特性決定部18、逆変換部17、減算器19と同様に構成され、変換部24には減算器29の出力信号S29が供給される。但し、これらのブロックにおけるフレームは、第3窓幅のさらに「1/8」である第4窓幅(16サンプル)に設定されている。これにより、逆変換部37からは、信号S3よりもさらに短いトーン成分である信号S4が出力される。40は加算器であり、これら信号S1,S2,S3, S4を加算し、加算結果を元信号の推定信号Soutとして出力する。
以上のように本実施例によれば、窓幅を異ならせつつ複数段階に渡ってスペクトル減算法を実行し、その結果得られた信号S1,S2,S3, S4を加算して推定信号Soutを得るから、観測信号y(t)に含まれる元信号の微細な成分を再現しつつ高品質な推定信号を得ることができる。
2.第2実施例
次に、本発明の第2実施例について説明する。第2実施例の雑音除去装置も、汎用パーソナルコンピュータと、該パーソナルコンピュータ上で動作するアプリケーションプログラムとによって構成されている。そして、パーソナルコンピュータのハードウエア構成は第1実施例のもの(図1)と同様である。そして、本実施例における雑音除去アプリケーションプログラムのアルゴリズムは、図3のように構成されている。
図3において54は変換部であり、観測信号y(t)を「1/4」窓幅づつ遷移させながら、長窓幅(Pサンプル)、短窓幅(Qサンプル)または遷移窓幅(Rサンプル)の何れかの窓幅毎のフレームyi(t)に区切り、各フレームに窓関数(例えばハニング窓)を施し、その結果に対して離散フーリエ変換(DFT)を施すことによって各フレーム毎の観測信号の振幅・位相スペクトルYi(k)を算出する。なお、サンプル数P,Q,Rは、例えば「P=1024」、「Q=128」、「R=(P+Q)/2=576」のように設定するとよい。変換部54において適用される窓関数は、基本的には長幅窓関数(Pサンプル)または短幅窓関数(Qサンプル)のうち何れかである。
但し、適用される窓関数が長幅窓関数から短幅窓関数に切り替わる際には、その中間に長短遷移窓関数(Rサンプル)が適用され、短幅窓関数から長幅窓関数に切り替わる際にはその中間に短長遷移窓関数(Rサンプル)が適用される。ここで、長短遷移窓関数は、長幅窓関数の前半「P/2」サンプルと短幅窓関数の後半「Q/2」サンプルとを順次結合して成る窓関数であり、同様に短長遷移窓関数は短幅窓関数の前半「Q/2」サンプルと長幅窓関数の後半「P/2」サンプルとを結合して成る窓関数である。
53は窓幅判定部であり、変換部54等に対して適用すべき窓関数を決定し、決定した結果を変換部54等に指示する。ここで「適用すべき窓関数」は以下のようにして決定される。まず、長幅窓関数を適用して観測信号y(t)に離散フーリエ変換(DFT)を施した結果である振幅・位相スペクトルYL(k)と、短幅窓関数を適用して観測信号y(t)に離散フーリエ変換を施した結果である振幅・位相スペクトルYS(k)とが演算される。次に、これらのスペクトルが各窓幅の平方根(√P,√Q)で各々除算され、該除算結果の分散が計算される。そして、長幅窓関数に係る分散σ2(YL(k)/√P)が短幅窓関数に係る分散σ2(YS(k)/√Q)よりも小さければ、窓関数が長幅窓関数に遷移され、それ以外の場合には窓関数が短幅窓関数に遷移される。
ここで、分散σ2(YL(k)/√P)およびσ2(YS(k)/√Q)は、両窓関数を適用した場合におけるエネルギーの集中度合いを表している。そして、振幅・位相スペクトルを窓幅の平方根(√P,√Q)で除算した理由は、窓幅の違いによって生じるエネルギー差を補償するためである。そして、「σ2(YL(k)/√P)<σ2(YS(k)/√Q)」が成立した場合には、長幅窓関数を適用したならば抽出できる振幅・位相スペクトルのうち相当の部分が、短幅窓関数を適用したならば抽出されないことになる。従って、かかる場合には窓関数を長幅窓関数に遷移させ、元信号に含まれると予想されるより多くの成分を抽出することが望ましいことが解る。一方、それ以外の場合には、短幅窓関数を適用することにより、非定常的あるいはパルシブな成分が抽出されやすくしておくことが望ましいのである。
なお、ここで「遷移される」とは、直前に適用されていた窓関数と遷移先の窓関数が同一である場合は「当該同一の窓関数が引き続き適用される」ことを意味し、直前に適用されていた窓関数が短幅窓関数であって遷移先の窓関数が長幅窓関数である場合には「短長遷移窓関数および長幅窓関数が順次適用される」ことを意味し、また、直前に適用されていた窓関数が長幅窓関数であって遷移先の窓関数が短幅窓関数である場合には「長短遷移窓関数および短幅窓関数が順次適用される」ことを意味する。
次に、雑音特徴抽出部2は第1実施例のものと同様に構成されている。58はフィルタ特性決定部であり、ここでは雑音d(t)に対して、観測信号y(t)に適用される窓関数と同一の窓関数が適用され、この結果に対して離散フーリエ変換が施されることによってフレームi毎に雑音の振幅スペクトル|Di(k)|が計算される。そして、これら振幅スペクトルの周波数成分k毎の分散σ2(k)が計算され、この平方根である標準偏差σ(k)が雑音の振幅スペクトルの推定値μ(k)として出力される。
55はスペクトル減算部であり、第1実施例のスペクトル減算部5と同様に、式(1)に基づいて各フレーム毎の観測信号の振幅・位相スペクトルYi(k)の振幅スペクトルから、雑音の振幅スペクトルの推定値μ(k)を減算する。57は逆変換部であり、適用される窓幅に応じてスペクトル減算部55の減算結果に対して離散フーリエ逆変換(IDFT)を施し、各フレーム毎の離散フーリエ逆変換結果を結合し、結合した結果を推定信号Soutとして出力する。
以上のように本実施例によれば、複数の窓関数を適用した各場合におけるエネルギーの集中度合いに基づいて一の窓関数を選択するから、観測信号y(t)の状態に応じた最適な窓関数を変換部54等に適用することにより、高品質な推定信号を得ることができる。
3.変形例
本発明は上述した実施例に限定されるものではなく、例えば以下のように種々の変形が可能である。
(1)上記各実施例においては、パーソナルコンピュータ上で動作する雑音除去アプリケーションプログラムによって雑音除去を行ったが、このアプリケーションプログラムのみをCD−ROM、フレキシブルディスク等の記録媒体に格納して頒布し、あるいは伝送路を通じて頒布することもできる。
(2)第1実施例においては、スペクトル減算を「4」段に渡って実行したが、この段数は「4」に限定されるものではなく、「2」段あるいは「3」段に渡ってスペクトル減算を実行してもよい。なお、サンプリング周波数が「44.1kHz」であれば、これらの窓幅のうち少なくとも一つは「1000」サンプル以上(約0.0227秒以上)とし、少なくとも一つは「500」サンプル以下(約0.0113秒以下)にすると好適である。
(3)また、第1実施例においては、変換部14,24,34における窓幅を前段の窓幅の「1/8」に設定したが、これは前段の窓幅よりも狭い窓幅を使用するのであれば、窓幅比は「1/8」に限定されるものではない。但し、窓幅比を前段の「1/2」程度にすると、累積誤差が大きくなる傾向があるため、望ましくは「1/4」以下、より望ましくは第1実施例のように「1/8」にするとよい。
(4)上記各実施例において、変換部4等における変換方式は離散フーリエ変換に限定されるものではなく、離散コサイン変換、カルーネンレーベ変換などを適用してもよい。かかる場合には、逆変換部7等においては、採用された変換方式に対応する逆変換が実行されることは言うまでも無い。
(5)また、上記各実施例において、フィルタ特性決定部8,18,28,38,58では、雑音d(t)の振幅スペクトル|Di(k)|の標準偏差σ(k)が雑音の振幅スペクトルの推定値μ(k)として用いられたが、推定値μ(k)はこれに限定されるものではなく、雑音d(t)の振幅スペクトル|Di(k)|の絶対値の時間平均、振幅スペクトル|Di(k)|の二乗値(電力)の時間平均等を雑音の振幅スペクトルの推定値μ(k)として適用してもよい。
(6)また、上記各実施例において適用される窓関数はハニング窓に限定されるものではなく、ハミング窓、ブラックマン窓等を適用してもよい。また、各実施例において適用された窓幅は、数十ないし数千サンプル程度の幅であったが、これはサンプリング周波数が「44.1kHz」の場合に好ましい範囲であるから、サンプリング周波数が増減する場合にはそれに応じて窓幅のサンプル数も増減させるとよい。
(7)また、上記各実施例においては、隣接するフレーム間で窓幅を「1/4」づつ遷移させたが、遷移させる幅はこれに限定されるものではなく、窓幅の「1/5」あるいは「1/3」でもよく、窓幅に関係無く、所定のサンプル幅づつ遷移させてもよい。
本発明の第1実施例の雑音除去装置のハードウエアブロック図である。 第1実施例における雑音除去アルゴリズムのブロック図である。 第2実施例における雑音除去アルゴリズムのブロック図である。 従来技術のスペクトル減算法による実測波形図である。
符号の説明
2:雑音特徴抽出部、6:振幅補正部、9,19,29,39:減算器、40:加算器、4,14,24,34,54:変換部(第1,第2の変換過程)、5,15,25,35,55:スペクトル減算部(第1,第2の減算過程)、7,17,27,37,57:逆変換部、8,18,28,38,58:フィルタ特性決定部(雑音成分決定過程)。

Claims (5)

  1. 入力信号を第1窓幅のフレーム毎に区切りつつこれら第1窓幅の各フレームにおける周波数成分毎の第1の信号振幅値を求める第1の変換過程と、
    前記各第1の信号振幅値から推定雑音の対応する周波数成分における振幅値を減算する第1の減算過程と、
    該第1の減算過程における各周波数成分毎の減算結果に基づいて第1信号を合成する第1の逆変換過程と、
    前記入力信号から前記第1信号を減算した結果を前記第1窓幅よりも狭い第2窓幅のフレーム毎に区切りつつこれら第2窓幅の各フレームにおける周波数成分毎の第2の信号振幅値を求める第2の変換過程と、
    前記各第2の信号振幅値から前記推定雑音の対応する周波数成分における振幅値を減算する第2の減算過程と、
    該第2の減算過程における各周波数成分毎の減算結果に基づいて第2信号を合成する第2の逆変換過程と、
    前記第1信号および前記第2信号を合成することによって、雑音を除去した出力信号を得る過程と
    を有することを特徴とする雑音除去方法。
  2. 一の注目フレームとその前後のフレームについて前記第1の減算過程における各周波数成分毎の減算結果に対応する減算結果対応値を比較し、これら減算結果対応値のうち最小のものを前記注目フレームに対する振幅値として選択する選択過程をさらに有し、
    前記第1の逆変換過程は、該選択過程において選択された振幅値に基づいて前記第1信号の前記注目フレームに対応する部分を合成する過程である
    ことを特徴とする請求項1記載の雑音除去方法。
  3. 前記各フレームは、適用される窓幅に応じた所定の遷移幅づつ範囲が異なるように設定され、
    前記前後のフレームのうち前記注目フレームの前のフレームの数は、前記第1窓幅を該第1窓幅に適用される遷移幅で除算した値に対して±50%の範囲の整数に設定される
    ことを特徴とする請求項2記載の雑音除去方法。
  4. 請求項1ないしの何れかに記載の雑音除去方法を実行することを特徴とする雑音除去装置。
  5. 請求項1ないしの何れかに記載の雑音除去方法を処理装置に実行させることを特徴とするプログラム。
JP2003332807A 2003-09-25 2003-09-25 雑音除去方法、雑音除去装置およびプログラム Expired - Fee Related JP3849679B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003332807A JP3849679B2 (ja) 2003-09-25 2003-09-25 雑音除去方法、雑音除去装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003332807A JP3849679B2 (ja) 2003-09-25 2003-09-25 雑音除去方法、雑音除去装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2005099405A JP2005099405A (ja) 2005-04-14
JP3849679B2 true JP3849679B2 (ja) 2006-11-22

Family

ID=34461005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003332807A Expired - Fee Related JP3849679B2 (ja) 2003-09-25 2003-09-25 雑音除去方法、雑音除去装置およびプログラム

Country Status (1)

Country Link
JP (1) JP3849679B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014051149A (ja) * 2012-09-05 2014-03-20 Yamaha Corp エンジン音加工装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4454591B2 (ja) * 2006-02-09 2010-04-21 学校法人早稲田大学 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置
JP5374845B2 (ja) * 2007-07-25 2013-12-25 日本電気株式会社 雑音推定装置と方法およびプログラム
EP2372704A1 (en) 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor and method for processing a signal
JPWO2014017371A1 (ja) * 2012-07-25 2016-07-11 株式会社ニコン 音処理装置、電子機器、撮像装置、プログラム、及び、音処理方法
CN109658946A (zh) * 2017-10-12 2019-04-19 深圳前海黑鲸科技有限公司 一种回声处理方法、装置、存储介质及终端设备
JP6912780B2 (ja) * 2018-08-24 2021-08-04 日本電信電話株式会社 音源強調装置、音源強調学習装置、音源強調方法、プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014051149A (ja) * 2012-09-05 2014-03-20 Yamaha Corp エンジン音加工装置

Also Published As

Publication number Publication date
JP2005099405A (ja) 2005-04-14

Similar Documents

Publication Publication Date Title
CN103021420B (zh) 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法
JP5528538B2 (ja) 雑音抑圧装置
JP4958303B2 (ja) 雑音抑圧方法およびその装置
JP5791092B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP5435204B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP4568733B2 (ja) 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラムおよびコンピュータに読み取り可能な記録媒体
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
US20130311189A1 (en) Voice processing apparatus
Hu et al. A cepstrum-based preprocessing and postprocessing for speech enhancement in adverse environments
JP4454591B2 (ja) 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置
JP3960834B2 (ja) 音声強調装置及び音声強調方法
JP2008216721A (ja) 雑音抑圧の方法、装置、及びプログラム
JP6379839B2 (ja) 雑音抑圧装置、方法及びプログラム
JP4434813B2 (ja) 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置
JP3849679B2 (ja) 雑音除去方法、雑音除去装置およびプログラム
US10297272B2 (en) Signal processor
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP4505597B2 (ja) 雑音除去装置
JP5772723B2 (ja) 音響処理装置および分離マスク生成装置
Bari et al. Toward a methodology for the restoration of electroacoustic music
JP5588233B2 (ja) 雑音抑圧装置およびプログラム
Pallavi et al. Phase-locked Loop (PLL) Based Phase Estimation in Single Channel Speech Enhancement.
JP2004020945A (ja) 音声認識装置、音声認識方法、および、音声認識プログラム
JP4313740B2 (ja) 残響除去方法、プログラムおよび記録媒体
JP2013130815A (ja) 雑音抑圧装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060821

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130908

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees