JP5056654B2 - 雑音抑制装置、及び雑音抑制方法 - Google Patents

雑音抑制装置、及び雑音抑制方法 Download PDF

Info

Publication number
JP5056654B2
JP5056654B2 JP2008195360A JP2008195360A JP5056654B2 JP 5056654 B2 JP5056654 B2 JP 5056654B2 JP 2008195360 A JP2008195360 A JP 2008195360A JP 2008195360 A JP2008195360 A JP 2008195360A JP 5056654 B2 JP5056654 B2 JP 5056654B2
Authority
JP
Japan
Prior art keywords
spectrum
noise
level
power spectrum
signal power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008195360A
Other languages
English (en)
Other versions
JP2010032802A (ja
Inventor
俊博 久芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2008195360A priority Critical patent/JP5056654B2/ja
Publication of JP2010032802A publication Critical patent/JP2010032802A/ja
Application granted granted Critical
Publication of JP5056654B2 publication Critical patent/JP5056654B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、雑音が混入した信号から雑音成分を抑制する技術に関する。
雑音が混入した信号から雑音成分を抑制する手法として、周波数領域でスペクトル操作を行うスペクトル・サブトラクション法がよく知られている。スペクトル・サブトラクション法は、音声の含まれない時間である雑音区間において雑音スペクトルを推定し、その雑音成分を入力信号から減算することを基本原理とする雑音抑制法である。
下記特許文献1には、図7に示すような、スペクトル・サブトラクション法を用いた雑音抑制装置が記載されている。
この雑音抑制装置は、雑音が混入した入力信号をFFT(Fast Fourier Transform)やMDCT(Modified Discrete Cosine Transform)等によって周波数スペクトルに変換する周波数変換部1と、電界強度レベルに応じた雑音スペクトルのパターンを記憶し、入力される信号強度レベルに従って雑音スペクトルを推定する雑音推定部2を有している。
入力信号の周波数スペクトルと推定された雑音スペクトルは、抑圧関数算出部3に与えられ、雑音成分を抑圧するための雑音抑圧関数が算出されて抑圧関数補正部4に出力されるようになっている。雑音抑圧関数は、抑圧関数補正部4で入力信号スペクトルの信号成分と雑音成分毎に補正され、雑音抑制部5に与えられる。
雑音抑制部5は、周波数変換部1から与えられる入力信号の周波数スペクトルに、補正された雑音抑圧関数を乗算することによって雑音成分を抑制する。雑音成分が抑制された周波数スペクトルは、周波数逆変換部6によって時系列信号に逆変換され、出力信号が得られる。
ここで、抑圧関数補正部4は、図8に示すように、信号成分判定部4a、信号成分強調部4b、及び振幅調整部4cで構成されている。信号成分判定部4aは、雑音抑圧関数の値を信号成分判定閾値と比較して、信号成分であるか雑音成分であるかを判定する。信号成分強調部4bは、信号成分と判定された信号を、信号成分強調ゲインだけ強調する。そして、振幅調整部4cで、入力信号スペクトル全体のレベル調整を行う。
この雑音抑制装置では、このような抑圧関数補正部4を設けることで、入力信号中の信号成分が強調されると共に、背景雑音が相対的に抑圧され、雑音抑制ができるとされている。
特開2007−27897号公報
しかしながら、特許文献1の雑音抑制装置では、次のような問題点があった。
・入力信号の信号対雑音比(S/N)が悪い場合、目的信号と雑音の判別が難しく、この判別に誤りが多くなると、雑音低減効果が極端に低減する。
・信号成分レベルを持ち上げた後、全体のゲインを補正するという、抑圧関数補正部4で行っている方法では、入力信号スペクトルにおける「谷」の部分(スペクトル成分が極端に小さい部分)が考慮されていない。このため、スペクトル・サブトラクション等のスペクトル操作処理で雑音を取り去った後の信号に、ミュージカル・ノイズが発生するという問題がある。
ミュージカル・ノイズとは、「キュルキュル」というような楽音的な雑音である。ミュージカル・ノイズは、スペクトル操作処理によって引き去れなかったり、引き過ぎてしまったりした雑音スペクトル成分の影響で、スペクトル操作処理後の信号に孤立したトーンの「島」が発生することが原因となる。トーンの島の周波数が、処理フレーム単位で次々と切り替わることにより、「キュルキュル」という耳障りな音として知覚される。
・雑音レベルの推定を、音声等の信号成分も含む信号強度に基づいて行っているため、入力信号に含まれる信号成分の割合によって、雑音レベルの推定結果が異なる。このため、雑音抑圧効果や、ミュージカル・ノイズ抑制効果にばらつきが生じる。
本発明は、S/Nの悪い入力信号であっても、スペクトル・サブトラクション法を用いて、雑音成分とミュージカル・ノイズを安定して抑制することを目的としている。
上記目的を達成するために、本発明の第1の観点に係る雑音抑制装置は、入力信号を一定周期毎に周波数領域に変換した入力信号スペクトルから雑音信号パワースペクトルを推定する雑音パワースペクトル推定部と、前記入力信号スペクトル及び前記雑音信号パワースペクトルから音声信号パワースペクトルを推定する音声信号パワースペクトル推定部と、前記雑音信号パワースペクトルに基づいて圧縮雑音レベルを作成し、作成した前記圧縮雑音レベルと前記音声信号パワースペクトルの各周波数におけるスペクトルが音声信号のスペクトルか残留雑音のスペクトルかを判定するための信号成分判定閾値とを出力する圧縮閾値作成部と、前記音声信号パワースペクトルの各周波数におけるスペクトルのうちで、前記圧縮雑音レベルより低いレベルのスペクトルではレベル上昇させ、前記圧縮雑音レベルより高く、前記信号成分判定閾値より低いレベルのスペクトルではレベル低下させ、前記信号成分判定閾値以上のレベルのスペクトルではレベル変更せずに、圧縮音声信号パワースペクトルを生成するスペクトル圧縮部とを有するミュージカル・ノイズ抑制部と、前記圧縮音声信号パワースペクトルと前記雑音信号パワースペクトルに基づいて雑音減衰係数を生成する雑音減衰係数作成部と、前記入力信号スペクトルに前記雑音減衰係数を乗算して出力信号スペクトルを生成する雑音抑制部と、前記出力信号スペクトルを時間領域の出力信号に変換する周波数逆変換部とを備えることを特徴とする。
また前記雑音信号パワースペクトルの各周波数におけるスペクトルのレベルの平均値である平均雑音レベルを算出し、算出した前記平均雑音レベルを出力する雑音レベル算出部を備え、前記スペクトル圧縮部は、前記平均雑音レベルと前記信号成分判定閾値とに基づいて、前記レベル上昇または前記レベル低下の程度を調整することができる。
上記目的を達成するために、本発明の第2の観点に係る雑音抑制装置は、入力信号を一定周期毎に周波数領域に変換した入力信号スペクトルから雑音信号パワースペクトルを推定する雑音パワースペクトル推定部と、前記入力信号スペクトル及び前記雑音信号パワースペクトルから音声信号パワースペクトルを推定する音声信号パワースペクトル推定部と、前記音声信号パワースペクトルの各周波数におけるスペクトルのうちで、前記雑音信号パワースペクトルの各周波数におけるスペクトルのレベルの平均値である平均雑音レベル以下のスペクトルのレベル変動を一定幅以内に圧縮し、圧縮音声信号パワースペクトルを生成するミュージカル・ノイズ抑制部と、前記圧縮音声信号パワースペクトルと前記雑音信号パワースペクトルとに基づいて雑音減衰係数を生成する雑音減衰係数作成部と、前記入力信号スペクトルに前記雑音減衰係数を乗算して出力信号スペクトルを生成する雑音抑制部と、前記出力信号スペクトルを時間領域の出力信号に変換する周波数逆変換部とを、備え、前記ミュージカル・ノイズ抑制部は、前記平均雑音レベルを算出して、算出した平均雑音レベルを出力する雑音レベル算出部と、前記音声信号パワースペクトルの各周波数におけるスペクトルが音声信号のスペクトルか残留雑音のスペクトルかを判定するための信号成分判定閾値と、前記平均雑音レベルを予め設定された圧縮率で圧縮した圧縮雑音レベルを出力する圧縮閾値作成部と、前記平均雑音レベル、前記信号成分判定閾値と、前記圧縮雑音レベルに基づいて、前記音声信号パワースペクトルを圧縮して出力するためのスペクトル圧縮曲線を生成する圧縮曲線作成部と、前記スペクトル圧縮曲線に従って前記音声信号パワースペクトルを圧縮し、圧縮音声信号パワースペクトルを生成するスペクトル圧縮部とを、有することを特徴とする
また、前記スペクトル圧縮曲線は、前記音声信号パワースペクトルのレベルに応じて、0〜圧縮雑音レベル、圧縮雑音レベル〜平均雑音レベル、平均雑音レベル〜信号成分判定閾値、及び信号成分判定閾値以上の、4つの区間に区分された折れ線または曲線で表すことができる。
また、前記スペクトル圧縮部は、前記音声信号パワースペクトルの各周波数におけるスペクトルのうちで、前記スペクトルのレベルが、0から前記圧縮雑音レベルまでの間にあるときは、該圧縮雑音レベルを最大値として該スペクトルのレベルを上昇させて出力し、前記スペクトルのレベルが、前記圧縮雑音レベルから前記平均雑音レベルまでの間にあるときは、該圧縮雑音レベルを最小値として該スペクトルのレベルを予め設定した雑音レベルの上限値まで低下させて出力し、前記スペクトルのレベルが、前記平均雑音レベルから前記信号成分判定閾値までの間にあるときは、該スペクトルのレベルが前記設定した雑音レベルから該信号成分判定閾値の間でスムーズに上昇するように変換して出力し、前記スペクトルのレベルが、前記信号成分判定閾値以上のときには、該スペクトルのレベルを変えずに出力するように構成することができる。
更に、前記雑音パワースペクトル推定部は、順次与えられる前記入力信号スペクトルのレベル差に応じた重み関数を用いて該入力信号スペクトルを平均化することによって、前記雑音信号パワースペクトルを算出することができる。
上記目的を達成するために、本発明の第の観点に係る雑音抑制方法は、入力信号を一定周期毎に周波数領域に変換した入力信号スペクトルから雑音信号パワースペクトルを推定する雑音パワースペクトル推定処理と、前記入力信号スペクトル及び前記雑音信号パワースペクトルから音声信号パワースペクトルを推定する音声信号パワースペクトル推定処理と、前記雑音信号パワースペクトルに基づいて圧縮雑音レベルを作成し、作成した前記圧縮雑音レベルと前記音声信号パワースペクトルの各周波数におけるスペクトルが音声信号のスペクトルか残留雑音のスペクトルかを判定するための信号成分判定閾値とを出力する圧縮閾値作成処理と、前記音声信号パワースペクトルの各周波数におけるスペクトルのうちで、前記圧縮雑音レベルより低いレベルのスペクトルではレベル上昇させ、前記圧縮雑音レベルより高く、前記信号成分判定閾値より低いレベルのスペクトルではレベル低下させ、前記信号成分判定閾値以上のレベルのスペクトルではレベル変更せずに、圧縮音声信号パワースペクトルを生成するスペクトル圧縮処理とを順次行うミュージカル・ノイズ抑制処理と、前記圧縮音声信号パワースペクトルと前記雑音信号パワースペクトルに基づいて雑音減衰係数を生成する雑音減衰係数作成処理と、前記入力信号スペクトルに前記雑音減衰係数を乗算して出力信号スペクトルを生成する雑音抑制処理と、前記出力信号スペクトルを時間領域の出力信号に変換する周波数逆変換処理とを、順次行うことを特徴とする。
上記目的を達成するために、本発明の第の観点に係る雑音抑制方法、入力信号を一定周期毎に周波数領域に変換した入力信号スペクトルから雑音信号パワースペクトルを推定する雑音パワースペクトル推定処理と、前記入力信号スペクトル及び前記雑音信号パワースペクトルから音声信号パワースペクトルを推定する音声信号パワースペクトル推定処理と、前記音声信号パワースペクトルの各周波数におけるスペクトルのうちで、前記雑音信号パワースペクトルの各周波数におけるスペクトルのレベルの平均値である平均雑音レベル以下のスペクトルのレベル変動を一定幅以内に圧縮し、圧縮音声信号パワースペクトルを生成するミュージカル・ノイズ抑制処理と、前記圧縮音声信号パワースペクトルと前記雑音信号パワースペクトルに基づいて雑音減衰係数を生成する雑音減衰係数作成処理と、前記入力信号スペクトルに前記雑音減衰係数を乗算して出力信号スペクトルを生成する雑音抑制処理と、前記出力信号スペクトルを時間領域の出力信号に変換する周波数逆変換処理とを、順次行い、前記ミュージカル・ノイズ抑制処理では、前記平均雑音レベルを算出して、算出した平均雑音レベルを出力する雑音レベル算出処理と、前記音声信号パワースペクトルの各周波数におけるスペクトルが音声信号のスペクトルか残留雑音のスペクトルかを判定するための信号成分判定閾値と、前記平均雑音レベルを予め設定された圧縮率で圧縮した圧縮雑音レベルを出力する圧縮閾値作成処理と、前記平均雑音レベルと、前記信号成分判定閾値と、前記圧縮雑音レベルとに基づいて、前記音声信号パワースペクトルを圧縮して出力するためのスペクトル圧縮曲線を生成する圧縮曲線作成処理と、前記スペクトル圧縮曲線に従って前記音声信号パワースペクトルを圧縮し、圧縮音声信号パワースペクトルを生成するスペクトル圧縮処理とを、順次行うことを特徴とする。
本発明によれば、周波数領域に変換された入力信号スペクトルから推定された音声信号パワースペクトルと雑音信号パワースペクトルに基づいて、この音声信号パワースペクトルにおける平均雑音レベル以下のスペクトルのレベル変動を一定幅以内に圧縮し、圧縮音声信号パワースペクトルを生成する。更に、生成した圧縮音声信号パワースペクトルと雑音信号パワースペクトルに基づいて雑音減衰係数を生成し、入力信号スペクトルにこの雑音減衰係数を乗算して出力信号スペクトルを生成している。これにより、ミュージカル・ノイズの原因となる平均雑音レベル以下の入力信号スペクトルのレベル変動が圧縮され、雑音成分とミュージカル・ノイズを安定して抑制することができる。
以下、図面に基づき、本発明の実施形態について詳細に説明する。
本実施形態の雑音抑制装置は、図1に示すように、アナログの入力信号INを周期的にサンプリングし、ディジタル信号x(n)に変換して出力するアナログ/ディジタル(A/D)変換部11を有している。A/D変換部11の出力側には、周波数変換部12が接続されている。
周波数変換部12は、A/D変換部11から出力されるディジタル信号x(n)を一定期間毎にまとめてフレーム化し、各フレームに対して高速フーリエ変換等の周波数変換操作を実行するものである。これにより、ディジタル信号x(n)は、時間領域から周波数領域の入力信号スペクトルXn(ω)に変換され、周波数変換部12から出力されるようになっている。周波数変換部12の出力側には、雑音パワースペクトル推定部13と音声信号パワースペクトル推定部14が接続されている。
雑音パワースペクトル推定部13は、入力信号スペクトルXn(ω)に基づいて、雑音信号のパワースペクトルを推定するものである。雑音信号パワースペクトル|Wn(ω)|は、入力信号スペクトルXn(ω)から入力信号パワースペクトル|Xn(ω)|を算出し、これを時間方向に平均化することで得ることができる。
このとき、音声信号等を含まず、時間変動の少ない定常的な雑音成分のみのパワースペクトルを得るために、入力信号のパワースペクトルに対して重み関数を適用する必要がある。この重み関数は、連続して入力されるフレーム間の差分に基づいて求めることができる。
即ち、フレーム間の差分が大きいときは、音声信号等が存在する可能性が高いので、重み関数を小さくする。一方、フレーム間の差分が小さいときは、音声信号等が存在しない可能性が高いので、重み関数を大きくする。これにより、フレーム間の差分が大きなスペクトル成分は、音声信号等の重要な成分であると見なして、雑音信号パワースペクトルの推定値への影響を少なくすることができる。
音声信号パワースペクトル推定部14は、入力信号パワースペクトル|Xn(ω)|と雑音信号パワースペクトル|Wn(ω)|から、音声信号パワースペクトルの推定値を算出するものである。音声信号パワースペクトル|Sn(ω)|は、次式によって求められる。
|Sn(ω)|=|Xn(ω)|−|Wn(ω)|
但し、入力信号INには不規則性の雑音が含まれているので、音声信号スペクトルの推定値Sn(ω)は、純粋な音声信号のみを含むものではなく、少なからず残留雑音成分を含んでいる。残留雑音成分は、入力信号INのS/Nが悪化するにつれ、より多く含まれることになる。この残留雑音成分が、ミュージカル・ノイズの原因となる。
雑音パワースペクトル推定部13と音声信号パワースペクトル推定部14の出力側には、ミュージカル・ノイズ抑制部15が接続されている。
ミュージカル・ノイズ抑制部15は、音声信号パワースペクトルと雑音信号パワースペクトルの推定値に基づいて、ミュージカル・ノイズ発生の原因となるスペクトルの凹凸を抑制し、圧縮音声信号パワースペクトル|SSn(ω)|を生成するものである。なお、ミュージカル・ノイズ抑制部15の詳細は、後述する。ミュージカル・ノイズ抑制部15の出力側には、雑音減衰係数作成部16が接続されている。
雑音減衰係数作成部16は、ミュージカル・ノイズ抑制部15で生成された圧縮音声信号パワースペクトル|SSn(ω)|と、雑音パワースペクトル推定部13で推定された雑音信号パワースペクトル|Wn(ω)|に基づいて、雑音減衰係数Hn(ω)を生成するものである。この雑音減衰係数Hn(ω)は、次式で算出され、フィルタの伝達関数として、雑音抑圧部17へ与えられるようになっている。
Hn(ω)=|SSn(ω)|/{|SSn(ω)|+|Wn(ω)|
雑音抑圧部17は、雑音減衰係数作成部16から与えられる雑音減衰係数Hn(ω)を、周波数変換部12から出力される入力信号スペクトルXn(ω)に掛け合わせることにより、出力信号スペクトルYn(ω)を生成するものである。出力信号スペクトルYn(ω)は、次式で表される。
Yn(ω)=Hn(ω)Xn(ω)
雑音抑圧部17の出力側には、周波数逆変換部18が接続されている。
周波数逆変換部18は、周波数領域の信号である出力信号スペクトルYn(ω)に逆フーリエ変換を施し、時間領域の出力サンプル信号y(n)を生成してディジタル/アナログ(D/A)変換部19に出力するものである。
D/A変換部19は、ディジタル信号である出力サンプル信号y(n)をアナログの出力信号OUTに変換して出力するものである。
前述したミュージカル・ノイズ抑制部15は、図2に示すように、雑音レベル算出部15a、圧縮閾値作成部15b、圧縮曲線作成部15c、及びスペクトル圧縮部15dで構成されている。
雑音レベル算出部15aは、雑音パワースペクトル推定部13から与えられる雑音信号パワースペクトル|Wn(ω)|の1フレーム毎に、その平均値を算出し、平均雑音レベルとして出力するものである。
圧縮閾値作成部15bは、音声信号パワースペクトル推定部14から出力される音声信号パワースペクトル|Sn(ω)|が、純粋に音声信号と見なせるか、残留雑音と見なせるかを判定するための閾値を生成するものである。圧縮閾値作成部15bでは、この値を雑音レベル算出部15aで算出された平均雑音レベルに乗算し、信号成分判定閾値として出力する。
更に、圧縮閾値作成部15bでは、雑音レベル算出部15aで算出された平均雑音レベルを、予め設定された圧縮率に従って圧縮し、圧縮雑音レベルとして出力するようになっている。なお、圧縮率は、圧縮によって平均雑音レベルを何割低下させるかを指定するパラメータである。
圧縮曲線作成部15cは、圧縮閾値作成部15bで算出された平均雑音レベル、信号成分判定閾値、及び圧縮雑音レベルに基づいて、入出力のレベル変換を行うためのスペクトル圧縮曲線を作成するものである。スペクトル圧縮曲線は、音声信号パワースペクトル|Sn(ω)|の入力レベルに応じて、0〜圧縮雑音レベル、圧縮雑音レベル〜平均雑音レベル、平均雑音レベル〜信号成分判定閾値、及び信号成分判定閾値以上の、4区間に区分されている。
スペクトル圧縮部15dは、圧縮曲線作成部15cで作成されたスペクトル圧縮曲線を用いて音声信号パワースペクトル|Sn(ω)|を圧縮し、圧縮音声信号パワースペクトル|SSn(ω)|を生成するものである。
次に、図1及び図2の雑音抑制装置の動作を説明する。
音声信号に雑音が重畳されたアナログの入力信号INが、A/D変換部11に入力されると、この入力信号INは、例えば12kHzのクロック信号に従って一定周期でサンプリングされる。サンプリングされた入力信号INは、例えば16ビットのディジタル信号x(n)に変換され、周波数変換部12に与えられる。
周波数変換部12において、ディジタル信号x(n)は一定期間(例えば、約21ミリ秒)毎にフレーム化され、各フレームに対して高速フーリエ変換等の周波数変換操作が施される。これにより、ディジタル信号x(n)は、周波数領域の入力信号スペクトルXn(ω)に変換され、雑音パワースペクトル推定部13と音声信号パワースペクトル推定部14に与えられる。
雑音パワースペクトル推定部13において、入力信号スペクトルXn(ω)から入力信号パワースペクトル|Xn(ω)|が算出され、これを時間方向に重み付けをして平均化することにより、雑音信号パワースペクトル|Wn(ω)|が算出される。この平均化に用いる重み関数は、連続して入力されるフレーム間の差分に基づいて決められる。
即ち、フレーム間の差分が大きいときは、音声信号等が存在する可能性が高いので、重み関数を小さくし、フレーム間の差分が小さいときは、音声信号等が存在しない可能性が高いので、重み関数を大きくする。これにより、音声信号等を含まず、時間変動の少ない定常的な雑音成分のみのパワースペクトルに近い値を得ることができる。
音声信号パワースペクトル推定部14では、入力信号スペクトルXn(ω)に基づいて算出した入力信号パワースペクトル|Xn(ω)|から、雑音パワースペクトル推定部13から出力される雑音信号パワースペクトル|Wn(ω)|を差し引くことで、音声信号パワースペクトル|Sn(ω)|が算出される。
但し、入力信号IN、即ち入力信号スペクトルXn(ω)には不規則性の雑音成分が含まれているので、音声信号パワースペクトル|Sn(ω)|は、ミュージカル・ノイズの原因となる残留雑音成分を含んでいる。音声信号パワースペクトル|Sn(ω)|は、ミュージカル・ノイズ抑制部15に与えられる。
ミュージカル・ノイズ抑制部15では、雑音レベル算出部15aにおいて、雑音パワースペクトル推定部13から与えられる雑音信号パワースペクトル|Wn(ω)|の1フレーム毎に、平均雑音レベルが算出される。
圧縮閾値作成部15bでは、音声信号パワースペクトル推定部14から与えられる音声信号パワースペクトル|Sn(ω)|が、純粋に音声信号と見なせるか、残留雑音と見なせるかを判定するための閾値が生成され、この値に平均雑音レベルが乗算されて、信号成分判定閾値が出力される。更に、圧縮閾値作成部15bから、平均雑音レベルを圧縮して出力するレベルを設定するための圧縮雑音レベルが出力される。
図3は、音声信号パワースペクトル推定部14からミュージカル・ノイズ抑制部15に与えられる音声信号パワースペクトルと、ミュージカル・ノイズ抑制部15で算出された圧縮雑音レベルα、平均雑音レベルβ、及び信号成分判定閾値γの関係を示している。
この図3に示すように、ミュージカル・ノイズ抑制前の音声信号パワースペクトルにおいて、低周波領域と高周波領域に存在するスペクトル成分の凹凸の多くは、残留雑音成分である。これらの残留雑音成分は、雑音抑圧後の出力信号に孤立したトーンの「島」を形成し、耳障りなミュージカル・ノイズの原因となる。
圧縮曲線作成部15cでは、圧縮雑音レベルα、平均雑音レベルβ、及び信号成分判定閾値γに基づいて、音声信号パワースペクトルの入出力のレベル変換を行うためのスペクトル圧縮曲線が作成される。
スペクトル圧縮曲線は、図4に一例を示すように、横軸に示す音声信号パワースペクトルの入力レベルに応じて、0〜圧縮雑音レベルα(区間A)、圧縮雑音レベルα〜平均雑音レベルβ(区間B)、平均雑音レベルβ〜信号成分判定閾値γ(区間C)、及び信号成分判定閾値γ以上(区間D)の、4つの区間に区分される。
区間Aは、残留雑音成分が多くを占めていると推定される区間である。入力レベルがこの区間にあるときには、圧縮雑音レベルαを最大値として音声信号パワースペクトルのレベルを持ち上げる。これにより、音声信号パワースペクトルの「谷」の部分を減少させることができる。
区間Bは、区間Aと同様に、残留雑音成分が多くを占めていると推定される区間である。入力レベルがこの区間にあるときには、圧縮雑音レベルαを最小値として音声信号パワースペクトルのレベルを、予め設定した雑音レベルの上限値δまで抑圧する。これにより、音声信号パワースペクトルの「山」の部分を減少させることができる。
これらの区間Aと区間Bの圧縮曲線(直線)により、音声信号パワースペクトルに含まれる残留雑音のレベルを一定の範囲内に押さえ込んで抑制することができる。これにより、ミュージカル・ノイズの大幅な抑制が可能となる。
区間Cは、音声信号成分と残留雑音成分の両方が同程度の割合で存在すると推定される区間である。この区間Cは、圧縮率が高い区間A,Bと、スペクトルの圧縮を全く行わない区間Dとの間をスムーズにつなぎ、音声信号成分の歪みを抑えるようになっている。
即ち、音声信号パワースペクトルのレベルが、平均雑音レベルβから信号成分判定閾値γまでの間にあるときは、音声信号パワースペクトルのレベルが、予め設定した雑音レベルδから信号成分判定閾値γの間でスムーズに上昇するように変換して出力する。
区間Dは、音声信号成分が大多数を占める区間である。この区間ではスペクトルの圧縮を行わず、入力信号のレベルがそのまま出力信号のレベルとなる。区間A,Bにおいて、残留雑音成分のレベルが圧縮されているので、雑音レベルが相対的に低下し、S/Nが向上する。
このように、圧縮曲線作成部15cで生成されたスペクトル圧縮曲線が、スペクトル圧縮部15dに与えられる。スペクトル圧縮部15dでは、圧縮曲線作成部15cから与えられたスペクトル圧縮曲線を用いて、音声信号パワースペクトル|Sn(ω)|の圧縮処理が行われ、図5に示すような、圧縮音声信号パワースペクトル|SSn(ω)|が生成される。圧縮音声信号パワースペクトル|SSn(ω)|は、雑音減衰係数作成部16に与えられる。
雑音減衰係数作成部16において、ミュージカル・ノイズ抑制部15から与えられる圧縮音声信号パワースペクトル|SSn(ω)|と、雑音パワースペクトル推定部13から与えられる雑音信号パワースペクトル|Wn(ω)|に基づいて、雑音減衰係数Hn(ω)が生成される。雑音減衰係数Hn(ω)は、雑音抑圧部17へ与えられる。
雑音抑圧部17において、雑音減衰係数作成部16から与えられる雑音減衰係数Hn(ω)は、周波数変換部12から出力される入力信号スペクトルXn(ω)に掛け合わされ、出力信号スペクトルYn(ω)が生成される。
出力信号スペクトルYn(ω)は、周波数逆変換部18に与えられて逆フーリエ変換が施され、時間領域の出力サンプル信号y(n)が生成される。出力サンプル信号y(n)は、D/A変換部19によってアナログの出力信号OUTに変換されて出力される。
以上詳細に説明したように、本実施形態の雑音抑制装置は、次のような利点がある。
(1) ミュージカル・ノイズ抑制部15の雑音レベル算出部15aにおいて、1フレーム毎に平均雑音レベルを算出し、ミュージカル・ノイズ抑制のための閾値作成に使用している。これにより、S/Nが悪化した状態で雑音が多くなっても、閾値が自動的に調整されるので、一定のミュージカル・ノイズ抑制効果を保つことができる。
(2) 圧縮閾値作成部15bにおいて、音声信号か否かを判定する閾値に平均雑音レベルを乗じて信号成分判定閾値を生成している。これにより、ミュージカル・ノイズ抑制に必要な圧縮雑音レベルαや信号成分判定閾値γを、入力信号のレベルの変化に対応して自動的に制御することができる。
(3) 圧縮曲線作成部15cにおいて、ミュージカル・ノイズ抑制後の雑音レベルを入力信号の雑音レベルを基準として設定するために、スペクトル圧縮曲線を生成している。これにより、雑音除去レベルの調整が容易である。
(4) スペクトル圧縮部15dによる音声信号パワースペクトルの圧縮で、残留雑音成分のスペクトルの凹凸が極端に減少するので、大幅なミュージカル・ノイズ抑制効果が得られる。
(5) ミュージカル・ノイズ抑制部15で生成された圧縮音声信号パワースペクトルにより、出力信号に含まれる雑音レベルを、ミュージカル・ノイズ圧縮後の雑音レベル付近に留めることができる。これにより、S/Nが劣化して音声信号と雑音の判定が困難になった場合でも、雑音除去とミュージカル・ノイズ抑制効果が得られる。
(6) 出力信号中の雑音レベルが一定の範囲内に抑え込まれるので、雑音の振幅変動が少なくなり、聴感上の不快さが低減される。
なお、本発明は、上記実施形態に限定されるものではなく、次のような種々の変形が可能である。
(a) この雑音抑制装置では、ミュージカル・ノイズ抑制部15において、音声信号パワースペクトル推定部14から出力される音声信号パワースペクトルに対してスペクトル圧縮を行っているが、雑音スペクトルや入力信号スペクトル等に対しても、スペクトル圧縮を行うことができる。このような場合には、適用するスペクトルに対して専用の閾値を定義することにより、ミュージカル・ノイズの抑制効果を得ることができる。
(b) 図4のスペクトル圧縮曲線は、4つの区間からなる折れ線で構成されているが、曲線であっても良い。例えば、区間Cで緩和曲線を使用することにより、出力信号における歪みを抑制することができる。
(c) 図1において、周波数変換部12から周波数逆変換部18までの各部は、それぞれ独立したハードウエアによってそれぞれの動作を行っているように説明したが、共通のコンピュータを使用してプログラムによって各部の処理を行うように構成することができる。
(d) サンプリングした信号をフレーム化し、周波数領域でスペクトル操作を行う場合には、ミュージカル・ノイズが発生するおそれがある。従って、本発明は、ミュージカル・ノイズを抑制するために、周波数領域でディジタル処理を行うエコーキャンセラや、ノッチフィルタ(ビートキャンセラ)等の適応型スペクトル操作に適用することができる。
図6は、本発明を任意の適応型スペクトル操作に適用した実施形態を示す図で、図1中の要素と共通の要素には、共通の符号が付されている。
この図6において、適応型スペクトル操作部20は、エコーキャンセラやノッチフィルタ等の適応フィルタにおいて、サンプリングされた周波数領域の入力信号に対し、最適化アルゴリズムに従って伝達関数を自己適応させるための、適応型スペクトル操作を行うものである。この適応型スペクトル操作部20は、図1中の雑音パワースペクトル推定部13と音声信号パワースペクトル推定部14に対応している。
また、ミュージカル・ノイズ抑制部21は、スペクトル操作された入力信号からミュージカル・ノイズを抑制して圧縮スペクトルを生成するもので、その構成及び動作は、図1中のミュージカル・ノイズ抑制部15と同じである。更に、フィルタ伝達関数作成部22は、ミュージカル・ノイズが抑制された圧縮スペクトルに基づいてフィルタ伝達関数を作成するもので、図1中の雑音減衰係数作成部16に対応している。
このように、適応型スペクトル操作部20とフィルタ伝達関数作成部22の間に、ミュージカル・ノイズ抑制部21を挿入することで、入力信号からミュージカル・ノイズが抑制された圧縮スペクトルに基づいて、フィルタ伝達関数が生成される。従って、このフィルタ伝達関数を用いることで、出力信号中のミュージカル・ノイズの発生を抑制することができる。
(e) 雑音パワースペクトル推定部13、音声信号パワースペクトル推定部14、ミュージカル・ノイズ抑制部15、雑音減衰係数作成部16等の処理内容は、実施形態で説明したものに限定されない。例えば、雑音信号パワースペクトルや音声信号パワースペクトルの推定値の算出や、雑音減衰係数の算出に、雑音や音声信号のレベルを2乗したパワーを用いているが、音声信号スペクトルや雑音スペクトル等のレベル自体を使用しても実質的には同一である。
本発明の実施形態を示す雑音抑制装置の構成図である。 図1中のミュージカル・ノイズ抑制部15の構成図である。 音声信号パワースペクトルと、平均雑音レベル、信号成分判定閾値、及び圧縮雑音レベルの関係を示す図である。 スペクトル圧縮曲線の一例を示す図である。 スペクトル圧縮部15dで圧縮された圧縮音声信号パワースペクトルを示す図である。 本発明の他の実施形態を示す雑音抑制装置の構成図である。 特許文献1に記載された雑音抑制装置の構成図である。 図7中の抑圧関数補正部4の構成図である。
符号の説明
11 A/D変換部
12 周波数変換部
13 雑音パワースペクトル推定部
14 音声信号パワースペクトル推定部
15 ミュージカル・ノイズ抑制部
15a 雑音レベル算出部
15b 圧縮閾値作成部
15c 圧縮曲線作成部
15d スペクトル圧縮部
16 雑音減衰係数作成部
17 雑音抑制部
18 周波数逆変換部
19 D/A変換部

Claims (8)

  1. 入力信号を一定周期毎に周波数領域に変換した入力信号スペクトルから雑音信号パワースペクトルを推定する雑音パワースペクトル推定部と、
    前記入力信号スペクトル及び前記雑音信号パワースペクトルから音声信号パワースペクトルを推定する音声信号パワースペクトル推定部と、
    前記雑音信号パワースペクトルに基づいて圧縮雑音レベルを作成し、作成した前記圧縮雑音レベルと前記音声信号パワースペクトルの各周波数におけるスペクトルが音声信号のスペクトルか残留雑音のスペクトルかを判定するための信号成分判定閾値とを出力する圧縮閾値作成部と、前記音声信号パワースペクトルの各周波数におけるスペクトルのうちで、前記圧縮雑音レベルより低いレベルのスペクトルではレベル上昇させ、前記圧縮雑音レベルより高く、前記信号成分判定閾値より低いレベルのスペクトルではレベル低下させ、前記信号成分判定閾値以上のレベルのスペクトルではレベル変更せずに、圧縮音声信号パワースペクトルを生成するスペクトル圧縮部とを有するミュージカル・ノイズ抑制部と、
    前記圧縮音声信号パワースペクトルと前記雑音信号パワースペクトルに基づいて雑音減衰係数を生成する雑音減衰係数作成部と、
    前記入力信号スペクトルに前記雑音減衰係数を乗算して出力信号スペクトルを生成する雑音抑制部と、
    前記出力信号スペクトルを時間領域の出力信号に変換する周波数逆変換部とを、備えることを特徴とする雑音抑制装置。
  2. 前記雑音信号パワースペクトルの各周波数におけるスペクトルのレベルの平均値である平均雑音レベルを算出し、算出した前記平均雑音レベルを出力する雑音レベル算出部を備え、
    前記スペクトル圧縮部は、前記平均雑音レベルと前記信号成分判定閾値とに基づいて、前記レベル上昇または前記レベル低下の程度を調整する、ことを特徴とする請求項1記載の雑音抑制装置。
  3. 入力信号を一定周期毎に周波数領域に変換した入力信号スペクトルから雑音信号パワースペクトルを推定する雑音パワースペクトル推定部と、
    前記入力信号スペクトル及び前記雑音信号パワースペクトルから音声信号パワースペクトルを推定する音声信号パワースペクトル推定部と、
    前記音声信号パワースペクトルの各周波数におけるスペクトルのうちで、前記雑音信号パワースペクトルの各周波数におけるスペクトルのレベルの平均値である平均雑音レベル以下のスペクトルのレベル変動を一定幅以内に圧縮し、圧縮音声信号パワースペクトルを生成するミュージカル・ノイズ抑制部と、
    前記圧縮音声信号パワースペクトルと前記雑音信号パワースペクトルとに基づいて雑音減衰係数を生成する雑音減衰係数作成部と、
    前記入力信号スペクトルに前記雑音減衰係数を乗算して出力信号スペクトルを生成する雑音抑制部と、
    前記出力信号スペクトルを時間領域の出力信号に変換する周波数逆変換部とを、備え、
    前記ミュージカル・ノイズ抑制部は、
    前記平均雑音レベルを算出して、算出した平均雑音レベルを出力する雑音レベル算出部と、
    前記音声信号パワースペクトルの各周波数におけるスペクトルが音声信号のスペクトルか残留雑音のスペクトルかを判定するための信号成分判定閾値と、前記平均雑音レベルを予め設定された圧縮率で圧縮した圧縮雑音レベルを出力する圧縮閾値作成部と、
    前記平均雑音レベル、前記信号成分判定閾値と、前記圧縮雑音レベルに基づいて、前記音声信号パワースペクトルを圧縮して出力するためのスペクトル圧縮曲線を生成する圧縮曲線作成部と、
    前記スペクトル圧縮曲線に従って前記音声信号パワースペクトルを圧縮し、圧縮音声信号パワースペクトルを生成するスペクトル圧縮部とを、有することを特徴とする雑音抑制装置。
  4. 前記スペクトル圧縮曲線は、前記音声信号パワースペクトルのレベルに応じて、0〜圧縮雑音レベル、圧縮雑音レベル〜平均雑音レベル、平均雑音レベル〜信号成分判定閾値、及び信号成分判定閾値以上の、4つの区間に区分された折れ線または曲線で表されることを特徴とする請求項3記載の雑音抑制装置。
  5. 前記スペクトル圧縮部は、
    前記音声信号パワースペクトルの各周波数におけるスペクトルのうちで、前記スペクトルのレベルが、0から前記圧縮雑音レベルまでの間にあるときは、該圧縮雑音レベルを最大値として該スペクトルのレベルを上昇させて出力し、
    記スペクトルのレベルが、前記圧縮雑音レベルから前記平均雑音レベルまでの間にあるときは、該圧縮雑音レベルを最小値として該スペクトルのレベルを予め設定した雑音レベルの上限値まで低下させて出力し、
    記スペクトルのレベルが、前記平均雑音レベルから前記信号成分判定閾値までの間にあるときは、該スペクトルのレベルが前記設定した雑音レベルから該信号成分判定閾値の間でスムーズに上昇するように変換して出力し、
    記スペクトルのレベルが、前記信号成分判定閾値以上のときには、該スペクトルのレベルを変えずに出力する、ことを特徴とする請求項2乃至4のいずれか一項記載の雑音抑制装置。
  6. 前記雑音パワースペクトル推定部は、順次与えられる前記入力信号スペクトルのレベル差に応じた重み関数を用いて該入力信号スペクトルを平均化することによって、前記雑音信号パワースペクトルを算出することを特徴とする請求項1乃至5のいずれか一項記載の雑音抑制装置。
  7. 入力信号を一定周期毎に周波数領域に変換した入力信号スペクトルから雑音信号パワースペクトルを推定する雑音パワースペクトル推定処理と、
    前記入力信号スペクトル及び前記雑音信号パワースペクトルから音声信号パワースペクトルを推定する音声信号パワースペクトル推定処理と、
    前記雑音信号パワースペクトルに基づいて圧縮雑音レベルを作成し、作成した前記圧縮雑音レベルと前記音声信号パワースペクトルの各周波数におけるスペクトルが音声信号のスペクトルか残留雑音のスペクトルかを判定するための信号成分判定閾値とを出力する圧縮閾値作成処理と、前記音声信号パワースペクトルの各周波数におけるスペクトルのうちで、前記圧縮雑音レベルより低いレベルのスペクトルではレベル上昇させ、前記圧縮雑音レベルより高く、前記信号成分判定閾値より低いレベルのスペクトルではレベル低下させ、前記信号成分判定閾値以上のレベルのスペクトルではレベル変更せずに、圧縮音声信号パワースペクトルを生成するスペクトル圧縮処理とを順次行うミュージカル・ノイズ抑制処理と、
    前記圧縮音声信号パワースペクトルと前記雑音信号パワースペクトルに基づいて雑音減衰係数を生成する雑音減衰係数作成処理と、
    前記入力信号スペクトルに前記雑音減衰係数を乗算して出力信号スペクトルを生成する雑音抑制処理と、
    前記出力信号スペクトルを時間領域の出力信号に変換する周波数逆変換処理とを、順次行うことを特徴とする雑音抑制方法。
  8. 入力信号を一定周期毎に周波数領域に変換した入力信号スペクトルから雑音信号パワースペクトルを推定する雑音パワースペクトル推定処理と、
    前記入力信号スペクトル及び前記雑音信号パワースペクトルから音声信号パワースペクトルを推定する音声信号パワースペクトル推定処理と、
    前記音声信号パワースペクトルの各周波数におけるスペクトルのうちで、前記雑音信号パワースペクトルの各周波数におけるスペクトルのレベルの平均値である平均雑音レベル以下のスペクトルのレベル変動を一定幅以内に圧縮し、圧縮音声信号パワースペクトルを生成するミュージカル・ノイズ抑制処理と、
    前記圧縮音声信号パワースペクトルと前記雑音信号パワースペクトルとに基づいて雑音減衰係数を生成する雑音減衰係数作成処理と、
    前記入力信号スペクトルに前記雑音減衰係数を乗算して出力信号スペクトルを生成する雑音抑制処理と、
    前記出力信号スペクトルを時間領域の出力信号に変換する周波数逆変換処理とを、順次行い、
    前記ミュージカル・ノイズ抑制処理では、
    前記平均雑音レベルを算出して、算出した平均雑音レベルを出力する雑音レベル算出処理と、
    前記音声信号パワースペクトルの各周波数におけるスペクトルが音声信号のスペクトルか残留雑音のスペクトルかを判定するための信号成分判定閾値と、前記平均雑音レベルを予め設定された圧縮率で圧縮した圧縮雑音レベルを出力する圧縮閾値作成処理と、
    前記平均雑音レベルと、前記信号成分判定閾値と、前記圧縮雑音レベルとに基づいて、前記音声信号パワースペクトルを圧縮して出力するためのスペクトル圧縮曲線を生成する圧縮曲線作成処理と、
    前記スペクトル圧縮曲線に従って前記音声信号パワースペクトルを圧縮し、圧縮音声信号パワースペクトルを生成するスペクトル圧縮処理とを、順次行うことを特徴とする雑音抑制方法。
JP2008195360A 2008-07-29 2008-07-29 雑音抑制装置、及び雑音抑制方法 Active JP5056654B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008195360A JP5056654B2 (ja) 2008-07-29 2008-07-29 雑音抑制装置、及び雑音抑制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008195360A JP5056654B2 (ja) 2008-07-29 2008-07-29 雑音抑制装置、及び雑音抑制方法

Publications (2)

Publication Number Publication Date
JP2010032802A JP2010032802A (ja) 2010-02-12
JP5056654B2 true JP5056654B2 (ja) 2012-10-24

Family

ID=41737344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008195360A Active JP5056654B2 (ja) 2008-07-29 2008-07-29 雑音抑制装置、及び雑音抑制方法

Country Status (1)

Country Link
JP (1) JP5056654B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102408689B1 (ko) * 2020-07-28 2022-06-14 주식회사 이엠텍 신경망 음성 검출을 이용한 뮤지컬 노이즈 제거 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
JP4423300B2 (ja) * 2004-10-28 2010-03-03 富士通株式会社 雑音抑圧装置
JP2007027897A (ja) * 2005-07-12 2007-02-01 Matsushita Electric Ind Co Ltd 雑音抑圧装置
US8433074B2 (en) * 2005-10-26 2013-04-30 Nec Corporation Echo suppressing method and apparatus

Also Published As

Publication number Publication date
JP2010032802A (ja) 2010-02-12

Similar Documents

Publication Publication Date Title
JP3454206B2 (ja) 雑音抑圧装置及び雑音抑圧方法
US7941315B2 (en) Noise reducer, noise reducing method, and recording medium
US9280986B2 (en) Acoustic signal processing device and acoustic signal processing method
US8391471B2 (en) Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium
JP5245714B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JPWO2006046293A1 (ja) 雑音抑圧装置
JP6135106B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
KR100667852B1 (ko) 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법
JP2014122939A (ja) 音声処理装置および方法、並びにプログラム
JP2009075536A (ja) 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
JP3960834B2 (ja) 音声強調装置及び音声強調方法
JP5526524B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP2008216721A (ja) 雑音抑圧の方法、装置、及びプログラム
JP2020028016A (ja) 残響抑制装置及び補聴器
JP5086442B2 (ja) 雑音抑圧方法及び装置
JP6064370B2 (ja) 雑音抑圧装置、方法及びプログラム
JP5056654B2 (ja) 雑音抑制装置、及び雑音抑制方法
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP2002140100A (ja) 騒音抑圧装置
JP2004020679A (ja) 雑音抑圧装置および雑音抑圧方法
JP5106651B2 (ja) 信号処理装置及び信号処理方法
JP2011180219A (ja) 係数設定装置および雑音抑圧装置
JP2008287046A (ja) 背景雑音補間装置、背景雑音補間方法
KR100931487B1 (ko) 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100922

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110825

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20111012

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120716

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150810

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5056654

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150