JP6059130B2 - 雑音抑圧方法とその装置とプログラム - Google Patents

雑音抑圧方法とその装置とプログラム Download PDF

Info

Publication number
JP6059130B2
JP6059130B2 JP2013252220A JP2013252220A JP6059130B2 JP 6059130 B2 JP6059130 B2 JP 6059130B2 JP 2013252220 A JP2013252220 A JP 2013252220A JP 2013252220 A JP2013252220 A JP 2013252220A JP 6059130 B2 JP6059130 B2 JP 6059130B2
Authority
JP
Japan
Prior art keywords
noise
level
noise suppression
signal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013252220A
Other languages
English (en)
Other versions
JP2015108766A (ja
Inventor
小林 和則
和則 小林
仲 大室
仲 大室
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013252220A priority Critical patent/JP6059130B2/ja
Publication of JP2015108766A publication Critical patent/JP2015108766A/ja
Application granted granted Critical
Publication of JP6059130B2 publication Critical patent/JP6059130B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Noise Elimination (AREA)

Description

本発明は、マイクロホン等で収音した収音信号から雑音成分を抑圧する雑音抑圧方法とその装置とプログラムに関する。
マイクロホンで収音した収音信号には、収音したい対象音声に、収音した環境の環境音が重畳する。例えば、オフィス環境であればエアコンの作動音、屋外であれば雑踏音などが収音したい対象音声に重畳することになる。
そこで、従来から、このような雑音を抑圧する目的で雑音抑圧方法が提案されている。例えば、雑音抑圧装置900が特許文献1に開示されている。図17を参照して雑音抑圧装置900の動作を簡単に説明する。雑音抑圧装置900は、周波数帯域分割部910、信号レベル計算部920、雑音レベル推定部930、雑音抑圧ゲイン計算部940、乗算部950、時間領域変換部960、を具備する。
周波数帯域分割部910は、時間領域の収音信号を短時間フーリエ変換によって周波数帯域に分割した周波数領域収音信号に変換する。信号レベル計算部920は、周波数領域収音信号から周波数ごとの信号レベルを計算する。雑音レベル推定部930は、周波数領域収音信号から周波数ごとの雑音レベルを推定する。
雑音抑圧ゲイン計算部940は、信号レベルと雑音レベルから、周波数ごとに雑音を抑圧するためのゲインを計算する。乗算部950は、周波数領域収音信号に雑音を抑圧するためのゲインを乗じる。時間領域変換部960は、雑音が抑圧された周波数領域収音信号を逆フーリエ変換によって時間領域の雑音抑圧信号に変換する。
特開平9−258792号公報
しかし、従来の雑音抑圧装置900では、交通騒音や雑踏の騒音や車の走行音のように雑音のレベルが時間変化する場合に、雑音抑圧性能が著しく低下したり、雑音抑圧後の音質が不自然になる課題がある。
本発明は、この課題に鑑みてなされたものであり、雑音に時間変化があっても、雑音抑圧量の低下が無く、雑音抑圧後の音質が不自然とならない雑音抑圧方法と、その装置とプログラムを提供することを目的とする。
本発明の雑音抑圧方法は、周波数帯域分割過程と、信号レベル計算過程と、雑音レベル推定過程と、雑音区間検出過程と、雑音レベル変動量推定過程と、雑音抑圧ゲイン計算過程と、乗算過程と、時間領域変換過程と、を備える。周波数帯域分割過程は、収音信号を周波数領域の周波数領域収音信号に変換する。信号レベル計算過程は、周波数領域収音信号の大きさを求め、その大きさを平滑化した収音信号レベルを計算する。雑音レベル推定過程は、周波数領域収音信号から周波数ごとに推定した雑音信号の大きさを雑音レベルとして推定する。雑音区間検出過程は、収音信号レベルと雑音レベルとを比較し、全ての周波数を総合して雑音区間を検出する。雑音レベル変動量推定過程は、雑音区間における収音信号レベルと雑音レベルとから、周波数ごとの雑音レベルの変動量である雑音レベル変動量を推定する。雑音抑圧ゲイン計算過程は、収音信号レベルと雑音レベルと雑音レベル変動量とを入力として、雑音を抑圧する雑音抑圧ゲインを計算する。乗算過程は、周波数領域収音信号に雑音抑圧ゲインを乗じた雑音抑圧信号を出力する。時間領域変換過程は、雑音抑圧信号を時間領域の雑音抑圧信号に変換する。
本発明の雑音抑圧方法によれば、雑音レベル変動量推定部が雑音の変動を推定し、雑音抑圧ゲイン計算部が雑音レベルの変動を考慮して雑音抑圧ゲインを計算する。したがって、雑音の変動があっても適切なゲイン設定を行うことができ、雑音の変動がある場合でも、雑音抑圧量の低下がなく、抑圧後の雑音の音質が不自然とならない効果を奏する。
概念的な収音信号を示す図。 本発明の雑音抑圧装置100の機能構成例を示す図。 雑音抑圧装置100の動作フローを示す図。 雑音レベル推定部930の機能構成を示す図。 雑音区間検出部40の機能構成例を示す図。 雑音レベル変動量推定部50の機能構成例を示す図。 雑音抑圧ゲイン計算部60の機能構成例を示す図。 本発明の雑音抑圧装置200の機能構成例を示す図。 雑音抑圧ゲイン計算部260の機能構成例を示す図。 雑音抑圧ゲイン計算部260の動作フローを示す図。 雑音抑圧ゲイン計算部360の機能構成例を示す図。 雑音抑圧ゲイン計算部360の動作フローを示す図。 雑音レベル変動量推定部450の機能構成例を示す図。 雑音レベル変動量推定部450の動作フローを示す図。 雑音抑圧ゲイン計算部560の機能構成例を示す図。 雑音抑圧ゲイン計算部560の動作フローを示す図 従来の雑音抑圧装置900の機能構成を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。実施例の説明の前に、この発明の考えについて説明する。
〔この発明の考え〕
マイクロホンで収音した収音信号には、収音したい対象音声に、屋内であればエアコンの作動音のような一定の大きさの定常雑音と、コピー機の作動音のような時間的に変化する非定常雑音とが重畳する。屋外であれば例えば雑踏音のような一定の雑音に、車の走行音などの非定常雑音が、収音したい対象音声に重畳する。
図1に、収音信号の概念的な図を示す。横方向は時間経過を、縦方向は収音信号の振幅を表す。図1Aは、対象音声と定常雑音と非定常雑音とが重畳した図である。例えば、振幅の最も大きな信号が収音したい対象音声であり、最も振幅の小さな信号が一定の大きさの定常雑音、中間の振幅の信号が非定常雑音を表す。なお、図1中の各信号の波形は、実際の音声を模擬したものではない。
この発明の雑音抑圧装置100は、雑音区間検出部40と雑音変動量推定部50を備える点で新しい。雑音区間検出部40は、対象音声と非定常雑音の周波数スペクトルの違いや大きさの違いに着目して雑音区間を検出する。雑音変動量推定部50は、雑音区間内で収音信号レベルと雑音レベルを比較して雑音レベル変動量を求める。そして、その雑音レベル変動量を考慮して収音信号から雑音を除去する。
図1Bに、雑音抑圧装置100で雑音を除去した収音信号の概念的な図を示す。図1Bに示すように非定常雑音も除去されている様子が分かる。このように、この発明の雑音抑圧方法は、雑音区間を検出してその区間の雑音レベルの変動量を求め、その雑音レベルの変動量を収音信号から除去する考えである。
図2に、この発明の雑音抑圧装置100の機能構成例を示す。その動作フローを図3に示す。雑音抑圧装置100は、周波数帯域分割部910と、信号レベル計算部920と、雑音レベル推定部930と、雑音区間検出部40と、雑音レベル変動量推定部50と、雑音抑圧ゲイン計算部60と、雑音抑圧ゲイン乗算部970と、時間領域変換部980と、を具備する。雑音抑圧装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。以降説明する各装置も同じである。
なお、参照符号から明らかなように、周波数帯域分割部910と信号レベル計算部920と雑音レベル推定部930と雑音抑圧ゲイン乗算部970と時間領域変換部980とは、従来の雑音抑圧装置900と同じものである。
周波数帯域分割部910は、時間領域の収音信号y(t)を周波数領域の周波数領域収音信号X(ω,n)に変換する(ステップS910)。収音信号は、例えばサンプリング周波数8kHzで離散値化されたディジタル信号である。図2において、収音信号をディジタル化するA/D変換器や、ディジタル信号を連続値化するD/A変換器の表記は省略している。周波数帯域分割部910は、離散値化した収音信号を、短時間フーリエ変換によって例えば128個集めたフレーム単位(t=16ms)の間隔、ウィンドウサイズ32msで周波数領域収音信号に変換する。ウィンドウはハニングウィンドウの平方根を取ったものなどを用いる。
信号レベル計算部920は、周波数帯域分割部910が出力する周波数領域収音信号の大きさを求める。大きさとは、周波数領域収音信号をX(ω,n)とした時に、その絶対値である|X(ω,n)|を計算する。又は、そのパワーである|X(ω,n)|を計算する。ωは周波数を表し、nはフレーム番号を表す。大きさとはレベルと称しても良い値である。
そして、信号レベル計算部920は、絶対値若しくはパワーで表される周波数領域収音信号のレベルを時間平滑化した収音信号レベルY(ω,n)を計算する(式(1))。式(1)のαは平滑化係数であり、0以上1未満の値を取る。1に近いほど長い時間での平滑化が行われる(ステップS920)。
Figure 0006059130
雑音レベル推定部930は、周波数帯域分割部910が出力する周波数領域収音信号X(ω,n)を入力として、当該周波数領域収音信号X(ω,n)から周波数ごとに推定した雑音信号の大きさである雑音レベルを推定する(ステップS930)。図4に、雑音レベル推定部930のより具体的な機能構成例を示す。雑音レベル推定部930は、レベル計算手段931と、時間平滑手段932と、ディップホールド手段933と、を備える。
レベル計算手段931と時間平滑手段932は、信号レベル計算部920と同様の処理を行い周波数領域収音信号のレベルを求める。レベルとは、上記したようにその絶対値である|X(ω,n)|であっても良いし、そのパワーである|X(ω,n)|で有っても良い。但し、信号レベル計算部920との間で一致している必要はある。
時間平滑手段932は、周波数領域収音信号のレベルを時間平滑化した収音信号レベルZ(ω,n)を計算する(式(2))。式(2)のβは平滑化係数であり、0以上1未満の値を取る。1に近いほど長い時間での平滑化が行われる。
Figure 0006059130
ディップホールド手段933は、時間平滑後の周波数領域収音信号のレベルZ(ω,n)に対して、例えば式(3)に示す最小値を保持するディップホールド処理を行う。
Figure 0006059130
1フレーム前の推定ノイズレベルN(ω,n−1)が、時間平滑化したレベルZ(ω,n)よりも大きい場合は、推定する雑音レベルN(ω,n)に時間平滑化したレベルZ(ω,n)を代入し、それ以外の場合は、1フレーム前の雑音レベルN(ω,n−1)に1以上の定数uを乗じて僅かにノイズレベルを上昇させる。定数uは予め設定しておく。uは雑音レベルの上昇係数であり、1に近いほど穏やかなノイズレベルの上昇となる。
雑音区間検出部40は、収音信号レベルY(ω,n)と雑音レベルN(ω,n)を比較し、全ての周波数を総合して雑音区間を検出する。図5に、雑音区間検出部40のより具体的な機能構成例を示す。雑音区間検出部40は、乗算手段41と、比較手段42と、カウント手段43と、閾値比較手段44と、を備える。
乗算手段41は、予め設定された1以上の固定係数を、雑音レベルN(ω,n)に乗じる。比較手段42は、乗算手段41の出力信号と収音信号レベルを、周波数ごとに比較し、収音信号レベルの方が大きい場合に1を出力する。
カウント手段43は、比較手段42の出力信号をカウントし、いくつの周波数成分で収音信号レベルの方が大きかったかを出力する。閾値比較手段44は、予め設定した雑音区間検出の閾値とカウント手段43の出力するカウント数を比較し、カウント数の方が小さい場合を、雑音区間として検出する。カウント数が小さい場合とは、変動する雑音の周波数帯域が収音対象の音声と比較して狭いこと、若しくは変動する雑音のレベルが音声と比較して小さいことを意味する。つまり、収音対象の音声に対して、変動する雑音は、周波数帯域が限定されていたり、レベルが小さい場合が多いので、その違いに着目してフレーム単位で雑音区間を検出する。
雑音レベル変動量推定部50は、雑音区間における収音信号レベルY(ω,n)と雑音レベルN(ω,n)とから、周波数ごとの雑音レベルの変動量である雑音レベル変動量R(ω,n)を推定する。具体的には、雑音区間において収音信号レベルY(ω,n)を雑音レベルN(ω,n)で除した比rを計算し、当該比rを時間平滑化した雑音レベル変動量R(ω,n)を推定する。
図6に、雑音レベル変動量推定部50のより具体的な機能構成例を示す。 雑音レベル変動量推定部50は、除算手段51と、フロアリング手段52と、平滑化手段53と、を備える。
除算手段51は、雑音区間の間においてのみ収音信号レベルY(ω,n)を雑音レベルN(ω,n)で除した比r(ω,n)を計算する(式(4))。
Figure 0006059130
フロアリング手段52では、1.0以下の比r(ω,n)を1.0に置き換える。収音信号レベルY(ω,n)はノイズの成分も含んだレベルであるので、ノイズレベルN(ω,n)よりも大きくなくてはならない。よって、フロアリング手段52は、1.0以下の比r(ω,n)をエラーと判定してr=1.0に置き換える処理を行う。
平滑化手段53は、フロアリング手段52の出力信号を次式で平滑化する。
Figure 0006059130
1フレーム前の雑音レベル変動量R(ω,n−1)が、収音信号レベルと雑音レベルの比r(ω,n)よりも大きい場合は、係数aを用い、それ以外の場合は係数bを用いて雑音レベル変動量R(ω,n)を時間平滑化する。a=bとして平滑化しても良いが、b<aとすることで、雑音レベル変動量R(ω,n)が上昇する時に素早い平滑化を行うことができ、雑音レベルの変動値のピーク付近の値を求めることができる。
雑音抑圧ゲイン計算部60は、収音信号レベルY(ω,n)と雑音レベルN(ω,n)と雑音レベル変動量R(ω,n)とを入力として、雑音を抑圧する雑音抑圧ゲインG(ω,n)を計算する。図7に、雑音抑圧ゲイン計算部60のより具体的な機能構成例を示す。雑音抑圧ゲイン計算部60は、雑音レベル変動量乗算手段61と、マージン乗算手段62と、減算手段63と、除算手段64と、最小値制限手段65と、時間平滑化手段66と、を備える。
雑音レベル変動量乗算手段61は、雑音レベルN(ω,n)に雑音レベル変動量R(ω,n)を周波数ごとに乗算する。マージン乗算手段62は、雑音レベル変動量乗算手段61の出力信号に、予め設定されたマージン係数cを乗じて雑音の変動量を考慮した雑音変動レベルN′(ω,n)を出力する。
減算手段63は、収音信号レベルY(ω,n)から雑音変動レベルN′(ω,n)を減算して推定音声レベルS(ω,n)を出力する。除算手段64は、推定音声レベルS(ω,n)を収音信号レベルY(ω,n)で除算して雑音抑圧ゲインの瞬時値g(ω,n)求める。
最小値制限手段65は、予め設定された最小値d以下の雑音抑圧ゲインの瞬時値g(ω,n)を、最小値dに置き換える。時間平滑化手段66は、雑音抑圧ゲインの瞬時値g(ω,n)を時間平滑化した雑音抑圧ゲインG(ω,n)を出力する。
最小値dは、最大雑音抑圧量を決定する定数であり、0〜1の間に設定される。0に近いほど最大雑音抑圧量が高くなる。時間平滑化は、例えば次式に示すように行われる。
Figure 0006059130
1フレーム前の雑音抑圧ゲインG(ω,n−1)が、雑音抑圧ゲインの瞬時値g(ω,n)よりも大きい場合は係数pを、それ以外の場合は係数qを用いて雑音抑圧ゲインの瞬時値を時間平滑化する。係数pとqの値は、聴感上の音質が良好な値に予め設定しておく。
このようにして求められた雑音抑圧ゲインG(ω,n)は、周波数収音信号X(ω,n)のスペクトル形状を、推定音声レベルS(ω,n)の形状に変形するものであり、雑音を抑圧することができる。
ゲイン乗算部970は、周波数領域収音信号X(ω,n)に雑音抑圧ゲインG(ω,n)を乗じた雑音抑圧信号を出力する。時間領域変換部980は、周波数帯域分割部910と同じ周波数間隔の同じ点数で、雑音抑圧信号を逆フーリエ変換し、その値にウィンドウを乗算してオーバラップ加算して時間領域の雑音抑圧信号u(t)に変換する。
以上説明した周波数帯域分割部910が行う周波数帯域分割過程(ステップS910)から、時間領域変換部980が行う時間領域変換過程(ステップS980)の各過程の処理(図3)は、フレームを更新しながら動作を停止するまで繰り返される(ステップS90のNo)。この繰り返し処理の制御は制御部90が行う。制御部90は、雑音抑圧装置100の時系列動作を制御するものであり、この発明の特別な技術的特徴ではない。
雑音抑圧装置100では、雑音レベル変動量R(ω,n)を推定し、当該値を雑音レベルN(ω,n)に乗じることで変動する雑音量を考慮した雑音レベルN′(ω,n)を求めている。この変動する雑音量を考慮した雑音レベルN′(ω,n)を用いて雑音抑圧を行うことで、変動する雑音に対しても雑音抑圧量の低下がなく、雑音抑圧後の音声の音質が不自然にならない効果を奏する。
図8に、この発明の雑音抑圧装置200の機能構成例を示す。雑音抑圧装置200は、雑音抑圧装置100(図2)に対して、雑音区間も入力信号とする雑音抑圧ゲイン計算部260を備える点で異なる。
図9に、雑音抑圧ゲイン計算部260のより具体的な機能構成例を示す。雑音抑圧ゲイン計算部260は、雑音抑圧ゲイン計算部60(図7)に対してマージン乗算手段62に与えるマージン係数を雑音区間で切り替えるマージン係数切替手段266を、備える点でのみ異なる。
図10に、雑音抑圧ゲイン計算部260の動作フローを示す。雑音抑圧ゲイン計算部260が処理する雑音抑圧ゲイン計算過程(ステップS60)は、上記した雑音抑圧ゲイン計算部60の動作フローに、マージン係数切替手段266が、雑音レベル変動量乗算手段61の出力信号に乗算するマージン係数を、雑音区間検出部40が雑音区間を検出している間に切り替えるマージン係数切替ステップ(ステップS266)を含む点のみが異なる。
マージン係数切替手段266は、雑音区間検出部40が雑音区間を検出している場合に、マージン係数2を選択し、それ以外の場合はマージン係数1を選択してマージン乗算手段62に入力する。雑音区間で用いられるマージン係数2をマージン係数1に対して大きく設定しておくことで、雑音区間の雑音抑圧量を高めることができる。音声区間で用いられるマージン係数1は、マージン係数2よりも小さな値であるので、音声区間の音質劣化を防止することができる。
以上説明した雑音抑圧装置200は、雑音抑圧装置100の奏する効果に加えて、雑音区間の雑音抑圧性能を向上させ、音声区間の音質を向上させることができる。
図11に、この発明の雑音抑圧ゲイン計算部360の機能構成例を示す。その動作フローを図12に示す。雑音抑圧ゲイン計算部360は、雑音抑圧ゲイン計算部60に対して、更に、マスキングレベル計算手段367と、最大値選択手段368と、を備える点で異なる。雑音抑圧ゲイン計算部360は、雑音抑圧ゲイン計算部60又は雑音抑圧ゲイン計算部260と、置き換えることが可能である。
マスキングレベル計算手段367は、減算手段62が出力する推定音声レベルS(ω,n)から、聴覚マスキングレベルQ(ω,n)を求める(ステップS367)。聴覚マスキングとは、周波数KのパワーがP(K)であった場合に、P(K)の関数として計算できる聴覚マスキングレベルを下回る音の成分は、人間の聴覚では聞き取れないという現象である。
聴覚マスキングレベルQ(ω,n)は、例えばつぎのようにして求めることができる。ある周波数ωの聴覚マスキングレベルQ(ω,n)を求めるには、その周波数ωの推定音声レベルS(ω,n)と、その1つ下の周波数の仮の聴覚マスキングレベルQ′(ω−1,n)に、それぞれ係数v,wを乗じた値を比較し、大きい値を仮の聴覚マスキングレベルQ′(ω,n)とする(式(7),(8))。
この処理を、周波数ωの最小値から順に、ω=最大値になるまで繰り返し実施する。係数v,wは聴覚マスキングの特性に基づいて予め設定される1未満、0以上の定数である。なお、係数v,wは周波数ωに応じて異なる値に設定しても良い。
Figure 0006059130
周波数ω=最大値になると、周波数ωの最大値から順に、その周波数ωの仮の聴覚マスキングレベルQ′(ω,n)と、1つ上の周波数の仮の聴覚マスキングレベルQ′(ω+1,n)に係数mを乗じた値を比較し、大きい値を聴覚マスキングレベルQ(ω,n)とする(式(9),(10))。係数mは、聴覚マスキングの特性に基づいて予め設定される1未満0以上の定数である。また、係数mは上記した係数v,wと同様に周波数ωに応じて異なる値に設定しても良い。
Figure 0006059130
以上の方法により聴覚マスキングレベルQ(ω,n)を求めることができる。
最大値選択手段368は、減算手段62が出力する推定音声レベルS(ω,n)と、聴覚マスキングレベルQ(ω,t)を比較し、大きい方の値を、新たな推定音声レベルS(ω,n)として除算手段63に出力する(ステップS368)。
以上説明した雑音抑圧ゲイン計算部360を備える雑音抑圧装置は、聴覚マスキング特性を利用して聴感上聞こえない雑音成分を抑圧しないようにすることができる。したがって、雑音の不要な抑圧をしないようにすることができ、音声の劣化を少なくする効果を奏する。
図13に、この発明の雑音レベル変動量推定部450の機能構成例を示す。その動作フローを図14に示す。雑音レベル変動量推定部450は、雑音レベル変動量推定部50が備えるフロアリング手段52をヒストグラム計算手段454に、また、その平滑化手段53を変動量決定手段455に、置き換えたものである。雑音レベル変動量推定部450は、雑音レベル変動量推定部50(図2,図8)と、置き換えることが可能である。
ヒストグラム計算手段454は、除算手段51が出力する比r(ω,n)のヒストグラムを計算する(ステップS454)。変動量決定手段455は、ヒストグラム計算手段454の出力から、ヒストグラムの累積値が、予め設定した割合z%となる値を求め、雑音レベル変動量として出力する(ステップS455)。
以上説明した雑音レベル変動量推定部450を備える雑音抑圧装置は、ヒストグラムを求めて雑音レベルの変動量を求めるので、より正確に雑音レベルの変動量を求めることができる。その結果、雑音抑圧性能と音質の向上を図ることができる。
図15に、この発明の雑音抑圧ゲイン計算部560の機能構成例を示す。その動作フローを図16に示す。雑音抑圧ゲイン計算部560は、雑音抑圧ゲイン計算部60に対して、更に、雑音検出手段568と、最小値保持手段569と、を備える点で異なる。雑音抑圧ゲイン計算部560は、雑音抑圧ゲイン計算部60又は雑音抑圧ゲイン計算部260又は雑音抑圧ゲイン計算部360と、置き換えることが可能である。
雑音検出手段568は、除算手段63の出力する雑音抑圧ゲインの瞬時値g(ω,n)が、予め設定した閾値を超える周波数の割合を計算し、その割合が当該閾値以下の場合に雑音として検出する(ステップS568)。雑音検出手段568が雑音を検出した場合(ステップS568、検出)、最小値保持手段569は保持している最小値dを、時間平滑化手段65に出力する。雑音検出手段568が雑音を検出しない場合(ステップS568、非検出)、最小値制限手段64は、予め設定された最小値d以下の雑音抑圧ゲインの瞬時値g(ω,n)を、最小値dに置き換えた雑音抑圧ゲインの瞬時値g(ω,n)を、時間平滑化手段65に出力する。
以上のように動作する雑音抑圧ゲイン計算部560を備えた雑音抑圧装置は、雑音区間で安定した雑音抑圧を行うことが可能となり、高い雑音抑圧量と雑音抑圧後の音質を自然にすることができる。
以上説明した本発明の雑音抑圧装置は、雑音の変動を推定し、雑音の変動を考慮して雑音抑圧ゲインを求める技術的特徴を有する。この技術的特徴によって、雑音の変動が有っても適切な雑音抑圧ゲインの設定を行うことができ、雑音の変動がある場合でも雑音抑圧量の低下がなく、雑音抑圧後の音声の音質を自然なものにする効果を奏する。
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (8)

  1. 周波数帯域分割部が、収音信号を周波数領域の周波数領域収音信号に変換する周波数帯域分割過程と、
    信号レベル計算部が、上記周波数領域収音信号の大きさを求め、その大きさを平滑化した収音信号レベルを計算する信号レベル計算過程と、
    雑音レベル推定部が、上記周波数領域収音信号から周波数ごとに推定した雑音信号の大きさを雑音レベルとして推定する雑音レベル推定過程と、
    雑音区間検出部が、上記収音信号レベルと上記雑音レベルとを比較し、全ての周波数を総合して雑音区間を検出する雑音区間検出過程と、
    雑音レベル変動量推定部が、上記雑音区間における上記収音信号レベルと上記雑音レベルとの比から、周波数ごとの上記雑音レベルの時間的な変動量である雑音レベル変動量を推定する雑音レベル変動量推定過程と、
    雑音抑圧ゲイン計算部が、上記収音信号レベルと上記雑音レベルと上記雑音レベル変動量とを入力として、雑音を抑圧する雑音抑圧ゲインを計算する雑音抑圧ゲイン計算過程と、
    雑音抑圧ゲイン乗算部が、上記周波数領域収音信号に上記雑音抑圧ゲインを乗じた雑音抑圧信号を出力する雑音抑圧ゲイン乗算過程と、
    時間領域変換部が、上記雑音抑圧信号を時間領域の雑音抑圧信号に変換する時間領域変換過程と、
    を備える雑音抑圧方法。
  2. 請求項1に記載した雑音抑圧方法において
    上記雑音抑圧ゲイン計算過程は、
    雑音レベル変動量乗算手段が、上記雑音レベルに上記雑音レベル変動量を乗じる雑音レベル変動量乗算ステップと、
    マージン係数切替手段が、上記雑音区間検出部が上記雑音区間を検出している間はマージン係数2を選択し、上記雑音区間を検出しない間は上記マージン係数2よりも小さなマージン係数1を選択してマージン乗算手段に入力するマージン係数切替ステップと、
    マージン乗算手段が、上記マージン係数切替手段が選択したマージン係数を、上記雑音レベル変動量乗算手段の出力信号に乗じるマージン乗算ステップと、
    減算手段が、上記収音信号レベルから、上記マージン乗算手段の出力信号を減じた推定音声レベルを出力する減算ステップと、
    除算手段が、上記推定音声レベルを上記収音信号レベルで除算した雑音抑圧ゲインの瞬時値を求める除算ステップと、
    最小値制限手段が、上記雑音抑圧ゲインの瞬時値のうち、予め設定した最小値以下の値を当該最小値に置き換える最小値制限ステップと、
    時間平滑化手段が、上記最小値制限手段の出力信号を時間平滑化する時間平滑化ステップと、
    を含むことを特徴とする雑音抑圧方法。
  3. 請求項2に記載した雑音抑圧方法において、
    上記雑音抑圧ゲイン計算過程は、
    更に、
    マスキングレベル計算手段が、上記推定音声レベルから聴覚マスキングレベルを計算して求めるマスキングレベル計算ステップと、
    最大値選択手段が、上記推定音声レベルと、上記聴覚マスキングレベルとを比較し、大きい方の値を新たな推定音声レベルとして上記除算手段に出力する最大値選択ステップと、
    を含むことを特徴とする雑音抑圧方法。
  4. 請求項1乃至3の何れかに記載した雑音抑圧方法において、
    上記雑音レベル変動量推定過程は、
    除算手段が、上記雑音区間内でのみ上記収音信号レベルを上記雑音レベルで除算した比を計算する除算ステップと、
    ヒストグラム計算手段が、上記比のヒストグラムを計算するヒストグラム計算ステップと、
    変動量決定手段が、上記ヒストグラム計算ステップで計算したヒストグラムの累積値の値が、予め設定した割合となる値を上記雑音レベル変動量として出力する変動量決定ステップと、
    を含むことを特徴とする雑音抑圧方法。
  5. 請求項2又は3に記載した雑音抑圧方法において、
    上記雑音抑圧ゲイン計算過程は、
    更に、
    雑音検出手段が、上記除算手段の出力する雑音抑圧ゲインの瞬時値が、予め設定した閾値を超える周波数の割合を計算し、当該割合が予め設定した閾値以下の場合を雑音として検出する雑音検出ステップと、
    最小値保持手段が、上記雑音検出手段が雑音を検出した時に、上記時間平滑化手段に出力する雑音抑圧ゲインの瞬時値を最小値にする最小値保持ステップと、
    を含むことを特徴とする雑音抑圧方法。
  6. 収音信号を周波数領域の周波数領域収音信号に変換する周波数帯域分割部と、
    上記周波数領域収音信号の大きさを求め、その大きさを平滑化した収音信号レベルを計算する信号レベル計算部と、
    上記周波数領域収音信号から周波数ごとに推定した雑音信号の大きさを雑音レベルとして推定する雑音レベル推定部と、
    上記収音信号レベルと上記雑音レベルとを比較し、全ての周波数を総合して雑音区間を検出する雑音区間検出部と、
    上記雑音区間における上記収音信号レベルと上記雑音レベルとの比から、周波数ごとの上記雑音レベルの時間的な変動量である雑音レベル変動量を推定する雑音レベル変動量推定部と、
    上記収音信号レベルと上記雑音レベルと上記雑音レベル変動量とを入力として、雑音を抑圧する雑音抑圧ゲインを計算する雑音抑圧ゲイン計算部と、
    上記周波数領域収音信号に上記雑音抑圧ゲインを乗じた雑音抑圧信号を出力する雑音抑圧ゲイン乗算部と、
    上記雑音抑圧信号を時間領域の雑音抑圧信号に変換する時間領域変換部と、
    を具備する雑音抑圧装置。
  7. 請求項6に記載した雑音抑圧装置において
    上記雑音抑圧ゲイン計算部は、
    上記雑音レベルに上記雑音レベル変動量を乗じる雑音レベル変動量乗算手段と、
    上記雑音区間検出部が上記雑音区間を検出している間はマージン係数2を選択し、上記雑音区間を検出しない間は上記マージン係数2よりも小さなマージン係数1を選択してマージン乗算手段に入力するマージン係数切替手段と、
    上記マージン係数切替手段が選択したマージン係数を、上記雑音レベル変動量乗算手段の出力信号に乗じるマージン乗算手段と、
    上記収音信号レベルから、上記マージン乗算手段の出力信号を減じた推定音声レベルを出力する減算手段と、
    上記推定音声レベルを上記収音信号レベルで除算した雑音抑圧ゲインの瞬時値を求める除算手段と、
    上記雑音抑圧ゲインの瞬時値のうち、予め設定した最小値以下の値を当該最小値に置き換える最小値制限手段と、
    上記最小値制限手段の出力信号を時間平滑化する時間平滑化手段と、
    を備えることを特徴とする雑音抑圧装置。
  8. 請求項1乃至5の何れかに記載した雑音抑圧方法の各過程を、コンピュータに実行させるプログラム。
JP2013252220A 2013-12-05 2013-12-05 雑音抑圧方法とその装置とプログラム Active JP6059130B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013252220A JP6059130B2 (ja) 2013-12-05 2013-12-05 雑音抑圧方法とその装置とプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013252220A JP6059130B2 (ja) 2013-12-05 2013-12-05 雑音抑圧方法とその装置とプログラム

Publications (2)

Publication Number Publication Date
JP2015108766A JP2015108766A (ja) 2015-06-11
JP6059130B2 true JP6059130B2 (ja) 2017-01-11

Family

ID=53439148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013252220A Active JP6059130B2 (ja) 2013-12-05 2013-12-05 雑音抑圧方法とその装置とプログラム

Country Status (1)

Country Link
JP (1) JP6059130B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018116944A1 (ja) * 2016-12-20 2018-06-28 三菱電機株式会社 音声ノイズ検出装置、デジタル放送受信装置、及び音声ノイズ検出方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3588030B2 (ja) * 2000-03-16 2004-11-10 三菱電機株式会社 音声区間判定装置及び音声区間判定方法
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP2005258158A (ja) * 2004-03-12 2005-09-22 Advanced Telecommunication Research Institute International ノイズ除去装置
EP1845520A4 (en) * 2005-02-02 2011-08-10 Fujitsu Ltd SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE
JP5738020B2 (ja) * 2010-03-11 2015-06-17 本田技研工業株式会社 音声認識装置及び音声認識方法

Also Published As

Publication number Publication date
JP2015108766A (ja) 2015-06-11

Similar Documents

Publication Publication Date Title
JP6328627B2 (ja) 雑音検出及びラウドネス低下検出によるラウドネスコントロール
JP6136995B2 (ja) 雑音低減装置
KR100414841B1 (ko) 잡음저감방법및장치
JP5071346B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP5875609B2 (ja) 雑音抑圧装置
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
EP3276621B1 (en) Noise suppression device and noise suppressing method
JPH07306695A (ja) 音声信号の雑音低減方法及び雑音区間検出方法
JP6174856B2 (ja) 雑音抑制装置、その制御方法、及びプログラム
JP6339896B2 (ja) 雑音抑圧装置および雑音抑圧方法
JP5752324B2 (ja) 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制
JP2009075536A (ja) 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
JP6087762B2 (ja) 残響抑圧装置とその方法と、プログラムとその記録媒体
KR20150032390A (ko) 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
JP2014513320A (ja) オーディオ信号におけるドミナント周波数を減衰する方法及び装置
US9002030B2 (en) System and method for performing voice activity detection
JP6059130B2 (ja) 雑音抑圧方法とその装置とプログラム
JP5815435B2 (ja) 音源位置判定装置、音源位置判定方法、プログラム
CN116057628A (zh) 用于语音和音乐录音的嗡嗡噪声检测和去除
JP5815614B2 (ja) 残響抑圧装置とその方法と、プログラムとその記録媒体
JP6447357B2 (ja) オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
US10109291B2 (en) Noise suppression device, noise suppression method, and computer program product
JP6064774B2 (ja) 雑音除去装置、雑音除去方法、及び雑音除去プログラム
JP6677110B2 (ja) 音声信号処理装置及び音声信号処理プログラム
JP6567456B2 (ja) レベル差補正装置、レベル差補正プログラム、および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160426

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161208

R150 Certificate of patent or registration of utility model

Ref document number: 6059130

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150