JP2011257643A - 雑音抑圧装置およびプログラム - Google Patents

雑音抑圧装置およびプログラム Download PDF

Info

Publication number
JP2011257643A
JP2011257643A JP2010133098A JP2010133098A JP2011257643A JP 2011257643 A JP2011257643 A JP 2011257643A JP 2010133098 A JP2010133098 A JP 2010133098A JP 2010133098 A JP2010133098 A JP 2010133098A JP 2011257643 A JP2011257643 A JP 2011257643A
Authority
JP
Japan
Prior art keywords
noise
spectrum
speech
coefficient
frequency spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010133098A
Other languages
English (en)
Other versions
JP5588233B2 (ja
Inventor
Nobumasa Seiyama
信正 清山
Toru Tsugi
徹 都木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
NHK Engineering System Inc
Original Assignee
Nippon Hoso Kyokai NHK
NHK Engineering Services Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, NHK Engineering Services Inc filed Critical Nippon Hoso Kyokai NHK
Priority to JP2010133098A priority Critical patent/JP5588233B2/ja
Publication of JP2011257643A publication Critical patent/JP2011257643A/ja
Application granted granted Critical
Publication of JP5588233B2 publication Critical patent/JP5588233B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供する。
【解決手段】雑音混入音声y(t)を入力として、スペクトルサブトラクションにより雑音抑圧音声x'(t)を出力として得る雑音抑圧装置であって、雑音混入スペクトルYm(ω)から推定雑音スペクトルD'(ω)を減算する倍率α(ω)、および、減算されたスペクトルの下限を決めるパラメータβ(ω)を設定する際に、パラメータβ(ω)を倍率α(ω)に依存した値とすることを特徴とする。
【選択図】図2

Description

本発明は、雑音抑圧装置およびプログラムに関し、特に、音声に付加された雑音成分を抑圧する雑音抑圧装置およびプログラムに関する。
生中継を含むテレビやラジオなど放送用の音声の収録は、必ずしも音声素材の収録に適した環境で行われるとは限らず、様々な雑音も同時に収録されることとなる。そのような環境下においても放送に耐えうる明瞭な音声を得るには、混入した雑音を高品質に抑圧する技術が必要である。
従来から、音声に付加された雑音成分を抑圧する方法としては様々なものが提案されており、例えばスペクトルサブトラクションがよく知られている。以下に、スペクトルサブトラクションの原理を説明する。
tを時刻として、雑音混入音声y(t)が、入力音声x(t)と加法性雑音d(t)との和で[数1]のように構成されるとする。ここで、雑音混入音声y(t)は予め適切なサンプリング周波数でサンプリングされているとする。
Figure 2011257643
その離散フーリエ変換による周波数表現は、ωを離散角周波数として、[数2]のように表わされる。
Figure 2011257643
雑音混入音声y(t)の周波数スペクトルY(ω)を極座標形式で表現すると、[数3]のように表わされる。以降では、|Y(ω)|、φy(ω)をそれぞれ雑音混入音声y(t)の振幅スペクトル、位相スペクトルと呼ぶ。
Figure 2011257643
雑音d(t)の周波数スペクトルD(ω)も同様に振幅スペクトル、位相スペクトルを用いて、[数4]のように表わされる。
Figure 2011257643
実際には雑音の振幅スペクトル|D(ω)|は未知だが、非音声区間から推定した値|Dest(ω)|で置換できる。また、位相成分は音声の知覚への影響が少ないので、雑音の位相スペクトルφd(ω)を雑音混入音声の位相スペクトルφy(ω)で置換できる。
すると、雑音抑圧音声の周波数スペクトルX'(ω)は、例えば[数5]のように表わされる(例えば、特許文献1参照)。雑音抑圧音声x'(t)はX'(ω)を逆フーリエ変換することで求めることができる。ここで、α(ω)は雑音を減算する倍率(over-estimation factor)(以下、減算倍率と記す)であり、β(ω)はスペクトルの下限を決めるパラメータ(flooring factor)(以下、下限パラメータと記す)である。なお、Max{A,B}はAとBのうち大きい方を示す関数である。このような関数を用いるのは、振幅スペクトルが負の値を取り得ないためである。
Figure 2011257643
特許第3693022号明細書
特許文献1に開示された従来の方法では、雑音のスペクトル包絡を求め、これに依存した減算倍率α(ω)、下限パラメータβ(ω)を算出している。しかしながら、この方法では、スペクトル包絡を算出するために、雑音の周波数スペクトルD(ω)に対してさらにフーリエ変換および逆フーリエ変換を行う必要があり、計算量が非常に多くなるという問題がある。
本発明は、このような従来の課題を解決するためになされたものであって、計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供することを目的とする。
本発明の雑音抑圧装置は、雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置であって、前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの離散角周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を備え、前記雑音抑圧スペクトル算出手段が、離散角周波数の関数である第1の係数を設定する第1の係数設定手段と、前記第1の係数に依存する第2の係数を設定する第2の係数設定手段と、前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第1の係数を乗じた周波数スペクトルを減算する減算手段と、前記雑音混入音声の周波数スペクトルに前記第2の係数を乗じた周波数スペクトルを算出する乗算手段と、前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を備える構成を有している。
この構成により、スペクトル包絡を計算することなく減算倍率(第1の係数)を算出し、さらに下限パラメータ(第2の係数)を減算倍率に基づいて算出するため、計算量を抑えて高品質な雑音抑圧音声を得ることができる。
また、本発明の雑音抑圧装置は、前記第2の係数設定手段が、前記第2の係数が前記第1の係数に対して単調減少するように前記第2の係数を設定する構成を有していてもよい。
また、本発明の雑音抑圧装置は、前記第2の係数β(ω)が、以下の式(1)に示される前記第1の係数α(ω)の関数であってもよい。
Figure 2011257643
また、本発明の雑音抑圧装置は、前記第1の係数が、前記雑音の周波数スペクトルに対する前記雑音混入音声の周波数スペクトルの比に依存するものであってもよい。
本発明は、スペクトル包絡を計算することなく減算倍率を算出し、さらに下限パラメータを減算倍率に基づいて算出することにより、計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供するものである。
本発明に係る雑音抑圧装置の構成を示すブロック図 本発明に係る雑音抑圧装置の雑音抑圧スペクトル算出手段の構成を示すブロック図 本発明に係る雑音抑圧装置のハードウエア構成を示すブロック図 本発明に係る雑音抑圧装置のDSPが実行する雑音抑圧プログラムのフローチャート 雑音混入音声と分析フレームとの対応関係を示す模式的なグラフ 音声区間の雑音混入スペクトルの振幅スペクトル、および、推定雑音スペクトルの振幅スペクトルを示すグラフ 雑音抑圧プログラムの雑音抑圧スペクトル算出処理のフローチャート 事後SN比の算出結果を示すグラフ 傾きaが−1のときの切片bの決定方法を説明するためのグラフ 切片bが−3のときの傾きaの決定方法を説明するためのグラフ 減算倍率および下限パラメータの算出結果を示すグラフ 推定雑音スペクトルの振幅スペクトルに減算倍率を乗じたスペクトル、雑音混入スペクトルの振幅スペクトルに下限パラメータを乗じたスペクトル、および、雑音抑圧スペクトルの振幅スペクトルの算出結果を示すグラフ 雑音混入音声、および、雑音抑圧音声の算出結果を示すグラフ
以下、本発明に係る雑音抑圧装置およびプログラムの実施形態を図面を用いて説明する。
図1、2は本実施形態の雑音抑圧装置の構成を示すブロック図である。即ち、図1に示すように、本実施形態の雑音抑圧装置は、入力された雑音混入音声y(t)を複数の分析フレームFm(mは自然数)に対応させて切り出す音声波形切り出し手段1と、音声波形切り出し手段1によって切り出された雑音混入音声ym(t)の周波数スペクトルYm(ω)(以下、雑音混入スペクトルと記す)を求める周波数解析手段2と、雑音混入音声y(t)から非音声区間を検出するとともに、各分析フレームFmに対応した雑音混入音声ym(t)が非音声区間に属するものであるか否かを判定する非音声区間検出手段3と、非音声区間に属する雑音混入音声ym(t)の雑音混入スペクトルYm(ω)から雑音の周波数スペクトルD'(ω)(以下、推定雑音スペクトルと記す)を推定する雑音スペクトル推定手段4と、雑音混入スペクトルYm(ω)と推定雑音スペクトルD'(ω)の離散角周波数ωごとの大小関係に応じて、雑音抑圧スペクトルX'(ω)を算出する雑音抑圧スペクトル算出手段5と、を備える。
図2に示すように、雑音抑圧スペクトル算出手段5は、離散角周波数ωの関数である減算倍率(第1の係数)α(ω)を設定する第1の係数設定手段50と、減算倍率α(ω)に依存する下限パラメータ(第2の係数)β(ω)を設定する第2の係数設定手段53と、雑音混入スペクトルYm(ω)から、推定雑音スペクトルD'(ω)に減算倍率α(ω)を乗じた周波数スペクトルを減算する減算手段54と、雑音混入スペクトルYm(ω)に下限パラメータβ(ω)を乗じた周波数スペクトルを算出する乗算手段55と、減算手段54が出力する周波数スペクトルと乗算手段55が出力する周波数スペクトルを比較して、離散角周波数ωごとに大きい方を出力する比較手段56と、を備える。第1の係数設定手段50は、事後SN比算出手段51と、減算倍率α(ω)を算出する減算倍率算出手段52と、を備える。
本実施形態の雑音抑圧装置は、図1に示すように、雑音抑圧スペクトルX'(ω)に基づいて雑音抑圧音声x'(t)を出力する雑音抑圧音声出力手段6をさらに備える。
図3は、本実施形態の雑音抑圧装置のハードウエア構成を示すブロック図である。図3に示すように、本実施形態の雑音抑圧装置は、表示パネル71、キーボード72、およびマウス73等のインターフェイスと、パーソナルコンピュータ等の演算装置74と、を含む。
演算装置74は、サンプリング周波数48kHz、量子化ビット数16bitで雑音混入音声y(t)をデジタル音声信号に変換するAD変換部75、雑音抑圧音声x'(t)をアナログ音声信号として出力するDA変換部76、CPU(Central Processing Unit)77、CPU77の制御指令に基づいて周波数解析等の処理を実行するDSP(Digital Signal Processor)78、メモリ79、ハードディスク(HDD)80、および周辺機器I/F81がバス82を介して相互に結合された構成を有する。表示パネル71、キーボード72、およびマウス73等のインターフェイスは周辺機器I/F81に接続される。
AD変換部75およびDA変換部76とDSP78とはそれぞれ専用のバス83、84で接続されている。なお、雑音混入音声y(t)が予めAD変換されている場合は、雑音混入音声y(t)を直接DSP78に入力すればよい。また、雑音抑圧音声x'(t)をDA変換せずデジタル音声信号のままDSP78から出力する構成としてもよい。
なお、音声波形切り出し手段1、周波数解析手段2、非音声区間検出手段3、雑音スペクトル推定手段4、雑音抑圧スペクトル算出手段5、および雑音抑圧音声出力手段6は、メモリ79にプログラムをインストールすることにより、演算装置74内にソフトウエア的に構成される。
図4は、CPU77の制御指令に基づいてDSP78が実行する雑音抑圧プログラムのフローチャートである。図4(a)に示すように、DSP78は、音声波形切り出し手段1に対応する音声波形切り出し処理(ステップS100)と、周波数解析手段2に対応する高速フーリエ変換(FFT)処理(ステップS101)と、雑音抑圧スペクトル算出手段5に対応する雑音抑圧スペクトル算出処理(ステップS102)と、雑音抑圧音声出力手段6に対応する逆高速フーリエ変換(IFFT)処理(ステップS103)および音声波形重ね合わせ処理(ステップS104)と、を実行するようになっている。
さらに、図4(b)に示すように、DSP78は、非音声区間検出手段3に対応する非音声区間検出処理(ステップS105)と、雑音スペクトル推定手段4に対応する雑音スペクトル推定処理(ステップS106)と、を実行するようになっている。
図5は、雑音混入音声y(t)と分析フレームFmとの対応関係を示す模式的なグラフである。ここで、雑音混入音声y(t)はサンプリング周波数48kHz、量子化ビット数16bitでAD変換されているものとする。
DSP78は、雑音抑圧プログラムの音声波形切り出し処理(ステップS100)において、例えば、1つの分析フレームFmの窓幅Nが1024サンプル(約20ms)、シフト幅N/2が半分の512サンプル(約10ms)となるように、雑音混入音声y(t)を分割する。なお、このように分割された雑音混入音声をym(n)(1≦n≦N)と記す。ここで、nはm番目の分析フレームFmに含まれるサンプル番号を示すインデックスである。
次に、雑音抑圧プログラムのFFT処理(ステップS101)の詳細について説明する。DSP78は、m番目の分析フレームFmに対応する雑音混入音声ym(n)(1≦n≦N)を読み込み、音声の声道特性の高域における減衰を補正するため、雑音混入音声ym(n)(1≦n≦N)に[数7]で表わされるフィルタ(H(z))でプリエンファシスを施す。
Figure 2011257643
次に、DSP78は、プリエンファシスが施された雑音混入音声ym(n)(1≦n≦N)に適切な窓関数(例えば[数8]で表わされるハミング窓whamm(n))を乗じる。
Figure 2011257643
そして、DSP78は、窓関数が乗じられた雑音混入音声ym(n)(1≦n≦N)に離散フーリエ変換(FFT)を施し、[数9]に示すような雑音混入音声ym(n)(1≦n≦N)の雑音混入スペクトルYm(ω)を出力する。ここで、|Ym(ω)|は振幅スペクトル、φm(ω)は位相スペクトルである。
Figure 2011257643
次に、雑音抑圧プログラムの非音声区間検出処理(ステップS105)の詳細について説明する。DSP78は、非音声区間検出処理(ステップS105)において、公知の方法で雑音混入音声y(t)から非音声区間を検出するようになっている。例えば、入力される雑音混入音声y(t)に対して、予め音声区間とする音量レベルの閾値を設定し、音量レベルがその閾値以上である雑音混入音声ym(n)(1≦n≦N)を音声区間とし、閾値未満であるym(n)(1≦n≦N)を非音声区間とする方法がある。
即ち、DSP78は、各分析フレームFmに対応した雑音混入音声ym(n)(1≦n≦N)が非音声区間に属するものであるか否かを判定し、非音声区間に属する雑音混入音声ym(n)(1≦n≦N)、または、非音声区間に属する雑音混入音声ym(n)(1≦n≦N)の分析フレームFmのインデックスmを出力する。
なお、この非音声区間検出処理(ステップS105)は、FFT処理(ステップS101)で求められた雑音混入スペクトルYm(ω)を用いて非音声区間を検出するものであってもよい。
次に、雑音抑圧プログラムの雑音スペクトル推定処理(ステップS106)の詳細について説明する。DSP78は、FFT処理(ステップS101)で求められた雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|を分析フレームFmごとに順次読み込む。
次に、DSP78は、雑音抑圧プログラムの非音声区間検出処理(ステップS105)の処理結果に基づいて、非音声区間の振幅スペクトル|Ym(ω)|のみに対して、[数10]より推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|を算出する。ここでは、M0個の非音声区間の振幅スペクトル|Ym(ω)|に対して平均化処理を行っている。
Figure 2011257643
図6(a)に音声区間の雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|、図6(b)に推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|のスペクトル例を示す。
なお、雑音スペクトル推定処理(ステップS106)においては、非音声区間検出処理(ステップS105)において新たな非音声区間の分析フレームFmを1つ検出するたびに、[数10]の平均化処理において用いるM0個の非音声区間の|Ym(ω)|を1つずつ新しいものに入れ替えてもよい。あるいは、音声区間検出方法を利用せず、手動で設定した区間で適宜[数10]のような計算を行うことにより|D'(ω)|を推定してもよい。
次に、雑音抑圧プログラムの雑音抑圧スペクトル算出処理(ステップS102)の詳細について図7のフローチャートに沿って説明する。なお、ステップS110の処理は事後SN比算出手段51、ステップS111の処理は減算倍率算出手段52、ステップS112の処理は第2の係数設定手段53、ステップS113の処理は減算手段54、乗算手段55、および比較手段56に相当している。
まず、DSP78は、推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|に対する雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|の比である、[数11]で表わされる事後SN比ρ(ω)[dB]を算出する(ステップS110)。図8に算出した事後SN比ρ(ω)の例を示す。
Figure 2011257643
次に、DSP78は、ステップS110で算出した事後SN比ρ(ω)を用いて、例えば、[数12]により減算倍率α(ω)を算出する(ステップS111)。
Figure 2011257643
ここで、maxρ(ω)およびminρ(ω)は、それぞれ1つの分析フレームFmに対応するρ(ω)の最大値と最小値である。R(ω)は、ρ(ω)を正規化したものであり、−1≦R(ω)≦0である。なお、減算倍率α(ω)は、[数12]のように離散角周波数ωに依存しない予め定められた固定値であってもよい。あるいは、減算倍率α(ω)は、離散角周波数ωに依存する周波数域、および、離散角周波数ωに依存しない周波数域の関数であってもよい。上記の固定値は、例えば、表示パネル71、キーボード72、およびマウス73等のインターフェイスを介してユーザにより手動で入力されてもよい。
次に、DSP78は、例えば[数13]に示すように、減算倍率α(ω)の対数を独立変数とする一次関数の従属変数となる下限パラメータβ(ω)を算出する(ステップS112)。
Figure 2011257643
[数13]において、a、bは一次関数の傾きと切片を決める定数とし、例えばa=−1、b=−3dBとする。傾きa、切片bは以下に示す客観音質評価実験の結果に基づいて定めた値である。
図9に、クリーンな音声と雑音をSNR=0dBでミックスした雑音混入音声を対象に、減算倍率α=3dB(周波数に依存しない固定値)、一次関数の傾きa=−1の時に、切片bを0,−3,−6dBに変化させた場合の雑音抑圧音声に対して、クリーンな音声と雑音抑圧音声の間のケプストラム距離、および、セグメンタルSNRを求めたものを示す。ケプストラム距離の値が小さいほど雑音混入音声がクリーンな音声に近く、セグメンタルSNRの値が大きいほど雑音が抑圧されていることを意味する。
図10に、クリーンな音声と雑音をSNR=0dBでミックスした雑音混入音声を対象に、減算倍率α=3dB(周波数に依存しない固定値)、一次関数の切片b=−3の時に、傾きa=−0.5,−1,−2に変化させた場合の雑音抑圧音声に対して、クリーンな音声と雑音抑圧音声の間のケプストラム距離、および、セグメンタルSNRを求めたものを示す。
図9、図10に示したいずれの場合においてもケプストラム距離とセグメンタルSNRはトレードオフの関係にあることがわかる。従って、これらの実験結果に基づいて、a=−1およびb=−3を最適な値とした。図11に、[数13]においてa=−1、b=−3dBとしたときの減算倍率α(ω)および下限パラメータβ(ω)の例を示す。
次に、DSP78は、[数14]に従って雑音抑圧スペクトルX'm(ω)を算出する(ステップS113)。なお、位相スペクトルは音声の知覚への影響が少ないので、雑音抑圧スペクトルX'm(ω)の位相スペクトルとして雑音混入スペクトルYm(ω)の位相スペクトルφm(ω)を利用している。
Figure 2011257643
図12(a)に推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|に減算倍率α(ω)を乗じた周波数スペクトル、図12(b)に雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|に下限パラメータβ(ω)を乗じた周波数スペクトル、図12(c)に[数14]より求められる雑音抑圧スペクトルX'm(ω)の振幅スペクトル|X'm(ω)|の例を示す。
なお、DSP78は、ステップS112において、上記の[数13]の代わりに下記の[数15]に示すように、減算倍率α(ω)の逆数に比例するような下限パラメータβ(ω)を算出してもよい。なお、δは調整用の定数である。
Figure 2011257643
次に、雑音抑圧プログラムのIFFT処理(ステップS103)の詳細について説明する。DSP78は、分析フレームFmに対応する雑音抑圧スペクトルX'm(ω)を読み込み、読み込んだ雑音抑圧スペクトルX'm(ω)に対して逆高速フーリエ変換(IFFT)を施すことにより、音声波形x'm(n)(1≦n≦N)を算出する。
次に、DSP78は、音声波形x'm(n)(1≦n≦N)をハミング窓whamm(n)で除して、プリエンファシスの逆フィルタ(1/H(z))でディエンファシスを施す。
次に、雑音抑圧プログラムの音声波形重ね合わせ処理(ステップS104)の詳細について説明する。DSP78は、IFFT処理(ステップS103)においてディエンファシスを施した音声波形x'm(n)(1≦n≦N)に適切な窓関数(例えば[数16]で表わされるハニング窓whann(n))を乗じる。
Figure 2011257643
そして、DSP78は、適切な窓関数を乗じた音声波形x'm(n)(1≦n≦N)と、一つ前の分析フレームFm-1に対応する音声波形x'm-1(n)(1≦n≦N)と、をシフト幅(N/2)分ずらして重ね合わせることにより、雑音抑圧音声x'(m−1,m)を得る。ここで、雑音抑圧音声x'(m−1,m)とは、最終的に得られる雑音抑圧音声x'(t)のうち、分析フレームFm-1と分析フレームFmの重なり部分に相当する区間のデータを示している。
即ち、DSP78は、全ての分析フレームに対して上記の音声波形重ね合わせ処理を行うことにより、雑音抑圧音声x'(t)を出力することができる。図13(a)に雑音混入音声y(t)、図13(b)にその雑音抑圧音声x'(t)の例を示す。
以上説明したように、本発明に係る雑音抑圧装置およびプログラムは、スペクトル包絡を計算することなく減算倍率を算出し、さらに下限パラメータを減算倍率に基づいて算出することにより、計算量を抑えて高品質な雑音抑圧音声を得ることができるという効果を有し、収録される音声に対してリアルタイムで雑音を抑制することが可能な雑音抑圧装置およびプログラムとして有用である。
1 音声波形切り出し手段
2 周波数解析手段
3 非音声区間検出手段
4 雑音スペクトル推定手段
5 雑音抑圧スペクトル算出手段
6 雑音抑圧音声出力手段
50 第1の係数設定手段
51 事後SN比算出手段
52 減算倍率算出手段
53 第2の係数設定手段
54 減算手段
55 乗算手段
56 比較手段

Claims (5)

  1. 雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置であって、
    前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、
    前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、
    前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの離散角周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を備え、
    前記雑音抑圧スペクトル算出手段が、
    離散角周波数の関数である第1の係数を設定する第1の係数設定手段と、
    前記第1の係数に依存する第2の係数を設定する第2の係数設定手段と、
    前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第1の係数を乗じた周波数スペクトルを減算する減算手段と、
    前記雑音混入音声の周波数スペクトルに前記第2の係数を乗じた周波数スペクトルを算出する乗算手段と、
    前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を備えることを特徴とする雑音抑圧装置。
  2. 前記第2の係数設定手段が、前記第2の係数が前記第1の係数に対して単調減少するように前記第2の係数を設定する請求項1に記載の雑音抑圧装置。
  3. 前記第2の係数β(ω)が、以下の式(1)に示される前記第1の係数α(ω)の関数である請求項1または請求項2に記載の雑音抑圧装置。
    Figure 2011257643
  4. 前記第1の係数が、前記雑音の周波数スペクトルに対する前記雑音混入音声の周波数スペクトルの比に依存する第1の係数を設定するものである請求項1から請求項3のいずれか一項に記載の雑音抑圧装置。
  5. コンピュータを、雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置として機能させるプログラムであって、
    コンピュータに、
    前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、
    前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、
    前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を実現させ、
    前記雑音抑圧スペクトル算出手段が、
    離散角周波数の関数である第1の係数を設定する第1の係数設定手段と、
    前記第1の係数に依存する第2の係数を設定する第2の係数設定手段と、
    前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第1の係数を乗じた周波数スペクトルを減算する減算手段と、
    前記雑音混入音声の周波数スペクトルに前記第2の係数を乗じた周波数スペクトルを算出する乗算手段と、
    前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を含むことを特徴とするプログラム。
JP2010133098A 2010-06-10 2010-06-10 雑音抑圧装置およびプログラム Active JP5588233B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010133098A JP5588233B2 (ja) 2010-06-10 2010-06-10 雑音抑圧装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010133098A JP5588233B2 (ja) 2010-06-10 2010-06-10 雑音抑圧装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2011257643A true JP2011257643A (ja) 2011-12-22
JP5588233B2 JP5588233B2 (ja) 2014-09-10

Family

ID=45473862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010133098A Active JP5588233B2 (ja) 2010-06-10 2010-06-10 雑音抑圧装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5588233B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9754606B2 (en) 2012-05-01 2017-09-05 Ricoh Company, Ltd. Processing apparatus, processing method, program, computer readable information recording medium and processing system
KR20180098806A (ko) * 2017-02-27 2018-09-05 한국전자통신연구원 자연어 인식 성능 개선 방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003223186A (ja) * 2002-01-29 2003-08-08 Toyota Central Res & Dev Lab Inc 音声認識方法及び音声認識装置
JP2007006525A (ja) * 2006-08-24 2007-01-11 Nec Corp ノイズ除去の方法及び装置
WO2010052749A1 (ja) * 2008-11-04 2010-05-14 三菱電機株式会社 雑音抑圧装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003223186A (ja) * 2002-01-29 2003-08-08 Toyota Central Res & Dev Lab Inc 音声認識方法及び音声認識装置
JP2007006525A (ja) * 2006-08-24 2007-01-11 Nec Corp ノイズ除去の方法及び装置
WO2010052749A1 (ja) * 2008-11-04 2010-05-14 三菱電機株式会社 雑音抑圧装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9754606B2 (en) 2012-05-01 2017-09-05 Ricoh Company, Ltd. Processing apparatus, processing method, program, computer readable information recording medium and processing system
KR20180098806A (ko) * 2017-02-27 2018-09-05 한국전자통신연구원 자연어 인식 성능 개선 방법 및 장치
US10388275B2 (en) 2017-02-27 2019-08-20 Electronics And Telecommunications Research Institute Method and apparatus for improving spontaneous speech recognition performance
KR102017244B1 (ko) * 2017-02-27 2019-10-21 한국전자통신연구원 자연어 인식 성능 개선 방법 및 장치

Also Published As

Publication number Publication date
JP5588233B2 (ja) 2014-09-10

Similar Documents

Publication Publication Date Title
JP5528538B2 (ja) 雑音抑圧装置
CA2732723C (en) Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
JP4440937B2 (ja) 暗騒音存在時の音声を改善するための方法および装置
EP1774517B1 (en) Audio signal dereverberation
JP4568733B2 (ja) 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラムおよびコンピュータに読み取り可能な記録媒体
JP5875609B2 (ja) 雑音抑圧装置
JP2013517531A (ja) ノイズ抑制システムのための歪み測定
US9094078B2 (en) Method and apparatus for removing noise from input signal in noisy environment
JP2015158696A (ja) 雑音抑圧の方法、装置、及びプログラム
JP2004254322A (ja) ウィンドノイズを抑制するシステム
US20140177853A1 (en) Sound processing device, sound processing method, and program
Udrea et al. An improved spectral subtraction method for speech enhancement using a perceptual weighting filter
US9418677B2 (en) Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program
JP4757775B2 (ja) 雑音抑圧装置
JP5588233B2 (ja) 雑音抑圧装置およびプログラム
Ruhland et al. Reduction of Gaussian, supergaussian, and impulsive noise by interpolation of the binary mask residual
JP3849679B2 (ja) 雑音除去方法、雑音除去装置およびプログラム
CN113571076A (zh) 信号处理方法、装置、电子设备和存储介质
Patil et al. Use of baseband phase structure to improve the performance of current speech enhancement algorithms
CN116137154A (zh) 语音信号的信号增强方法、装置、设备及存储介质
JP4478045B2 (ja) エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体
JP6679881B2 (ja) 雑音推定装置、プログラム及び方法、並びに、音声処理装置
JP2004020945A (ja) 音声認識装置、音声認識方法、および、音声認識プログラム
Steinmetz et al. High-Fidelity Noise Reduction with Differentiable Signal Processing
CN116457877A (zh) 用于组合重复噪声信号的装置和方法

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20130214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20130214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140701

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140725

R150 Certificate of patent or registration of utility model

Ref document number: 5588233

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250