JP2013246418A - 雑音抑圧装置、方法及びプログラム - Google Patents

雑音抑圧装置、方法及びプログラム Download PDF

Info

Publication number
JP2013246418A
JP2013246418A JP2012122375A JP2012122375A JP2013246418A JP 2013246418 A JP2013246418 A JP 2013246418A JP 2012122375 A JP2012122375 A JP 2012122375A JP 2012122375 A JP2012122375 A JP 2012122375A JP 2013246418 A JP2013246418 A JP 2013246418A
Authority
JP
Japan
Prior art keywords
noise
spectrum
speech
input
noise spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012122375A
Other languages
English (en)
Other versions
JP6064370B2 (ja
Inventor
Masaru Fujieda
大 藤枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2012122375A priority Critical patent/JP6064370B2/ja
Publication of JP2013246418A publication Critical patent/JP2013246418A/ja
Application granted granted Critical
Publication of JP6064370B2 publication Critical patent/JP6064370B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

【課題】 ミュージカルノイズを生じさせずに雑音を抑圧できる、スペクトル減算法による雑音抑圧装置を提供する。
【解決手段】 本発明の雑音抑圧装置では、入力音声を周波数解析した入力スペクトルから推定された雑音スペクトルを、雑音スペクトル補正手段が補正し、補正された雑音スペクトルに基づいて、スペクトルゲインを算出する。雑音スペクトル補正手段は、入力スペクトルを構成する音声成分と雑音成分との関係において、音声成分が雑音成分より十分大きい場合には、補正雑音スペクトルを推定雑音スペクトルとほぼ同じにし、音声成分が雑音成分より小さい又は同程度の場合には、入力スペクトルと推定雑音スペクトルとの比に応じて補正雑音スペクトルが小さくなるように調整し、音声成分の占める割合が0に近付くと補正雑音スペクトルが0に収束するように、推定雑音スペクトルを補正する。
【選択図】 図1

Description

本発明は雑音抑圧装置、方法及びプログラムに関し、特に、音声信号に重畳された雑音を周波数領域処理によって抑圧する場合に適用し得るものである。
自然環境において雑音はいたる所に存在するため、実世界の音声は、一般に種々の発信元からの雑音を含む。雑音を含んで観測された音声の品質を向上させるために、様々な雑音抑圧方法が開発されている。雑音抑圧方法は、大別して時間領域処理と周波数領域処理の2つに分かれており、本発明が対象とするのは周波数領域処理による雑音抑圧方法である。
周波数領域処理による雑音抑圧方法で代表されるのは、スペクトル減算法(Spectral Subtraction;スペクトル減算法は周波数減算法と呼ばれることもある:以下、SS法と呼ぶ)とウィナーフィルタである。SS法やウィナーフィルタは、処理後に出力音声に歪みが生じることが知られている。この歪みはミュージカルノイズとして言及されるものであり、雑音成分の引き過ぎと引き残しがランダムに起きることで、時間周波数領域上に時間と周波数の両方向に孤立した成分(孤立周波数成分)がランダムに発生して、キュルキュルという人工的・楽音的な雑音として知覚される。
孤立周波数成分を発生させる要因として、以下のような項目が挙げられている。
[1]音声成分と雑音成分の相互相関項の影響によって、ゲインの推定精度が劣化する。
[2]スペクトルゲインを入力信号のスペクトルと推定雑音スペクトルの比の関数とみなすと、その概形は、比の小さいところで非常に大きな傾きを持っている。
[3]音声スペクトルにおける「谷」の部分(スペクトル成分が極端に小さい部分)が考慮されていない。
要因[1]は、雑音スペクトルの推定誤差として現れ、孤立周波数成分を生じる原因となる。要因[2]は、比が小さい範囲で少し振動するとゲイン値が大きく振動して、孤立周波数成分を誘発すると考えられる。要因[3]は、入力音声スペクトルの谷にある凹凸を考慮せずに減算を行うために、孤立周波数成分が発生していると考えられる。
これらの要因を解消するために、これまでにいくつのかの技術が開発されている(特許文献1、特許文献2、特許文献3)。
特許文献1に開示されている技術では、パワースペクトルの時間平滑化によって相互相関項(上記要因[1])の影響を低減する従来技術はスペクトルゲインの推定精度が劣るという問題を有することに言及し、これを以下の手段によって解決している。長さの異なる2つの異なる解析窓によって入力音声を解析する。解析区間の長い方はスペクトルゲインの算出に使用されるゲイン算出用解析窓であり、解析区間の短い方は雑音スペクトルの推定と出力スペクトルの算出に使用される信号用解析窓である。ゲイン算出用解析窓で得られた入力スペクトルは、スペクトルゲインの算出前に信号用解析窓と同じデータ数に圧縮されるが、この際に周波数方向の平滑化を行うことにより相互相関項の影響が低減されるとしている。
特許文献2に開示されている技術では、雑音成分のみが存在する区間における入力スペクトル(これは真の雑音スペクトルに等しい)と推定雑音スペクトルとの比hは1の付近に集まるが、SS法及びウィナーフィルタのスペクトルゲインはhが1の付近で非常に急峻な特性を持っているためにスペクトルゲインの変動が大きくなることを指摘し(上記要因[2])、これを以下の手段で解決している。次の4つの特徴
(1)hが小さい値の範囲(例えばh<2)では、なるべく小さな値かつ、小さな傾きを有する
(2)hが中程度の範囲(例えば2<h<6)では、大きな正の傾きを有する
(3)hが十分大きい範囲(例えばh>6)では、傾きは小さくなり、1に収束する
(4)変曲点に対して非対称
を有するゲイン関数を定義して、SS法やウィナーフィルタのスペクトルゲインの代わりにこのゲイン関数を用いることで、上記要因[2]を解消する。主に、特徴(1)により、スペクトルゲインの変動が抑えられる。
特許文献3に開示されている技術では、入力スペクトルの振幅の谷にはほとんど雑音成分しか含まれないことに注目している。具体的には、解析窓ごとに平均雑音レベルβを推定し、βより小さくβに比例する圧縮雑音レベルαと、βより大きくβに比例する信号成分判定閾値γを算出し、入力スペクトルがαより小さい場合にはαを最大値としてレベルを持ち上げて、α〜βの間の場合にはαを最小値としてレベルを抑圧し、γ以上の場合には圧縮せず、β〜γの間の場合にはβ以下とγ以上がスムーズにつながるように伸張する。これにより、入力スペクトルの谷にある凹凸が圧縮雑音レベルα付近に圧縮されるので孤立周波数成分の発生を抑制することができ、かつ音声成分(γ以上の部分)は変形させないので、雑音抑圧後に発生するミュージカルノイズを大幅に抑制できるとしている。
特許第4568733号公報 特開2011−191669号公報 特開2010−32802号公報
しかし、特許文献1の開示技術は、孤立周波数成分の発生要因に十分な追究がなされておらず、そのため特許文献1に開示されている技術では上記要因[2]と上記要因[3]によって孤立周波数成分が生じてしまい、ミュージカルノイズを大幅に抑圧することはできない。
特許文献2の開示技術において提案されているゲイン関数は、h→0においてゲインが0に収束していないので(特許文献2の図1参照)、十分な雑音抑圧性能が得られない。
特許文献3の開示技術は、圧縮後の入力スペクトルには真の雑音成分よりフラットな周波数特性を持つレベルαの雑音成分が含まれた状態になるので、αに応じて雑音抑圧ゲインを適切に設定すれば十分な雑音抑圧性能が得られるが、当該文献の中にはその詳細な方法が述べられていない。
従来の技術に共通する問題は、ミュージカルノイズが発生する局所的な要因に注目していることである。相互相関項の影響などによる雑音スペクトルの推定誤差は、減算型フィルタの急峻な特性によって顕著になり、周波数と時間の両方向に孤立した通過ゲイン(孤立ゲインと呼ぶ)がランダムに発生するゲイン特性が得られる。孤立ゲインは入力スペクトルの周波数成分をランダムに通過させるため、抑圧処理の実施によって孤立周波数成分が出力スペクトルに散りばめられることになる。以上のように、上記3つの要因はどれもミュージカルノイズが発生する過程の一部でしかないため、従来技術ではミュージカルノイズの発生を完全に抑圧することはできなかった。
そのため、ミュージカルノイズを生じさせずに雑音を抑圧できる雑音抑圧装置、方法及びプログラムが望まれている。
第1の本発明は、入力音声を周波数解析した入力スペクトルから、上記入力音声に重畳されている雑音を抑圧する雑音抑圧装置において、(1)上記入力スペクトルに基づいて雑音スペクトルを推定する雑音スペクトル推定手段と、(2)推定された上記雑音スペクトルを上記入力スペクトルに応じて補正する雑音スペクトル補正手段と、(3)上記入力スペクトルと上記雑音スペクトル補正手段が出力する補正雑音スペクトルとを用いて、上記入力スペクトル中の雑音成分を抑制させるためのスペクトルゲインを算出するスペクトルゲイン算出手段と、(4)上記スペクトルゲインを時間平滑化するスペクトルゲイン時間平滑化手段とを備え、(5)上記雑音スペクトル補正手段は、(5−1)上記入力スペクトルを構成する音声成分と雑音成分に対して、上記音声成分が上記雑音成分に比べて十分大きい場合には、上記補正雑音スペクトルを推定された上記雑音スペクトルとほぼ同じにし、(5−2)上記音声成分が上記雑音成分に比べて小さい又は同程度の場合には、上記入力スペクトルと推定された上記雑音スペクトルとの比に応じて上記補正雑音スペクトルが小さくなるように調整し、(5−3)上記音声成分の占める割合が0に近付くと上記補正雑音スペクトルが0に収束するように、推定された上記雑音スペクトルを補正することを特徴とする。
第2の本発明は、入力音声を周波数解析した入力スペクトルから、上記入力音声に重畳されている雑音を抑圧する雑音抑圧方法において、雑音スペクトル推定手段、雑音スペクトル補正手段、スペクトルゲイン算出手段及びスペクトルゲイン時間平滑化手段を備え、(1)上記雑音スペクトル推定手段は、上記入力スペクトルに基づいて雑音スペクトルを推定し、(2)上記雑音スペクトル補正手段は、推定された上記雑音スペクトルを上記入力スペクトルに応じて補正し、(3)上記スペクトルゲイン算出手段は、上記入力スペクトルと上記雑音スペクトル補正手段が出力する補正雑音スペクトルとを用いて、上記入力スペクトル中の雑音成分を抑制させるためのスペクトルゲインを算出し、上記スペクトルゲイン時間平滑化手段は、上記スペクトルゲインを時間平滑化し、(5)上記雑音スペクトル補正手段は、上記入力スペクトルを構成する音声成分と雑音成分に対して、(5−1)上記音声成分が上記雑音成分に比べて十分大きい場合には、上記補正雑音スペクトルを推定された上記雑音スペクトルとほぼ同じにし、(5−2)上記音声成分が上記雑音成分に比べて小さい又は同程度の場合には、上記入力スペクトルと推定された上記雑音スペクトルとの比に応じて上記補正雑音スペクトルが小さくなるように調整し、(5−3)上記音声成分の占める割合が0に近付くと上記補正雑音スペクトルが0に収束するように、推定された上記雑音スペクトルを補正することを特徴とする。
第3の本発明は、入力音声を周波数解析した入力スペクトルから、上記入力音声に重畳されている雑音を抑圧する雑音抑圧プログラムであって、コンピュータを、(1)上記入力スペクトルに基づいて雑音スペクトルを推定する雑音スペクトル推定手段と、(2)推定された上記雑音スペクトルを上記入力スペクトルに応じて補正するものであって、上記入力スペクトルを構成する音声成分と雑音成分に対して、上記音声成分が上記雑音成分に比べて十分大きい場合には、上記補正雑音スペクトルを推定された上記雑音スペクトルとほぼ同じにし、上記音声成分が上記雑音成分に比べて小さい又は同程度の場合には、上記入力スペクトルと推定された上記雑音スペクトルとの比に応じて上記補正雑音スペクトルが小さくなるように調整し、上記音声成分の占める割合が0に近付くと上記補正雑音スペクトルが0に収束するように、推定された上記雑音スペクトルを補正する雑音スペクトル補正手段と、(3)上記入力スペクトルと上記雑音スペクトル補正手段が出力する補正雑音スペクトルとを用いて、上記入力スペクトル中の雑音成分を抑制させるためのスペクトルゲインを算出するスペクトルゲイン算出手段と、(4)上記スペクトルゲインを時間平滑化するスペクトルゲイン時間平滑化手段として機能させることを特徴とする。
本発明によれば、孤立周波数成分の発生と増幅を抑圧することにより、ミュージカルノイズを生じない雑音抑圧効果を得ることが可能である。
第1の実施形態の雑音抑圧装置の構成を示す機能ブロック図である。 第1の実施形態及び従来の雑音スペクトル補正関数の概形(入出力の関係)を示すグラフである。 SS法と第1の実施形態の音声対雑音比rとスペクトルゲインGss(k)、G(k)との関係を示すグラフである。 第2の実施形態における雑音スペクトル補正関数の概形(入出力の関係)を示すグラフである。 第2の実施形態の音声対雑音比rとスペクトルゲインG(k)との関係を、閾値THRの2つの値0、0.1について示すグラフである。 第3の実施形態における雑音スペクトル補正関数の概形(入出力の関係)を示すグラフである。 第3の実施形態における雑音スペクトル補正関数の特徴量を整理して示す図表である。 第4の実施形態における雑音スペクトル補正関数の概形(入出力の関係)を示すグラフである。 第4の実施形態における、境界値BR(n)と、その境界値での雑音スペクトル補正関数の値CC(n)との対応を示す図表である。 第5の実施形態の雑音抑圧装置の構成を示す機能ブロック図である。
(A)第1の実施形態
以下、本発明に係る雑音抑圧装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態の雑音抑圧装置の構成を示す機能ブロック図である。第1の実施形態の雑音抑圧装置を、CPUが実行するソフトウェア(雑音抑圧プログラム)として実現することも可能であり、また、DSP(Digital Signal Processor)、ASIC(Application Specific IC)、PLD(Programmable Logic Device)などの電子回路を利用して実現することも可能であるが、機能的には、図1で表すことができる。
なお、図1は、第1の実施形態の雑音抑圧装置における処理の流れを示すフローチャートと見ることもできる。
図1において、第1の実施形態の雑音抑圧装置100は、周波数解析処理部101、パワー算出処理部102、音声区間検出処理部103、雑音スペクトル推定処理部104、雑音スペクトル補正処理部105、スペクトルゲイン算出処理部106、スペクトルゲイン時間平滑化処理部107、フィルタリング処理部108及び波形合成処理部109を有する。
雑音抑圧装置100には、デジタル音声信号でなる入力音声x(t)が入力される。例えば、マイクロフォンが音声を捕捉して得たアナログ音声信号をA/D変換器でデジタル音声信号に変換したものが入力音声x(t)になっても良く、また、通信回線を介して転送されたデジタル音声信号が入力音声x(t)になっても良く(アナログ音声信号が転送されてきた場合にはA/D変換することを要する)、さらに、記録媒体から読み出したデジタル音声信号が入力音声x(t)になっても良い(アナログ音声信号が読み出された場合にはA/D変換することを要する)。
周波数解析処理部101は、入力音声x(t)の周波数解析を行い、入力複素スペクトルX(k)を出力する。ここで、パラメータtとkはそれぞれ、時間と周波数ピンの要素番号である。デジタル信号のサンプリング周波数は限定されるものではなく、例えば、8kHzや16kHz、44.1kHzなどのデジタル音声信号を入力し得る。周波数解析手法も何ら限定されるものではなく、例えば、FFT(Fast Fourier Transform;高速フーリエ変換)を適用することができる。
パワー算出処理部102は、入力複素スペクトルX(k)のパワー又は振幅を要素ごとに計算する。パワーとするか振幅とするかによって雑音抑圧特性が多少異なるが、どちらを選択するかは、第1の実施形態の効果とは関係がないことから、どちらを選択しても構わない。ここでは、振幅をパワーと呼ぶこととする。この場合、入力複素スペクトルX(k)の絶対値を入力スペクトルPX(k)とする。
音声区間検出処理部103は、入力音声x(t)が音声区間か雑音区間かを判定して、音声区間検出結果Vを出力する。音声区間検出結果Vの値は任意の2値とすれば良い。例えば、入力音声x(t)が音声区間である場合にはV=1、雑音区間である場合にはV=0とする。この判定は一般に音声区間検出(VAD)と呼ばれていて、様々な方式が提案されており、ここではそれらの任意の方式を適用することができる。図1では、音声区間検出処理部103に入力音声x(t)を入力する場合を示しているが、適用するVAD方式によっては、他の信号を音声区間検出処理部103に入力するようにしても良い。例えば、入力スペクトルPX(k)の周波数要素kに関する平均値を求め、この平均値が予め設定しておいた雑音レベルに関する閾値THVより小さいときにV=0、大きいときにV=1としても良い。
雑音スペクトル推定処理部104は、入力スペクトルPX(k)と過去に推定したMv個の雑音スペクトルPNpast(k;m)(但し、m=1,2,…,Mv、また、PNpast(k;m)はm回前に推定した雑音スペクトルを意味する)とを用いて現在の雑音スペクトルPN(k)を推定する。雑音スペクトル推定処理部104の処理は、音声区間検出結果Vによって制御される。V=1の場合(すなわち入力音声x(t)が音声区間である場合)には、雑音スペクトルを更新せず、現在の雑音スペクトルPN(k)として1回前に推定した雑音スペクトルPNpast(k;1)を適用する(PN(k)=PNpast(k;1))。一方、V=0の場合(すなわち、x(t)が雑音区間である場合)には、a*PX(k)とPNpast(k;m)との平均値(この明細書において、「平均値」は単純平均値だけでなく、重み付け平均値を含む用語である)を算出ことで、現在の雑音スペクトルPN(k)を推定する。ここで、減算係数aは、大きいほど雑音抑圧性能が高くなるが同時に音声の歪みが大きくなる係数であり、a=0.5〜2.0程度が妥当である。入力スペクトルPX(k)に減算係数aを適用したり、過去の雑音スペクトルPNpast(k;m)をも利用した平均値を算出したりすることにより、音声成分を誤って雑音成分として学習することを防ぐことができる。
平均値の算出方法として、例えば、以下の2例を挙げることができる。第1に、Mv>1として、a*PX(k)と全てのPNpast(k;m)との平均を計算する方法がある。第2に、Mv=1とし、(1)式に示す時定数フィルタによって平均値を得る方法がある。(1)式において、TCNは、0≦TCN≦1の範囲内の値をとる時定数と呼ばれる係数であり、TCN=1ならは非更新で、TCNが小さいほど更新が速くなり、TCN=0でPN(k)=a*PX(k)となる。
PN(k)=TCN*PNpast(k;1)+(1−TCN)*a*PX(k)
…(1)
雑音スペクトル補正処理部105は、入力スペクトルPX(k)に基づいて雑音スペクトルPN(k)を補正する。
雑音スペクトルPN(k)を補正するために、雑音スペクトル補正関数fC(r)を導入する。パラメータrには後述するように音声対雑音比が適用され、この点に鑑み、雑音スペクトル補正関数fC(r)は、以下のような3つの特徴(ア)〜(ウ)を有する。
(ア)rに対して、単調非減少である。
(イ)r=0のとき、fC(r)=0である。
(ウ)r=∞のとき、fC(r)→1である。
この第1の実施形態では、雑音スペクトル補正関数fC(r)として連続で滑らかな関数を使用する。そこで、さらに以下の4つの特徴(エ)〜(キ)を追加する。
(エ)fC(r)は1回微分可能であり、1階の導関数fC’(r)は以下の特徴(オ)〜(キ)を有する。
(オ)rに対して、単調非増加である。
(カ)r=0のとき、fC’(r)=1である。
(キ)r→∞のとき、fC’(r)→0である。
以上のような特徴を持つ関数として、第1の実施形態では、(2)式により雑音スペクトル補正関数fC(r)を定義する。(2)式におけるexp(−r)は、指数関数である。
fC(r)=1−exp(−r) …(2)
雑音スペクトルPN(k)の補正は、入力スペクトルPX(k)と雑音スペクトルPN(k)との比である音声対雑音比R(k)=PX(k)/PN(k)を用いて行う。ここで、音声対雑音比R(k)を雑音スペクトル補正関数fC(r)に入力して得た値C(k)=fC(R(k))を雑音スペクトル補正係数C(k)と定義する。
雑音スペクトル補正処理部105は、雑音スペクトル補正係数C(k)を用いて雑音スペクトルPN(k)を(3)式に従って補正し、補正雑音スペクトルPNC(k)を出力する。
PNC(k)=C(k)*PN(k) …(3)
スペクトルゲイン算出処理部106は、入力スペクトルPX(k)と補正雑音スペクトルPNC(k)に基づいて、スペクトルゲインG(k)を(4)式に従って算出する。(4)式は(2)式と(3)式を用いると、(5)式のように変形することができる。雑音スペクトル補正関数fC(r)について(6)式が成り立つことから、(5)式の右辺第2項は1以下の値をとり、このことから、スペクトルゲインG(k)はG(k)≧0となるので、スペクトルゲインG(k)が負になることはない。
G(k)=1−PNC(k)/PX(k) …(4)
G(k)=1−fC(R(k))/R(k) …(5)
fC(r)≦r …(6)
スペクトルゲイン時間平滑化処理部107は、スペクトルゲイン算出処理部106が出力したスペクトルゲインG(k)と過去に算出した平滑化スペクトルゲインGSpast(k;m)(但し、m=1,2,…,Mg、また、GSpast(k;m)はm回前に出力した平滑化スペクトルゲインを意味する)とを用いて現在の平滑化スペクトルゲインGS(k)を出力する。時間平滑化には任意の方式を用いることができるが、(7)式に示すような時定数フィルタを用いるのが簡単で効率的である。(7)式におけるTCGは、0≦TCG≦1の範囲内の値をとる時定数である。例えば、45ms程度の時定数を使うのは好ましい。
GS(k)=TCG*GSpast(k;1)+(1−TCG)*G(k)…(7)
フィルタリング処理部108は、入力複素スペクトルX(k)に平滑化スペクトルゲインGS(k)を乗じることによってフィルタリングを行い、出力複素スペクトルY(k)を出力する。
波形合成処理部109は、出力複素スペクトルY(k)を時間波形に戻して雑音が抑圧された出力信号y(t)を出力する。
なお、必要に応じて、デジタル信号でなる出力信号y(t)をアナログ信に変換するD/A変換部を、波形合成処理部109の後段に設けるようにしても良い。
(A−2)第1の実施形態の動作
次に、第1の実施形態に係る雑音抑圧装置100の動作(第1の実施形態の雑音抑圧方法)を説明する。
デジタル音声信号でなる入力音声x(t)が雑音抑圧装置100に入力されると、周波数解析処理部101によって、入力音声x(t)の周波数解析が実行され、得られた入力複素スペクトルX(k)がパワー算出処理部102及びフィルタリング処理部108に与えられる。
パワー算出処理部102によって、入力複素スペクトルX(k)のパワー又は振幅が要素ごとに計算され、得られた入力スペクトルPX(k)が雑音スペクトル推定処理部104、雑音スペクトル補正処理部105及びスペクトルゲイン算出処理部106に与えられる。また、音声区間検出処理部103によって、入力音声x(t)が音声区間か雑音区間かが判定され、音声区間検出結果Vが雑音スペクトル推定処理部104に与えられる。
雑音スペクトル推定処理部104によって、入力スペクトルPX(k)と過去に推定したMv個の雑音スペクトルPNpast(k;m)とから現在の雑音スペクトルPN(k)が推定され、雑音スペクトル補正処理部105に与えられる。そして、雑音スペクトル補正処理部105によって、入力スペクトルPX(k)に基づき、かつ、上述した特徴(ア)〜(キ)を有する、(2)式に一例を示す雑音スペクトル補正関数fC(r)が適用されて、雑音スペクトルPN(k)が補正され、得られた補正雑音スペクトルPNC(k)がスペクトルゲイン算出処理部106に与えられる。
スペクトルゲイン算出処理部106によって、入力スペクトルPX(k)と補正雑音スペクトルPNC(k)とに基づいて、スペクトルゲインG(k)が算出されて、スペクトルゲイン時間平滑化処理部107に与えられる。そして、スペクトルゲイン時間平滑化処理部107によって、スペクトルゲインG(k)と過去に算出した平滑化スペクトルゲインGSpast(k;m)とが適用されて、現在の平滑化スペクトルゲインGS(k)が算出され、フィルタリング処理部108に与えられる。
フィルタリング処理部108によって、入力複素スペクトルX(k)に平滑化スペクトルゲインGS(k)が乗算され、得られた出力複素スペクトルY(k)が波形合成処理部109に与えられる。最後に、波形合成処理部109によって、出力複素スペクトルY(k)が時間波形に戻されて雑音が抑圧された出力信号y(t)が得られる。
次に、第1の実施形態に係る雑音抑圧装置100がミュージカルノイズを抑圧する仕組みを説明する。
雑音スペクトル補正関数fC(r)の重要な特徴は、r(=音声対雑音比R(k))が1付近でのfC(r)の傾きが小さいこと、及び、fC(0)=0である。
特許文献2で明らかにされているように、音声対雑音比rが1付近の値を取るとき、雑音スペクトル補正関数(特許文献2中のゲイン関数)の傾きが大きいとスペクトルゲインの変動が大きくなるので、孤立ゲインを生じる原因となる。ここで、ミュージカルノイズが多分に発生するSS法と比較するために、第1の実施形態における雑音スペクトル補正関数fC(r)に相当するSS法の関数を導出する。
SS法のスペクトルゲインは(8)式で表される。なお、(8)式におけるmax(A,B)はA及びBのうち大きい方を取り出す関数である。また、(8)式におけるbは、スペクトルゲインの最小値(すなわち最大抑圧量)を調整する、0≦b<1の範囲内の定数である。定数bを大きくして雑音抑圧性能を犠牲にすればミュージカルノイズの発生を多少抑圧することができる。
Gss(k)=max{1−PN(k)/PX(k),b} …(8)
雑音スペクトル補正関数fC(r)と係数C(k)は(9)式を満たすので、同様にして、(10)式に示すように、SS法の雑音スペクトル補正関数に相当する関数fCss(r)=fCss(R(k))を定義する。(10)式に(8)式を適用すると、(11)式が得られる。なお、(11)式におけるmin(A,B)はA及びBのうち小さい方を取り出す関数である。
fC(R(k))=C(k)=R(k)*(1−G(k)) …(9)
fCss(R(k))=R(k)*(1−Gss(k)) …(10)
fCss(r)=min{1,r*(1−b)} …(11)
図2に、雑音スペクトル補正関数の概形(入出力の関係)を示す。点線、破線及び実線はそれぞれb=0のfCss(r)、b=0.1のfCss(r)及びfC(r)を表している。この図2から分かるように、第1の実施形態のr=1付近での雑音スペクトル補正関数fC(r)の傾きは、SS法の雑音スペクトル補正関数fCss(r)に比べて緩やかになっているため、孤立ゲインの発生を抑制することができる。なお、SS法でも、bをより大きな値に設定すれば当該関数fCss(r)の傾きを緩くすることができるので、孤立ゲインの発生を抑制することができるが、雑音抑圧性能が小さくなる。
図3に、SS法と第1の実施形態の音声対雑音比rとスペクトルゲインGss(k)、G(k)との関係を示す。図3(A)は、縦軸がスペクトルゲインGss(k)、G(k)の値そのものであり、図3(B)は、縦軸がスペクトルゲインGss(k)、G(k)の値をデシベル表記したものとなっている。
SS法のスペクトルゲインGss(k)はbが最小値となっているが、第1の実施形態は、rが小さくなると共にスペクトルゲインG(k)も小さくなって、b以下のゲイン値となっていることから、第1の実施形態は孤立ゲインの発生を抑制しても高い雑音抑圧性能を保持できる。
また、特許文献3に明らかにされているように、入力スペクトルの谷の凹凸はミュージカルノイズの原因となる。入力スペクトルの谷では、ほとんど雑音成分しか含まれないために、音声対雑音比R(k)はR(k)<1となっているはずである。第1の実施形態における雑音スペクトル補正関数fC(r)は、rすなわち音声対雑音比R(k)が0に近付くと0に収束するので、当該凹凸を知覚できないように抑圧する。それ故、ミュージカルノイズの発生を抑制することができる。
以上の特徴を有する雑音スペクトル補正関数C(k)を雑音スペクトルPN(k)に乗じた補正雑音スペクトルPNC(k)は、音声対雑音比R(k)が大きい場合、すなわち、雑音成分に比べて音声成分が十分大きい場合には、雑音スペクトルPN(k)とほぼ等しく、音声対雑音比R(k)が小さい場合、すなわち、雑音成分に比べて音声成分が同程度か小さい場合には雑音スペクトル補正関数C(k)によって小さく補正され、音声対雑音比R(k)がR(k)=0の場合、すなわち、音声成分が含まれない場合には0となる。また、(6)式の両辺にPN(k)を乗じることにより、(12)式が成り立つので、補正後の雑音スペクトルが入力スペクトルより大きくなることはない。
PNC(k)≦PX(k) …(12)
(12)式が成り立つことは、スペクトルゲインや出力スペクトルが負にならないことを意味していることから、そのような不自然さに対処するための後処理が不要となるというアルゴリズム上の利点も得られる。さらに、雑音スペクトル補正関数fC(r)は無限階微分可能であることにより、上記の補正処理は極めて滑らかに行われるため、第1の実施形態のスペクトルゲインG(k)には周波数方向の孤立ゲインが生じない。
従来技術の中には、出力スペクトルを時間方向及び周波数方向の両方向に平滑化する方法があるが、周波数方向の平滑化は音声成分のスペクトルを変形させてしまう。このために、出力信号に新たな歪みが生じるという問題があった。一方、第1の実施形態は、雑音スペクトルを適応的に抑制するかのような雑音スペクトル補正係数を乗じる方式なので、音声成分のスペクトルは変形させない。従って、出力信号の歪みも最小限に抑えることができる。
スペクトルゲインの時間平滑化は、2つの意味でミュージカルノイズを抑圧する。
第1に、音声成分と雑音成分の相互相関項の影響を軽減する。相互相関項の時間に関する期待値が0なので、時間平滑化を行うことでその影響を軽減することができる。スペクトルゲインG(k)の算出において、雑音成分は雑音スペクトル推定処理部104で既に時間平滑化されているが、音声成分については手つかずとなっている。そこで、スペクトルゲインを時間平滑化することにより、スペクトルゲインの音声成分に起因する要素と雑音成分に起因する要素の両方を平滑化することができるので、相互相関項の影響を軽減することができる。
第2に、スペクトルゲインG(k)に生じる孤立ゲインを直接平滑化して除去する。スペクトルゲインG(k)を算出した段階では、上記の相互相関項の影響が残っているために、時間方向の孤立ゲインが生じる。孤立した成分を除去する最も簡単な方法は、孤立成分を平滑化することである。スペクトルゲインの時間平滑化は、フィルタ特性の更新、追従に遅延が生じるもののフィルタ特性自体にはあまり影響を与えないので、出力信号に歪みが生じ難い処理である。
従って、スペクトルゲインG(k)の時間平滑化は、G(k)に存在する時間方向の孤立ゲインを抑圧できる。
以上をまとめると、第1の実施形態は、まず雑音スペクトル補正によって周波数方向の孤立ゲインを抑圧し、次にスペクトルゲインの時間平滑化によって時間方向の孤立ゲインを抑圧する。これら2つの処理によって孤立ゲインは大幅に抑圧されるので、孤立周波数成分、すなわちミュージカルノイズを抑圧することができる。
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、音声スペクトルを変形させないので出力信号の歪みを最小限に抑えることができ、スペクトルゲインの孤立ゲインを解消することにより孤立周波数成分の発生を抑圧しているので、ミュージカルノイズを発生させずに雑音を抑圧することができる。これにより、従来よりも歪みの少ない聴き心地の良い雑音抑圧信号を得ることができる。
(B)第2の実施形態
次に、本発明に係る雑音抑圧装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
第2の実施形態に係る雑音抑圧装置の構成も、上述した第1の実施形態の説明で用いた図1で表すことができる。
しかし、第2の実施形態の場合、雑音スペクトル補正処理部105が利用する雑音スペクトル補正関数fC(r)が第1の実施形態のものとは異なっている。第2の実施形態における雑音スペクトル補正関数fC(r)の概形を図4に示している。第2の実施形態は、雑音抑圧量を調整できる実施形態である。
第1の実施形態の雑音抑圧装置はミュージカルノイズを発生させないが、図3(A)及び図3(B)から分かるように、r(=音声対雑音比R(k)=PX(k)/PN(k))がおおよそ−10〜10dBの間では、SS法に比べて雑音抑圧量があまり大きくなかった。そこで、第2の実施形態では雑音抑圧量を調整できるように、(13−1)式及び(13−2)式によって雑音スペクトル補正関数fC(r)を定義する。
fC(r)=r (r≦THRのとき) …(13−1)
fC(r)=THR
+(1−THR)*(1−exp(−(r−THR)/(1−THR)))
(r>THRのとき) …(13−2)
ここで、THRは0≦THR≦1の範囲内の値をとる閾値である。THR=0で第1の実施形態と同じとなり、THR=1でSS法((11)式参照)と同じとなる。図4は、THR=0の場合(第1の実施形態参照)と、THR=0.1の場合(第2の実施形態で特有な場合)について雑音スペクトル補正関数fC(r)の概形を示しており、図5は、これらの2つの場合について、音声対雑音比rとスペクトルゲインG(k)との関係を示している。図5(A)は、縦軸がスペクトルゲインG(k)の値そのものであり、図5(B)は、縦軸がスペクトルゲインG(k)の値をデシベル表記したものとなっている。図4及び図5において、実線がTHR=0の場合を、一点鎖線がTHR=0.1の場合を示している。
図4及び図5から、第2の実施形態の場合、第1の実施形態に比べて雑音抑圧量が強くなっていることが分かる。一方、音声対雑音比R(k)に対するスペクトルゲインの滑らかさは変わらないため、第1の実施形態と同様にミュージカルノイズの発生と音声成分の歪みを抑圧することができる。
以上のように、第2の実施形態によれば、雑音がより強く抑圧されたクリアな雑音抑圧信号を得ることができる。
(C)第3の実施形態
次に、本発明に係る雑音抑圧装置、方法及びプログラムの第3の実施形態を、図面を参照しながら説明する。
第3の実施形態に係る雑音抑圧装置の構成も、上述した第1や第2の実施形態の説明で用いた図1で表すことができる。
しかし、第3の実施形態の場合、雑音スペクトル補正処理部105が利用する雑音スペクトル補正関数fC(r)が第1や第2の実施形態のものとは異なっている。第3の実施形態における雑音スペクトル補正関数fC(r)の概形を図6に示している。第1の実施形態及び第2の実施形態では、雑音スペクトル補正関数fC(r)を滑らかな関数によって定義していたのに対して、第3の実施形態では、音声対雑音比r(=R(k))の領域を少なくとも3つ以上の区間に分けて、各区間では雑音スペクトル補正関数fC(r)を直線(1次関数)で定義し、それらを各区間の境界で連続的に接続することで、雑音スペクトル補正関数fC(r)を滑らかでない関数によって定義する点が異なる。以下、第3の実施形態の雑音スペクトル補正関数fC(r)について詳しく述べる。
各区間の直線は、雑音スペクトル補正関数fC(r)が、第1の実施形態で述べた雑音スペクトル補正関数に関する3つの特徴(ア)〜(ウ)を満たしている限りにおいて、任意に定義することができる。例えば、第1の実施形態における(2)式、又は、第2の実施形態における(13−1)式及び(13−2)式を、各区間で近似した1次関数を各区間の直線とするようにしても良い。また例えば、音声対雑音比rに対して指数関数的に増加する区間を設定し、それぞれの区間で1次のテイラー展開を行ってそれらを繋げば、第1の実施形態及び第2の実施形態と同等の特性が得られる。
(2)式で表される関数に対し、音声対雑音比rを指数関数的に増加する5つの区間に分けて1次のテイラー展開によって近似した例を、図6及び図7に示す。図6において、破線は(2)式で表される関数の概形を表し、実線は(2)式で表される関数の近似関数の概形を表している。図7は、(2)式で表される関数の近似関数の特徴量を整理して示す図表である。
図6からは、音声対雑音比rの範囲を5つの区間に分けただけでも誤差の小さな近似関数が得られることが分かる。実際には、音声対雑音比rが小さい部分をより正確に近似する方が好ましい。例えば、区間番号2のテイラー展開の基準点をr=0.125として、図7のようにテイラー展開の基準点を前の区間の2倍としながら8つの区間に分ければ、十分良い近似関数が得られる。
第3の実施形態のように雑音スペクトル補正関数fC(r)を定義することによって、コンピュータなどに実装する際に、第1の実施形態及び第2の実施形態と同等の特性をより、簡単な構成で実現することが可能となる。
第3の実施形態によれば、第1の実施形態及び第2の実施形態に比べてより簡単な構成で同等の特性を得ることができるので、より軽量な演算によって性能を落とすことなく雑音抑圧信号を得ることができる。
(D)第4の実施形態
次に、本発明に係る雑音抑圧装置、方法及びプログラムの第4の実施形態を、図面を参照しながら説明する。
第4の実施形態に係る雑音抑圧装置の構成も、上述した第1〜第3の実施形態の説明で用いた図1で表すことができる。
しかし、第4の実施形態の場合、雑音スペクトル補正処理部105が利用する雑音スペクトル補正関数fC(r)が第1〜第3の実施形態のものとは異なっている。第4の実施形態における雑音スペクトル補正関数fC(r)の概形を図8に示している。
第1〜第3の実施形態では、雑音スペクトル補正関数fC(r)を連続関数によって定義していたのに対して、この第4の実施形態は、音声対雑音比rの領域を少なくとも3つ以上の区間に分けて、音声対雑音比rに従って雑音スペクトル補正関数fC(r)の値を段階的に与えることで、雑音スペクトル補正関数fC(r)を連続関数でない関数によって定義する点が第1〜第3の実施形態とは異なっている。以下、第4の実施形態の雑音スペクトル補正関数fC(r)について詳しく述べる。
第4の実施形態の雑音スペクトル補正関数fC(r)を定義するため、音声対雑音比rに対する境界値BR(n)(但し、n=1,2,…,N+1、また、N≧3)を導入し、n=1,2,…,Nの各境界値BR(n)に対応する雑音スペクトル補正関数fC(r)の値CC(n)を設定する。そして、音声対雑音比rがBR(n)≦r<BR(n+1)の範囲内なら、雑音スペクトル補正関数fC(r)の値を、境界値BR(n)での雑音スペクトル補正関数fC(r)の値CC(n)にするように関数を定義する。但し、雑音スペクトル補正関数fC(r)が第1の実施形態で述べた雑音スペクトル補正関数の3つの特徴(ア)〜(ウ)を満たすために、BR(1)=0、CC(1)=0、BR(N+1)=+∞、CC(N)=1とし、n=2,…,N−1に対して、境界値BR(n)での雑音スペクトル補正関数fC(r)の値CC(n)が0<CC(n)<1の範囲内の値にする。各区間の値の目安として、第1の実施形態で言及した(2)式や、第2の実施形態で言及した(13−1)式、(13−2)式を参考にするのは、好ましいことである。
N=7による第4の実施形態の雑音スペクトル補正関数fC(r)の実現例を図8及び図9に示している。図8は、第4の実施形態の雑音スペクトル補正関数fC(r)の概形を表している。図9は、境界値BR(n)と、その境界値BR(n)での雑音スペクトル補正関数fC(r)の値CC(n)との対応を示す図表である。
第4の実施形態によれば、第1〜第3の実施形態に比べてより自由に減衰特性を設定することができ、雑音の特徴や環境に対する最適化を行うことができるので、ミュージカルノイズの発生を抑えつつより雑音抑圧性能の高い雑音抑圧信号を得ることができる。
(E)第5の実施形態
次に、本発明に係る雑音抑圧装置、方法及びプログラムの第5の実施形態を、図面を参照しながら説明する。
図10は、第5の実施形態の雑音抑圧装置100Aの構成を示す機能ブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図10において、第5の実施形態の雑音抑圧装置100Aは、周波数解析処理部101、パワー算出処理部102、重み係数算出処理部110、雑音スペクトル推定処理部104A、雑音スペクトル補正処理部105、スペクトルゲイン算出処理部106、スペクトルゲイン時間平滑化処理部107、フィルタリング処理部108及び波形合成処理部109を有する。第5の実施形態は、第1の実施形態に比較して、音声信号検出処理部103に代わって重み係数算出処理部110が設けられている点、雑音スペクトル推定処理部104Aが重み係数算出処理部110から与えられた重み係数W(k)をも適用して雑音スペクトルPN(k)を推定している点が、第1の実施形態とは異なっている。第5の実施形態の雑音スペクトル推定処理部104Aによる、重み係数算出処理部110が算出した重み係数を用いた雑音推定方法は公知の既存技術となっており、第5の実施形態は、第1の実施形態以外の既存技術を適用した実施形態になっている。
重み係数算出処理部110には、周波数解析処理部101から入力スペクトルPX(k)が与えられ、雑音スペクトル推定処理部104Aから推定雑音スペクトルPN(k)が与えられる。重み係数算出処理部110は、入力スペクトルPX(k)と前回の推定雑音スペクトルPNpast(k;1)とを用いて、今回の音声対雑音比の推定値Rpast(k)=PX(k)/PNpast(k;1)を算出した後、(14−1)式〜(14−3)式によって、推定雑音スペクトルPNpast(k;1)が入力スペクトルPX(k)に比較して大きいときほど大きくなる重み係数W(k)を算出する。(14−1)式〜(14−3)式において、R1とR2は事前に定めておく定数であり、例えば、R1=1、R2=10を適用することは好ましい態様の一つである。
W(k)=1 (Rpast(k)<R1のとき) …(14−1)
W(k)=(Rpast(k)−R2)/(R1−R2)
(R1≦Rpast(k)<R2のとき) …(14−2)
W(k)=0 (R2≦Rpast(k)のとき) …(14−3)
雑音スペクトル推定処理110は、入力スペクトルPX(k)と過去に推定した雑音スペクトルPNpast(k;m)と重み係数W(k)を用いて、雑音スペクトルPN(k)を推定する。具体例としては、W(k)*PX(k)とPNpast(k;m)の平均をとる方法を挙げることができる。平均の取り方には任意の方法を適用できるが、例えば、第1の実施形態と同様に、(15)式に示すような時定数TCNを用いた方法を適用できる。
PN(k)=TCN*PNpast(k;1)
+(1−TCN)*W(k)*PX(k) …(15)
第5の実施形態によれば、雑音スペクトルの推定において、第1の実施形態と比べて非定常な雑音への追従特性や音声区間中の雑音の変化への追従特性が優れていることから、より雑音が適切に抑圧されたクリアな雑音抑圧信号を得ることができる。
(F)他の実施形態
上記第5の実施形態は、第1の実施形態をベースとしながら、雑音スペクトルPN(k)の推定方法を第1の実施形態から変更したものを示したが、第2〜第4の実施形態のいずれかをベースとしながら、雑音スペクトルPN(k)の推定方法をその実施形態の推定方法から、第5の実施形態で言及した方法に変更するようにしても良い。
上記各実施形態では、雑音抑圧装置にデジタル音声信号が入力されるものを示したが、入力スペクトルが雑音抑圧装置に入力される場合にも、本発明を適用することができる。例えば、対向する装置から、通信回線を介して転送されてくる信号が入力スペクトルX(k)の場合には、それをデジタル音声信号に変換することなく、雑音抑圧装置に入力するようにしても良い。この場合の雑音抑圧装置は、図1や図10から周波数解析処理部101を省略したものとなる。
上記各実施形態では、SS法をベースとした雑音抑圧装置を示したが、上記実施形態のようなSS法をベースとした雑音抑圧方法と、他の雑音抑圧方法(例えば、ウィナーフィルタ、コヒーレンスフィルタ、ボイススイッチなど)のいずれか1つ以上とを併用して、雑音抑圧装置を構成するようにしても良い。
100、100A…雑音抑圧装置、101…周波数解析処理部、102…パワー算出処理部、103…音声区間検出処理部、104、104A…雑音スペクトル推定処理部、105…雑音スペクトル補正処理部、106…スペクトルゲイン算出処理部、107…スペクトルゲイン時間平滑化処理部、108…フィルタリング処理部、109…波形合成処理部、110…重み係数算出処理部。

Claims (17)

  1. 入力音声を周波数解析した入力スペクトルから、上記入力音声に重畳されている雑音を抑圧する雑音抑圧装置において、
    上記入力スペクトルに基づいて雑音スペクトルを推定する雑音スペクトル推定手段と、
    推定された上記雑音スペクトルを上記入力スペクトルに応じて補正する雑音スペクトル補正手段とを備え、
    上記雑音スペクトル補正手段は、上記入力スペクトルを構成する音声成分と雑音成分に対して、
    上記音声成分が上記雑音成分に比べて十分大きい場合には、上記補正雑音スペクトルを推定された上記雑音スペクトルとほぼ同じにし、
    上記音声成分が上記雑音成分に比べて小さい又は同程度の場合には、上記入力スペクトルと推定された上記雑音スペクトルとの比に応じて上記補正雑音スペクトルが小さくなるように調整し、
    上記音声成分の占める割合が0に近付くと上記補正雑音スペクトルが0に収束するように、推定された上記雑音スペクトルを補正する
    ことを特徴とする雑音抑圧装置。
  2. 上記雑音スペクトル推定手段は、
    上記入力音声を分析して音声区間か雑音区間かを判断し、
    上記入力音声が雑音区間である場合には、上記入力スペクトルに基づいて上記雑音スペクトルを推定更新して出力し、
    上記入力音声が音声区間である場合には、前回の上記雑音スペクトルの推定値を出力する
    ことを特徴とする請求項1に記載の雑音抑圧装置。
  3. 上記雑音スペクトル推定手段は、
    上記入力スペクトルと過去の上記雑音スペクトルの推定値に基づいて当該入力音声の音声対雑音比を推定し、
    推定された上記音声対雑音比によって上記雑音スペクトルの更新幅を制御しながら、上記入力スペクトルに基づいて上記雑音スペクトルを推定更新して出力する
    ことを特徴とする請求項1に記載の雑音抑圧装置。
  4. 上記雑音スペクトル補正手段は、上記音声成分及び上記雑音成分に応じた所定の雑音スペクトル補正関数を用いて、推定された上記雑音スペクトルを補正し、
    上記雑音スペクトル補正関数は、
    上記音声成分の上記雑音成分に対する音声対雑音比の単調非減少関数であって、
    上記音声対雑音比が0の場合には関数値が0となり、
    上記音声対雑音比が無限に大きくなると関数値が1に収束する
    ものであることを特徴とする請求項1〜3のいずれかに記載の雑音抑圧装置。
  5. 上記雑音スペクトル補正関数には上記音声対雑音比に関する1階の導関数が存在し、
    上記1階の導関数は、
    単調非増加関数であり、
    上記音声対雑音比が0の場合には関数値が1となり、
    上記音声対雑音比が無限に大きくなると関数値が0に収束する
    ものであることを特徴とする請求項4に記載の雑音抑圧装置。
  6. 上記雑音スペクトル補正関数は、上記音声対雑音比に関して無限回微分可能であることを特徴とする請求項5に記載の雑音抑圧装置。
  7. 上記雑音スペクトル補正関数fC(r)は、上記音声対雑音比をrとして、fC(r)=1−exp(r)で表現されることを特徴とする請求項6に記載の雑音抑圧装置。
  8. 上記雑音スペクトル補正関数は、上記音声対雑音比が事前に定められた所定の閾値以下の場合には上記音声対雑音比と等しい値をとることを特徴とする請求項4に記載の雑音抑圧装置。
  9. 上記雑音スペクトル補正関数には、上記音声対雑音比に関する1階の導関数が存在し、
    上記1階の導関数は、
    単調非増加関数であり、
    上記音声対雑音比が上記閾値以下の場合には関数値が1となり、
    上記音声対雑音比が無限に大きくなると関数値が0に収束する
    ものであることを特徴とする請求項8に記載の雑音抑圧装置。
  10. 上記雑音スペクトル補正関数は、上記音声対雑音比が上記閾値以上の場合には、上記音声対雑音比に関して無限回微分可能であることを特徴とする請求項9に記載の雑音抑圧装置。
  11. 上記音声対雑音比rに対する0〜1の範囲内の所定の閾値THRを事前に定めておき、
    上記雑音スペクトル補正関数fC(r)は、
    r≦THRの場合にはfC(r)=rであり、
    r>THRの場合にはfC(r)=THR+(1−THR)*(1−exp(−(r−THR)/(1−THR)))である
    ことを特徴とする請求項10に記載の雑音抑圧装置。
  12. 上記雑音スペクトル補正関数は、
    上記音声対雑音比rの領域が少なくとも3つ以上の区間に分けられ、
    上記各区間内においては1次関数で定義され、
    上記1次関数は上記各区間の境界で連続的に接続されている
    ことを特徴とする請求項4又は8に記載の雑音抑圧装置。
  13. 上記雑音スペクトル補正関数における上記各区間の上記1次関数は、f(r)=1−exp(r)で表現される関数f(r)を上記区間ごとに線形近似した1次関数であることを特徴とする請求項12に記載の雑音抑圧装置。
  14. 上記音声対雑音比rに対する0〜1の範囲内の所定の閾値THRを事前に定め、r≦THRの場合にはf(r)=rであり、r>THRの場合にはf(r)=THR+(1−THR)*(1−exp(−(r−THR)/(1−THR)))である関数f(r)を定義したとき、
    上記雑音スペクトル補正関数における上記各区間の上記1次関数は、上記関数f(r)を上記区間ごとに線形近似した1次関数である
    ことを特徴とする請求項12に記載の雑音抑圧装置。
  15. 上記雑音スペクトル補正関数は、上記音声対雑音比rの領域が少なくとも3つ以上の区間に分けられ、上記各区間内において一定値をとることを特徴とする請求項4に記載の雑音抑圧装置。
  16. 入力音声を周波数解析した入力スペクトルから、上記入力音声に重畳されている雑音を抑圧する雑音抑圧方法において、
    雑音スペクトル推定手段及び雑音スペクトル補正手段を備え、
    上記雑音スペクトル推定手段は、上記入力スペクトルに基づいて雑音スペクトルを推定し、
    上記雑音スペクトル補正手段は、推定された上記雑音スペクトルを上記入力スペクトルに応じて補正し、
    上記雑音スペクトル補正手段は、上記入力スペクトルを構成する音声成分と雑音成分に対して、
    上記音声成分が上記雑音成分に比べて十分大きい場合には、上記補正雑音スペクトルを推定された上記雑音スペクトルとほぼ同じにし、
    上記音声成分が上記雑音成分に比べて小さい又は同程度の場合には、上記入力スペクトルと推定された上記雑音スペクトルとの比に応じて上記補正雑音スペクトルが小さくなるように調整し、
    上記音声成分の占める割合が0に近付くと上記補正雑音スペクトルが0に収束するように、推定された上記雑音スペクトルを補正する
    ことを特徴とする雑音抑圧方法。
  17. 入力音声を周波数解析した入力スペクトルから、上記入力音声に重畳されている雑音を抑圧する雑音抑圧プログラムであって、
    コンピュータを、
    上記入力スペクトルに基づいて雑音スペクトルを推定する雑音スペクトル推定手段と、
    推定された上記雑音スペクトルを上記入力スペクトルに応じて補正するものであって、上記入力スペクトルを構成する音声成分と雑音成分に対して、上記音声成分が上記雑音成分に比べて十分大きい場合には、上記補正雑音スペクトルを推定された上記雑音スペクトルとほぼ同じにし、上記音声成分が上記雑音成分に比べて小さい又は同程度の場合には、上記入力スペクトルと推定された上記雑音スペクトルとの比に応じて上記補正雑音スペクトルが小さくなるように調整し、上記音声成分の占める割合が0に近付くと上記補正雑音スペクトルが0に収束するように、推定された上記雑音スペクトルを補正する雑音スペクトル補正手段と
    して機能させることを特徴とする雑音抑圧プログラム。
JP2012122375A 2012-05-29 2012-05-29 雑音抑圧装置、方法及びプログラム Active JP6064370B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012122375A JP6064370B2 (ja) 2012-05-29 2012-05-29 雑音抑圧装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012122375A JP6064370B2 (ja) 2012-05-29 2012-05-29 雑音抑圧装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013246418A true JP2013246418A (ja) 2013-12-09
JP6064370B2 JP6064370B2 (ja) 2017-01-25

Family

ID=49846196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012122375A Active JP6064370B2 (ja) 2012-05-29 2012-05-29 雑音抑圧装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6064370B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2878519A1 (en) 2013-11-28 2015-06-03 Kabushiki Kaisha Toyota Jidoshokki Vehicle roof structure and vehicle, and method of manufacturing vehicle roof unit
JP2016038551A (ja) * 2014-08-11 2016-03-22 沖電気工業株式会社 雑音抑圧装置、方法及びプログラム
CN106356071A (zh) * 2016-08-30 2017-01-25 广州市百果园网络科技有限公司 一种噪声检测方法,及装置
CN111862989A (zh) * 2020-06-01 2020-10-30 北京捷通华声科技股份有限公司 一种声学特征处理方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001024167A1 (fr) * 1999-09-30 2001-04-05 Fujitsu Limited Dispositif antiparasite
JP2002517020A (ja) * 1998-05-27 2002-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) スペクトル依存指数ゲイン関数平均化を用いたスペクトルサブトラクションによる信号雑音低減
JP2011191669A (ja) * 2010-03-16 2011-09-29 Sony Corp 音声処理装置、音声処理方法およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002517020A (ja) * 1998-05-27 2002-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) スペクトル依存指数ゲイン関数平均化を用いたスペクトルサブトラクションによる信号雑音低減
WO2001024167A1 (fr) * 1999-09-30 2001-04-05 Fujitsu Limited Dispositif antiparasite
JP2011191669A (ja) * 2010-03-16 2011-09-29 Sony Corp 音声処理装置、音声処理方法およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6016007778; Michael BEROUTI, et al.: 'Enhancement of Speech Corrupted by Acoustic Noise' Proc. ICASSP '79 Vol.4, 19790402, pp.208-211, IEEE *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2878519A1 (en) 2013-11-28 2015-06-03 Kabushiki Kaisha Toyota Jidoshokki Vehicle roof structure and vehicle, and method of manufacturing vehicle roof unit
JP2016038551A (ja) * 2014-08-11 2016-03-22 沖電気工業株式会社 雑音抑圧装置、方法及びプログラム
CN106356071A (zh) * 2016-08-30 2017-01-25 广州市百果园网络科技有限公司 一种噪声检测方法,及装置
CN106356071B (zh) * 2016-08-30 2019-10-25 广州市百果园网络科技有限公司 一种噪声检测方法,及装置
CN111862989A (zh) * 2020-06-01 2020-10-30 北京捷通华声科技股份有限公司 一种声学特征处理方法和装置
CN111862989B (zh) * 2020-06-01 2024-03-08 北京捷通华声科技股份有限公司 一种声学特征处理方法和装置

Also Published As

Publication number Publication date
JP6064370B2 (ja) 2017-01-25

Similar Documents

Publication Publication Date Title
JP6894580B2 (ja) ノイズと残響を減少させた音声信号を提供する信号処理装置及び方法
CN104637491B (zh) 用于内部mmse计算的基于外部估计的snr的修改器
JP4886715B2 (ja) 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
JP5153886B2 (ja) 雑音抑圧装置および音声復号化装置
CN106558315B (zh) 异质麦克风自动增益校准方法及系统
JP6064370B2 (ja) 雑音抑圧装置、方法及びプログラム
US9418677B2 (en) Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program
CN104637493A (zh) 改进噪声抑制性能的语音概率存在修改器
JP2008216721A (ja) 雑音抑圧の方法、装置、及びプログラム
JP4757775B2 (ja) 雑音抑圧装置
JP5152799B2 (ja) 雑音抑圧装置およびプログラム
CN104637490A (zh) 基于mmse语音概率存在的准确正向snr估计
JP5152800B2 (ja) 雑音抑圧評価装置およびプログラム
JP6361148B2 (ja) 雑音推定装置、方法及びプログラム
JP6182862B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP2002140100A (ja) 騒音抑圧装置
JP6707914B2 (ja) ゲイン処理装置及びプログラム、並びに、音響信号処理装置及びプログラム
JP6073185B2 (ja) 波形変換装置および波形変換方法
JP5131149B2 (ja) 雑音抑圧装置及び雑音抑圧方法
US10109291B2 (en) Noise suppression device, noise suppression method, and computer program product
JP5056654B2 (ja) 雑音抑制装置、及び雑音抑制方法
Une et al. Evaluation of sound quality and speech recognition performance using harmonic regeneration for various noise reduction techniques
JP6536322B2 (ja) 雑音推定装置、プログラム及び方法、並びに、音声処理装置
JP7092324B2 (ja) 声門流成分推定装置、プログラムおよび方法
JP2013130815A (ja) 雑音抑圧装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160322

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160523

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20160523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161205

R150 Certificate of patent or registration of utility model

Ref document number: 6064370

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150