JP3264831B2 - 背景雑音消去装置 - Google Patents
背景雑音消去装置Info
- Publication number
- JP3264831B2 JP3264831B2 JP15379096A JP15379096A JP3264831B2 JP 3264831 B2 JP3264831 B2 JP 3264831B2 JP 15379096 A JP15379096 A JP 15379096A JP 15379096 A JP15379096 A JP 15379096A JP 3264831 B2 JP3264831 B2 JP 3264831B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency
- background noise
- window function
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Monitoring And Testing Of Transmission In General (AREA)
- Noise Elimination (AREA)
Description
いて音声信号に重畳されている背景雑音を除去する背景
雑音消去装置(ノイズキャンセラ)に関するものであ
る。
は、下記文献に開示されるものがあった。
におけるスペクトル変形回復の一方法」、電子情報通信
学会技術研究報告、EA95−57、1995年11月』 図2は、この文献に開示されている従来技術の概略構成
を示すブロック図である。
源から発せられた雑音Nはマイクロホン100に入力さ
れる。マイクロホン100に入力された信号は、アナロ
グ/デジタル変換器(A/D変換器、図示せず)でデジ
タル信号に変換され、簡易周波数サブトラクション処理
部101へと入力される。
において、入力された信号はまず、高速フーリエ変換処
理(以下、FFT処理と呼ぶ)を施され、周波数領域の
信号に変換される。周波数領域の信号に変換された信号
S(k) は、(1) 式及び(2) 式に従って、簡易周波数サブ
トラクション処理(簡易スペクトルサブトラクション処
理)が施された信号S’(k) に変換される。この変換後
信号S’(k) は、対数変換が施された後、スペクトル修
復部103に出力される。簡易周波数サブトラクション
処理は、入力信号の全てのスペクトル包絡に対する低レ
ベル制限処理である。
色雑音環境を疑似する低レベル制限直線関数であり、N
は高速フーリエ変換の点数であり、kはN点中のk番目
のスペクトル線を示し、TH1及びTH2(TH1<T
H2)は予め定められる、低レベル制限直線関数th
(k) を規定する閾値である。
た信号(S’(k) )の処理過程を説明する。
部101で処理された信号S’(k)の例である。
ために、簡易周波数サブトラクション処理部101での
処理後(低レベルの抑圧処理後)は、音声信号だけの場
合におけるスペクトルの小さい部分での谷間が欠如した
ものとなっている。スペクトル修復部103は、以下に
説明するように、スペクトルパワーの小さい谷間の部分
を推定して修復する。すなわち、谷間の左側については
(3) 式の直線関数THL(f) で、谷間の右側については
(4) 式の直線関数THL(f) で、谷間を修復する。
ルを疑似する(5) 式で表される直線関数であり、0〜ナ
イキスト周波数の範囲で0(=TH1)〜−10dB
(=TH2)となっている。また、W(f) は、谷の深さ
を疑似する(6) 式で表される直線関数であり、0〜ナイ
キスト周波数で−30(=TH3)〜−40dB(=T
H4)と固定している。また、修復する谷の数は、周波
数の下方から2個までと限定している。
f3は1.2kHz以降であり、入力信号S’(k) と雑
音レベル疑似関数P(f) との交点であり、周波数f2は
周波数軸上での周波数f1及びf3の2点の中点であ
る。また、第2の谷については、f3以降で周波数であ
り、入力信号S’(k) が雑音レベル疑似P(f) を上から
下に横切る交点を新たに周波数f4として周波数f1と
同様に扱うと共に、次の交点を周波数f6として周波数
f3と同様に扱う。ここでも、周波数f4及びf6の周
波数軸上での中点を周波数f5とし、前述の周波数f2
と同様に扱う。
数が上限であるナイキスト周波数まで検索しても見つか
らないときにはナイキスト周波数を持って周波数f3又
はf6に代えて用いる。前者の場合は、谷の数は1個と
なる。図3は、周波数f6に相当の周波数がナイキスト
周波数まで達した例である。
を復元した信号を、内蔵する部分平滑処理部において、
信号の高周波数領域を平滑化し、内蔵する逆FFT処理
部において、逆FFT処理を施して時間軸信号に戻し、
出力端子104より次段の音声信号処理回路に出力して
いた。
数サブトラクション処理及びスペクトル修正処理を通じ
て、背景雑音を軽減した後、音声スペクトルを修復して
音声スペクトルを強調した信号を得るようにしていた。
の背景雑音消去方法及び装置では、以下に述べるような
課題を有するものであった。
景雑音の状態にも依存するため、通常は未知であり、従
来のように予め固定の関数に設定できないものであり、
固定関数としていると、修復された音声スペクトルが実
際の音声スペクトルとかなり異なることも生じている。
る谷間の数を周波数下方から2個までと限定している
が、実際には、下方からの数が2よりも多く必要になる
場合があり、音声通信等に、この谷間の数の制限を有す
る従来方法を直接応用すると、音声が不自然になって通
話品質が悪くなる。
さ疑似関数W(f) について、第2の谷間より周波数軸で
上方の特性にも近似直線を利用するため、実際の音声信
号の周波数成分は低域の方が周波数パワーが大きく、高
域の方が周波数パワーが小さいという音声の一般的な性
質が反映されず、高域雑音成分を残り、音声通信等に、
従来方法を直接応用すると著しく音感を損ねてしまう。
方法は有声音に有効な方法であり、そのため、予め測定
した無雑音状況での判定結果を流用して有声部及び無声
部の判定を実行しているが、実用では、実際に入手でき
る信号はなにがしかの雑音が混入した上での信号であ
り、雑音の混入を前提とした有声成分信号及び無声成分
信号化の判断を行なう必要があり、従来技術で実際の音
声通信システム等に対する実装が不可能なレベルにあ
る。
が高い、周波数サブトラクション(スペクトルサブトラ
クション)処理を利用した背景雑音消去装置が求められ
ている。
め、本発明においては、音声信号に重畳されている背景
雑音を除去する背景雑音消去装置を、以下の各手段を有
するように構成したことを特徴とするものである。
周波数軸上の信号に変換する時間軸/周波数軸変換手段
と、(2) 入力音響信号が背景雑音だけか、入力音響信号
が音声信号を含むか、音声信号を含む場合に有声音か無
声音かを判別する信号種別判定手段と、(3) 時間軸/周
波数軸変換手段で変換された周波数軸上の音響信号に基
づいて、入力音響信号が背景雑音だけのときだけに入力
音響信号に追従しながら背景雑音を推定した推定雑音信
号を形成すると共に、入力音響信号が音声信号を含むと
きに、音声信号が含まれる直前の推定雑音信号を繰返し
出力する背景雑音推定出力手段と、(4) 少なくとも入力
音響信号が音声信号を含むときに、当該背景雑音推定出
力手段からの推定雑音信号に第1の係数を乗算する第1
の乗算手段と、(5) 時間軸/周波数軸変換手段で変換さ
れた周波数軸上の音響信号から、第1の係数が乗算され
た推定雑音信号を減じる第1の雑音消去演算手段と、
(6)この第1の雑音消去演算手段からの出力信号又は時
間軸/周波数軸変換手段からの出力信号の周波数特性に
応じて、窓関数を作成する適応窓関数発生手段と、(7)
第1の雑音消去演算手段からの出力信号のスペクトル
を、上記窓関数発生手段が作成した窓関数に応じて修正
するスペクトル修正手段と、(8) 入力音響信号に有声音
の音声信号があるときに、スペクトル修正手段からの出
力信号を選択し、入力音響信号に無声音の音声信号があ
るときに、第1の雑音消去演算手段からの出力信号を選
択する雑音消去信号選択手段と、(9) この雑音消去信号
選択手段で選択された周波数軸上の信号を時間軸上の信
号に変換する周波数軸/時間軸変換手段とを有すること
を特徴とする。
れた音響信号に存在する音声信号が有声音か無声音かに
よって、雑音消去特性が異なる出力信号を選択できると
共に、有声音を有する音響信号に対する減衰特性の谷間
の深さを規制する窓関数を入力音響信号の内容によって
適応的に変化でき、出力信号における音感、音質を従来
より高めることができる適切な背景雑音消去を実行でき
るようになる。
を図面を参照しながら詳述する。
を示すブロック図である。
声S(t) 及び背景雑音N(t) 、又は、背景雑音N(t) だ
けでなる音響を電気信号(アナログ信号)に変換してA
/D変換器2に与えるものである。A/D変換器2は、
マイクロホン1から与えられた入力信号(アナログ信
号)を、所望のサンプリング周波数(例えば8kHz)
でデジタル信号に変換して窓関数処理部3及び時間軸信
号種別判定部10に与えるものである。
検出器11及び有声、無声判定器12から構成されてお
り、A/D変換器2からの出力信号は時間軸音声検出器
11に与えられる。なお、図4には、時間軸信号種別判
定部10の処理を説明するための模式的な信号波形図を
示している。
からの時間領域での信号x(k) に対し、音声信号の有無
を、以下のように検出する。
短時間平均ys(k) 及び長時間平均yl(k) をそれぞ
れ、(7) 式、(8) 式に従って求める。なお、各平均ys
(k) 、yl(k) の初期値は0であり、kはサンプリング
番号を示している。また、(7)式及び(8) 式の各重付け
平均係数β1、β2はそれぞれ、例えば、0.8、0.
2に選定しておく。
と、長時間平均yl(k) に所定係数δを加算した値yl
(k) +δとを比較する。そして、ys(k) <yl(k) +
δのときに「音声なし」と判定し、ys(k) ≧yl(k)
+δのときに、有声音、無声音に拘らず「音声あり」と
判定する。なお、値δは音声検出の感度を決める係数で
あり、その定め方としては種々の方法を適用し得るが、
例えば、δ=1.5×yl(k) とするようにすれば良
い。
判定結果を得たときには後述するオンオフスイッチ5を
閉成させると共に、後述する3入力1出力スイッチ17
を後述する単純減衰部16に接続されている入力端子a
を選択させるスイッチ制御信号を出力する。また、時間
軸音声検出器11は、「音声あり」の判定をしたときに
はスイッチ5は開放するスイッチ制御信号を出力する。
なお、後述するスイッチ17は、「音声あり」の場合に
は、有声、無声判定器12からの出力信号に応じて、入
力端子b又はcを選択する。また、時間軸音声検出器1
1は、「音声あり」のときには、短時間平均ys(k) 及
び長時間平均yl(k) を有声、無声判定器12に与え
る。
(k) と、有声判定閾値Lv(例えば−15dBm0)に係数
δを加算した値Lv+δとを比較する。ここで、ys
(k) ≧Lv+δであれば有声音とみなす。
ば、引き続き以下の判断を加える。すなわち、有声音と
は直ちには決定できないが、ys(k) ≧yl(k) +δで
ある「音声あり」の継続時間Δtが閾値時間Tv(例え
ば50ms)より大きいか否かを判断する。そして、Δ
t>Tvであれば「有声音あり」と判定し、Δt≦Tv
であれば「有声音なし」と判定する。
信号があるときにおいて、有声成分はレベルが大きくな
ることが多く、また、レベルが小さいときであっても、
比較的継続時間が無声成分よりも長いことを考慮したも
のである。
(「有声音なし」)と判定したときには、後述するスイ
ッチ17を入力端子bに接続させるスイッチ制御信号を
出力すると共に、有声音成分(「有声音あり」)と判定
したときには後述するスイッチ17を入力端子cに接続
させるスイッチ制御信号を出力する。
t1は有声区間と、また、時間Δt2は無声区間と判定
される例である。また、値Lvの一例として−15dBm0
を挙げ、値Tvの一例として50msを挙げたが、値L
v及びTvがこれらに限定されないことは勿論である。
られる窓関数処理部3は、入力信号に対して、予め定め
られたフレーム長毎に窓関数演算を施し、その処理後の
信号(時間領域の信号)をFFT演算器4に出力する。
ここで、窓関数としては、ハミング窓等の公知の窓関数
を用いれば良い。以下では、窓関数としてハニング窓を
適用し、1フレーム長として256サンプルに選定した
場合を意識して説明するが、これに限定されるものでは
ない。
時間領域の信号x(k) をフレーム毎に区切って、周波数
成分(周波数領域の信号)X(f) に変換する。FFT演
算器4による変換方法としては、公知の方法で良いの
で、その詳細説明は省略する。FFT演算器4によって
変換された周波数成分X(f) は、スイッチ5、加算器1
3、14、信号レベル計算部15及び単純減衰部16に
与えられる。
のであり、その後は、上述したように、時間軸音声検出
器11からのスイッチ制御信号に応じ、当該装置への入
力信号が「音声なし」の場合にのみ閉成状態をとって、
FFT演算器4からの周波数成分X(f) を背景雑音推定
部6に与えるものである。
置が立ち上げられた直後においては、背景雑音のみが入
力されると仮定している。この仮定下においては、A/
D変換器2からの出力信号x(k) 及びFFT演算器4か
らの出力信号X(f) はそれぞれ、(9) 式、(10)式に示す
ように、背景雑音成分だけとなっている。
(「音声なし」期間)においてのみ、周波数領域で背景
雑音を推定し、推定背景雑音信号N’(f) を作成する。
FFT演算器4による分析フレームが1フレーム前のも
のであり、右辺のN(f) は左辺のN’(f) とFFT演算
器4による分析フレームが同じものである。
雑音平均係数γを小さくすると入力信号の時間変化に敏
感に、推定雑音平均係数γを大きくすると入力信号の時
間変化に安定にN’(f) を作成することができる。この
第1の実施形態の場合、背景雑音推定部6内にカウンタ
(図示せず)を設け、当該装置全体が初期動作を開始し
たときには推定雑音平均係数γを0.2とし、雑音期間
が初期状態から160msを経過したときには推定雑音平
均係数γを0.5とし、初期状態において追従性を良好
にすると共に、ある程度追従した後では安定性を増すよ
うにしている。なお、推定雑音平均係数γの値は適用す
る用途に応じて1.0≧γの範囲で所望の設計値にして
良く、第1の実施形態の値に限定するものではない。
号があると時間軸音声検出器11で判定された場合に
は、スイッチ5が開放され、これにより、推定背景雑音
信号N’(f) は、この開放期間(すなわち「音声あり」
期間)では開放変更時点での値を継続するようになされ
ている。
ら与えられた1フレーム毎に更新される(維持される場
合を含む)推定背景雑音信号N’(f) を1フレーム期間
のみ保持するものであり、その保持した推定背景雑音信
号N’(f) を各乗算器8、9に出力するものである。
動作により、加算器14、適応窓関数発生部19及びス
ペクトル修正部18と共に、入力信号が「音声あり」の
場合の出力信号の形成に有効に機能するものであり、こ
れに対して、乗算器8は、スイッチ17の選択動作によ
り、加算器13、信号レベル計算部15及び単純減衰部
16と共に、入力信号が「音声なし」の場合(背景雑音
だけを含む期間(以下、雑音期間と呼ぶ))の出力信号
の形成に有効に機能するものである。
対して背景雑音除去係数α1(1.0≧α1≧0)を乗
算し、その出力信号N1’(f) (=α1・N’(f) )を
加算器14に対して減算入力として与えるものである。
(f) に対して背景雑音除去係数α2(1.0≧α2≧
0)を乗算し、その出力信号N2’(f) (=α2・N’
(f) )を加算器13に対して減算入力として与えるもの
である。
以下の範囲で適切に設定されるものであり、この背景雑
音除去係数α1又はα2を大きくすると雑音除去量に優
れる一方、音声混入の際には音感が不自然になり、この
背景雑音除去係数α1又はα2を小さくすると、雑音除
去特性が劣るが音感が自然になる。この実施形態では、
1.0≧α2≧α1≧0になるように選定しており、例
えば、α1=0.7、α2=0.9としている。
景雑音推定器6には、雑音期間の場合にのみ信号が入力
されるので、FFT演算器4からの出力信号はN(f) と
なっており、そのため、各乗算器9、8からの出力信号
N1’(f) 、N2’(f) はそれぞれ、上述したように、
α1・N’(f) 、α2・N’(f) となる。
らの出力信号X(f) (雑音期間ではN(f) )が入力され
ており、各加算器13、14はそれぞれ、FFT演算器
4からの出力信号X(f) から、対応する乗算器8、9か
らの出力信号N1’(f) 、N2’(f) を減算して、FF
T演算器4からの出力信号X(f) に対する雑音消去を行
なう。
号があろうがなかろうが同じ減算演算を実行するが、音
声信号がない雑音期間では、FFT演算器4からの出力
信号X(f) が雑音成分N(f) だけになっており、しか
も、背景雑音推定部6において精度良く背景雑音が推定
された場合には、推定背景雑音信号N’(f) は入力信号
における雑音成分N(f) に等しいとみなすことができる
ので、加算器14からの出力信号E1(f) は(12)式で表
すことができ、また、加算器13からの出力信号E2
(f) は(13)式で表すことができる。
は1.0≧α2≧α1≧0を満たすように選定されてい
るので、雑音期間において、加算器14からの出力信号
E1(f) は、常に、加算器13からの出力信号E2(f)
以上となっている。
とき(以下、音声期間と呼ぶ)には、上述したように、
スイッチ5が開放されて推定背景雑音信号N’(f) の更
新は停止されて、音声信号が推定雑音に対しての影響を
与えないので、加算器14からの出力信号E1(f) は(1
4)式で表すことができ、また、加算器13からの出力信
号E2(f) は(15)式で表すことができ、加算器14から
の出力信号E1(f) は、常に、加算器13からの出力信
号E2(f) 以上となる。なお、(14)式及び(15)式におけ
るS(f) は、入力音声S(t) に対するFFT演算器4か
らの成分である。
部15及びスペクトル修正部18に与えられる。また、
加算器14からの出力信号E1(f) は、スイッチ17の
入力端子b、適応窓関数発生部19及びスペクトル修正
部18に与えられる。
3からの出力信号(雑音消去処理後の信号)E2(f) の
パワーレベル情報として、(16)式に従う絶対値レベル和
L2を計算すると共に、FFT演算器4からの出力信号
(雑音消去処理前の信号であり、雑音期間で有効に機能
するのでN(f) を考えれば良い)のパワーレベル情報と
して、(17)式に従う絶対値レベル和L3を計算する。な
お、(16)式及び(17)式における総和Σは、周波数領域で
の開始周波数sfからその終了周波数ef(=4kHz )
についてである。なお、パワーレベル情報として、自乗
平均の和を求めるようにしても構わない。
を求めると、次には、(18)式に従って、減衰係数γ4を
求めて単純減衰部16に出力する。
FT演算器4の出力信号N(f) のレベル比を減衰係数γ
4として計算しているが、加算器14の出力信号E1
(f) と、FFT演算器4の出力信号N(f) のレベル比を
減衰係数γ4として計算するようにしても良い。
出力信号(雑音期間で有効に機能するのでN(f) )の周
波数成分に減衰係数γ4を乗算し、レベルの小さい周波
数成分信号γ4・N(f) を作成し、雑音期間(「音声な
し」期間)において選択されるスイッチ17の入力端子
aに出力する。この単純減衰部16からの出力信号γ4
・N(f) は、FFT演算器4の出力信号N(f) のレベル
を、加算器13の出力信号E2(f) のレベルに変換した
ものとなり、しかも、雑音消去処理を受けない信号、す
なわち、処理によるゆがみがない信号γ4・N(f) とな
る。
される適応窓関数発生部19は、パワー最大値周波数検
索器20、交差点検出器21、周辺極大値検索器22及
びカウンタ23から構成されており、加算器14からの
出力信号E1(f) はパワー最大値周波数検索器20へ入
力される。
て、入力信号E1(f) の周波数特性に応じて、窓関数処
理を施すものである。図5及び図6は、適応窓関数発生
部19による窓関数作成方法の説明図であり、適応窓関
数発生部19の各部20、21、22、23の機能をこ
れら図5及び図6をも参照しながら説明する。
器20には、加算器14からの出力信号E1(f) が入力
され、パワー最大値周波数検索器20は、処理周波数の
中で最大のパワーを示す周波数fmax を検索する。図6
の例では、最大パワー周波数fmax は、点aの周波数で
ある。最大値パワー周波数fmax (点a)は窓関数を施
す対象の基準であり、最大値パワー周波数fmax (点
a)を中心に予め定めた個数だけの窓関数処理を施す。
ここでは、最大値パワー周波数fmax (点a)を中心に
周波数上方及び下方にそれぞれ2個の窓関数処理を施す
ものとする。
である。以下では、図5における最大値パワー周波数点
aからその周波数上方側に隣合う極大値パワー周波数点
dに至る周波数範囲を例にとって、窓関数の作成方法を
説明する。
ワー最大値周波数検索器20は、最大値周波数fmax を
交差点検出器21に出力する。この交差点検出器21に
は、背景雑音保持部7から出力された推定背景雑音信号
N’(f) も与えられており、また、加算器14の出力信
号E1(f) も与えられている。交差点検出器21は、最
大値周波数点aから周波数軸上方の各周波数について、
(19)式に示すように、両信号E1(f) 及びN’(f) の差
分値CR(f) の符号を判定する。
が反転し、これをもって交点検出とする。さらに、差分
値CR(f) の算出、符号判定を周波数上方に向かって継
続していくと再び符号が反転する交点cが現れる。交差
点検出器21は、これら交点b及びcの中点eを求め、
求めた中点eを周辺極大値探索器22へ出力する。な
お、点b及び点cの周波数軸上での中点eは窓関数の谷
間の周波数に相当する。
出力信号E1(f) が与えられており、周辺極大値検索器
22は、(20)式に従って、信号E1(f) の傾きdef
(f) を計算し、その符号を監視する。
に進行させ、符号の反転を監視する。そして、周辺極大
値検索器22は、信号E1(f) の傾きdef(f) の符号
が反転するとき、信号E1(f) を極大値と判定する。図
5では、点dが極大値として判定される。
し、その中点eを谷間とした窓関数を作成することがで
きる。この窓関数は、(21)式に示す係数W(f) をもつも
のとする。
されたときにそのことを表す情報が与えられ、カウンタ
23は、1つの窓関数部分が作成されると1だけ加算す
るものである。
索器20が検出した最大パワー周波数点aを基準とした
窓関数が作成されると、点dを最大パワー周波数点aと
入れ替えて、これを最大値とみなして、点dから周波数
軸上方で再び同様の処理を交差点検出器21及び周辺極
大値検索器22は繰返す。このような交差点検出器21
及び周辺極大値検索器22を中心とした窓関数の作成処
理は、カウンタ23の計数値が所望の窓関数の個数に達
するまで繰り返し行われる。
頂点と窓関数の谷の特性を折り返して利用する。例え
ば、仮に、点dで窓関数の作成を停止するときは、点d
−点c−点eの特性を周波数軸上方に折り返しして(鏡
像)用いる。
から周波数下方への処理も、処理の方向が周波数軸上で
上方から下方に進行することを除けば、全く同様な処理
が行なわれる。
a)を中心に周波数上方及び下方にそれぞれ2個の窓関
数を作成するようにしているので、図6に示すように、
ナイキスト周波数より小さい範囲でも、窓関数が作成さ
れない範囲が形成される。すなわち、係数0.0の周波
数範囲が形成される。
て、加算器14からの出力信号E1(f) の内容に応じて
適応的に作成した窓関数(窓関数係数W(f) )をスペク
トル修正部18に与える。
出力信号E1(f) と加算器13の出力信号E2(f) も入
力されており、スペクトル修正部18はまず、雑音消去
所望周波数全体に渡って、(22)式に示すスペクトル信号
E3(f) を計算し、このスペクトル信号E3(f) の値が
信号E2(f) 以上の周波数ではその値E3(f) を出力値
とし、計算されたスペクトル信号E3(f) の値が信号E
2(f) より小さい周波数ではその値E3(f) を値E2
(f) に置き換えて出力値とし、このようにしてスペクト
ル修正が施されたスペクトル信号E3(f) をスイッチ1
7の入力端子cに与える。
E2(f) より小さい周波数ではその値E3(f) を値E2
(f) に置き換えて出力値とするようにしたのは、スペク
トル成分が完全に0になるのを防ぎ、最終的に再現され
る音の自然性を確保するためである。
生部19に入力された場合におけるスペクトル修正部1
8の出力スペクトル信号E3(f) を示している。このス
ペクトル信号E3(f) は、雑音なし音声信号のスペクト
ルに類似している。また、点fより上方のピークを有す
る点i近傍の周波数成分は、窓関数の作成個数の制限に
より、窓関数係数が0.0に押さえられている周波数成
分であるため、スペクトル修正部18からの出力信号E
3(f) は小さく押さえられている。
0からの信号を制御信号として受けて、雑音期間(「音
声なし」期間)では単純減衰部16からの出力信号を選
択し、有声音についての「音声あり」期間ではスペクト
ル修正部18からの出力信号を選択し、無声音について
の「音声あり」期間では加算器14からの出力信号を選
択して逆FFT演算器25に与えるものである。
与えられた周波数領域の信号を時間軸の信号に変換して
窓関数オーバラップ処理部24に与えるものである。
た窓関数処理部3での影響を打ち消すように、入力信号
をフレーム間でオーバラップさせ、音声信号の自然性を
再現するための処理を行ない、処理後の信号をデジタル
/アナログ変換器(以下、D/A変換器と呼ぶ)26に
出力するものである。例えば、2つのフレーム間で50
%のオーバラップを施すようにすれば良いが、オーバラ
ップ率はこれに限定されるものではない。
信号をアナログ信号に変換して、出力端子27を介し
て、次段の音声信号処理回路(例えば音声通信処理回
路)に出力するものである。
1の実施形態の背景雑音消去装置の動作を説明する。当
該背景雑音消去装置に対して、最初に、背景雑音N(t)
だけが入力され、その後に、音声S(t) 及び背景雑音N
(t) が混在して入力されるとして、説明を行なう。ま
た、スイッチ5は、装置の立上り時に閉成状態にあり、
スイッチ17は、装置の立上り時に入力端子aの選択状
態にあるとして説明を行なう。
が捕捉して電気信号に変換した入力信号N(t) は、A/
D変換器2において、デジタル信号に変換された後、窓
関数処理部3及び時間軸信号種別判定部10に与えられ
る。
間軸音声検出器11が上述したように音声信号の有無を
判定するが、雑音期間であるので「音声なし」と判定
し、その結果、スイッチ5は閉成状態を維持し、スイッ
チ17は入力端子aの選択状態を維持する。
に与えられた信号は、予め定められたフレーム長毎に窓
関数演算が施されてFFT演算器4に与えられ、FFT
演算器4において、入力された時間領域の信号x(k) が
フレーム毎に周波数領域の信号(周波数成分)X(f) に
変換され、スイッチ5、加算器13、14、信号レベル
計算部15及び単純減衰部16に与えられる。なお、雑
音期間においては、スイッチ17は入力端子aの選択状
態にあるので、加算器14は存在しないに等しい。
た信号X(f) は、上述したように閉成状態にあるスイッ
チ5を通過して、背景雑音推定部6に与えられ、これに
より、上述したように、背景雑音の推定、更新動作がフ
レーム毎に実行され、推定背景雑音信号N’(f) が背景
雑音保持部7に保持されると共に、その保持された推定
背景雑音信号N’(f) が乗算器8、9及び交差点検出器
21に与えられる。なお、雑音期間においては、スイッ
チ17は入力端子aの選択状態にあるので、交差点検出
器21は存在しないに等しい。
タを設けて、初期動作を開始したときには推定雑音平均
係数γを0.2とし、雑音期間が初期状態から160ms
を経過したときには推定雑音平均係数γを0.5として
いるので、初期状態において追従性が良好になり、ある
程度追従した後では高い安定性で追従することができ
る。
音信号N’(f) に対して、各乗算器8、9においてそれ
ぞれ、背景雑音の除去度合いを決める背景雑音除去係数
α2、α1が乗算されて、乗算器8、9に対応する加算
器13、14に与えられる。なお、乗算器9は、雑音期
間終了時の信号を形成するものとしてのみ機能する。
算器4からの出力信号X(f) (ここでは雑音成分だけの
信号(N(f) )から、対応する乗算器8、9から与えら
れた、背景雑音除去係数α2、α1が乗算された後の推
定背景雑音信号N2’(f) 、N1’(f) を減算して、F
FT演算器4からの出力信号X(f) に対する雑音消去を
行なう。なお、上述したように、雑音期間においては、
スイッチ17は入力端子aの選択状態にあるので、加算
器14は存在しないに等しい。
加算器13からの雑音消去処理後の信号E2(f) のパワ
ーレベル情報L2が計算されると共に、FFT演算器4
からの雑音消去処理前の信号(雑音期間であるのでN
(f) )のパワーレベル情報L3が計算され、その後、こ
れら値L2及びL3から、減衰係数γ4が求められて単
純減衰部16に出力される。
4からの雑音消去処理前の信号の周波数成分に減衰係数
γ4が乗算され、これにより、レベルの小さい背景雑音
に係るスペクトル信号γ4・N(f) が作成され、このス
ペクトル信号γ4・N(f) が、上述したように、この雑
音期間において選択されているスイッチ17の入力端子
aを介して、逆FFT演算器25に与えられる。
FFT演算器4の出力信号(背景雑音)N(f) のレベル
を、加算器13の出力信号E2(f) のレベルに変換した
ものとなり、しかも、雑音消去処理を受けない信号(処
理によるゆがみがない信号)となっている。
17を通過した単純減衰部17からの、歪みのないかつ
レベルの抑制された雑音成分だけを含むスペクトル信号
が時間軸の信号に変換され、さらに、窓関数オーバラッ
プ処理部24において、窓関数処理部3での影響を打ち
消すようにフレーム間でオーバラップされ、D/A変換
器26において、アナログ信号に変換されて、出力端子
27を介して、次段の音声信号処理回路に出力される。
び音声S(t) が重畳されて入力されるようになったとき
の動作を説明する。
換器2、窓関数処理部3及びFFT演算器4は、雑音期
間と同様に動作する。
た時間軸信号種別判定部10においては、時間軸音声検
出器11が上述したように音声信号の存在を検出する。
これにより、スイッチ5は、閉成状態から開放状態に変
更される。また、この「音声あり」期間においては、有
声、無声判定器12によって、上述したように、音声信
号が有声音か無声音かが判定される。そして、スイッチ
17が、有声音期間において入力端子cを選択し、無声
音期間において入力端子bを選択するように切り替えら
れる。
に、スイッチ5が開放されるので、FFT演算器4から
の出力信号X(f) (=S(f) +N(f) )は背景雑音推定
部6に入力されず、その結果、推定背景雑音信号N’
(f) の更新動作が実行されず、背景雑音保持部7から
は、雑音期間終了時の推定背景雑音信号N’(f) が継続
して出力される。
各乗算器8、9から、雑音期間終了時の推定背景雑音信
号N’(f) に背景雑音除去係数α2、α1が乗算された
信号N’2(f) 、N’1(f) が対応する加算器13、1
4に与えられる。
からの音声信号成分S(f) 及び背景雑音成分N(f) が重
畳されている出力信号X(f) が入力されており、各加算
器13、14において、この信号X(f) から、対応する
乗算器8、9の出力信号N’2(f) 、N’1(f) を減算
することにより、信号X(f) の背景雑音成分N(f) が軽
減された2種類の信号E2(f) 及びE1(f) が形成され
る。ここで、乗算器8に対する背景雑音除去係数α2
が、乗算器9に対する背景雑音除去係数α1より大きい
ので、加算器14からの出力信号E1(f) の方が加算器
13からの出力信号E2(f) より常に大きくなってい
る。
イッチ17が入力端子aからの入力信号を選択すること
がないので、加算器13からの出力信号E2(f) を利用
する信号レベル計算部15及び単純減衰部16は、「音
声あり」期間において存在しないに等しい。
イッチ17の入力端子bに入力されている。従って、当
該装置への入力信号に存在する音声信号が無声音の場合
には、加算器14からの出力信号E1(f) が、スイッチ
17で選択されて逆FFT演算器25に与えられること
になる。
、「音声あり」期間で固定化されている背景雑音保持
部7からの推定背景雑音信号N1(f) は、適応窓関数発
生部19に与えられ、また、加算器14からの出力信号
E1(f) 及び加算器13からの出力信号E2(f) は、ス
ペクトル修正部18に与えられる。
避けるが、パワー最大値周波数検索器20、交差点検出
器21、周辺極大値検索器22及びカウンタ23の上述
した機能により、加算器14からの出力信号E1(f) に
適応した窓関数が作成されてスペクトル修正部18に与
えられる。
上述したように、加算器14からの出力信号E1(f) に
対して、適応窓関数発生部19が作成した窓関数を用い
た窓関数演算処理が施され、その演算後の信号E3(f)
において、加算器13からの出力信号E2(f) よりレベ
ルが小さい周波数については、信号E2(f) の値に置き
換え、このようなスペクトル修正後の信号E3(f) がス
イッチ17の入力端子cに与えられる。従って、当該装
置への入力信号に存在する音声信号が有声音の場合に
は、スペクトル修正部18からの出力信号E3(f) が、
スイッチ17で選択されて逆FFT演算器25に与えら
れることになる。
存在する音声信号が有声音の場合には、スペクトル修正
され背景雑音が消去され音声成分が強調された信号が、
スイッチ17で選択され、存在する音声信号が無声音の
場合には、背景雑音が消去され音声成分が強調された信
号が、スイッチ17で選択されて逆FFT演算器25に
入力される。
FT演算器25、窓関数オーバラップ処理部24及びD
/A変換器26による処理が施されて、出力端子27か
ら出力される。
以下の効果を奏することができる。
いの大きい雑音消去後の信号E2(f) にしたので、この
関数を背景雑音の状態に自動的に対応させることがで
き、疑似関数が未知であっても、予め固定の関数を設定
する必要がなく、実用上、良好な音声品質を達成するこ
とができる。
個数限定でなく、周波数特性の最大パワー周波数からの
個数にしたので、音声が自然になり、音声品質を高める
ことができる。
間では、窓関数の作成個数の制限を通じて、窓関数係数
を0にするようにしたので、低域の方が周波数パワーが
大きく、高域の方が周波数パワーが小さいという音声の
一般的な性質を反映でき、音声通信等に音感に優れた雑
音消去を実現することができる。
力された信号から有声音成分信号、無声音成分信号の判
断を行なうので、実際の装置に実装して十分な背景雑音
消去装置を実現できる。
を図面を参照しながら詳述する。
置の全体構成を示すブロック図であり、第1の実施形態
に係る図1との同一、対応部分には同一符号を付して示
している。
第2の実施形態の背景雑音消去装置は、第1の実施形態
の時間軸信号種別判定部10に代えて、周波数軸信号種
別判定部30を設けた点が、第1の実施形態と異なって
おり、その他の構成は、第1の実施形態と同様である。
すなわち、音声信号の存在の有無や、有声音、無声音判
定等を周波数軸信号によって行なうようにした点が、第
1の実施形態と異なっている。
0は、周波数軸音声検出器31、有声、無声判定器32
及びカウンタ33から構成されており、信号種別の判定
結果によって、スイッチ5及びスイッチ17の状態を制
御するものである。なお、この第2の実施形態において
も、当該背景雑音消去装置が立ち上げられた初期状態に
おいては、スイッチ5は閉成しており、スイッチ17は
入力端子aを選択している(すなわち、当初は雑音期間
であることを仮定している)。
器4の出力信号(周波数軸信号)X(f) と、背景雑音保
持部7からの推定背景雑音信号N’(f) が与えられるよ
うになされている。なお、周波数軸音声検出器31に与
えられるFFT演算器4の出力信号(周波数軸信号)X
(f) は、背景雑音保持部7から与えられる推定背景雑音
信号N’(f) の次のフレームのものとなっているが、こ
れら信号X(f) 及びN’(f) については、フレーム順序
を規定する添字を設けていない。
て、現フレーム(フレーム番号をkとする)について、
FFT演算器4の出力信号X(f) の周波数パワー平均F
_AV(k) を計算すると共に、(24)式に従って、現フレ
ームについて、推定背景雑音信号N’(f) (これ自体は
k−1フレームのもの)の周波数パワー平均N_AV
(k) を計算する。(23)式及び(24)式において、sfは開
始周波数であり、efは終了周波数であり、また、総和
Σは開始周波数sfから終了周波数efについてであ
る。
_AV(k) 及びN_AV(k) のパワー平均比VP(k) を
(25)式に従って求め、求めたパワー平均比VP(k) を、
予め決められた閾値voi_d(例えば1.5)と比較
する。
(k) が閾値voi_d以上のときには、“音声の可能性
あり”としてカウンタ33のカウント値を1だけ増加さ
せると共に、パワー平均比VP(k) を有声、無声判定器
32に出力する。また、パワー平均比VP(k) が閾値v
oi_dより小さいときには、雑音期間内として、カウ
ンタ33をリセットさせると共に、カウンタ33を介し
て、スイッチ5に閉成状態を指示する(又は継続する)
制御信号を与え、また、スイッチ17に、入力端子aを
選択させる制御信号を与える。
毎に、そのカウント値を、予め定められている音声期間
限界閾値LIMIT_VT(例えば20フレーム、これ
に限定されるものではない)と比較する。
声期間限界閾値LIMIT_VT以下のときには、「音
声あり」期間としてスイッチ5を開放させる制御信号を
スイッチ5に与え、これに対して、カウント値が音声期
間限界閾値LIMIT_VTより大きいときに、音声継
続期間が音声期間の継続としては不自然と判定し、スイ
ッチ5を閉成させると共に、スイッチ17に入力端子a
を選択させる。
声信号が有声音の場合における各種信号等を示したもの
であり、これに対して、図10は、入力信号X(f) に含
まれている音声信号が無声音の場合における各種信号を
示したものである。なお、パワー平均やパワー平均比に
ついては、推定背景雑音信号のパワー平均N AVを
1.0とした正規化値で示している。
を、これら図9及び図10を参照しながら説明する。
〜ef)に渡って、FFT演算器4からの出力信号X
(f) における最大パワーレベルMAX(k) を検索する。
軸音声検出器31が求めたパワー平均比VP(k) を、予
め定められている閾値C_VOI(例えば1.8)と比
較すると共に、最大パワーレベルMAX(k) 及び周波数
軸音声検出器31が求めた入力信号についてのパワー平
均F_AV(k) 間のレベル比を、予め定められている閾
値CV(例えば2.0)と比較する。すなわち、(26)式
に示す条件式を満足しているか否かと、(27)式に条件式
を満足しているか否かを判定する。
条件式を共に満足しているときに音声信号は有声音であ
ると判定し、これに対して、(26)式及び(27)式に示す条
件式の少なくとも一方が満足されないときに音声信号は
無声音であると判定する。
れ、入力端子b又はcの選択に用いられる。
が無声音の場合には、そのことを表す信号をカウンタ3
3に与える。このときにも、カウンタ33はカウント値
を1だけ増加させる。すなわち、カウンタ33は、周波
数軸音声検出器31によるカウントアップ動作とこの有
声、無声判定器32によるカウントアップ動作により、
1フレーム当り、有声音のときにカウント値を1だけ増
加させ、無声音のときにカウント値を2だけ増加させ
る。これは、実用環境で背景雑音の周波数成分が、雑音
の場合は広がっていることに鑑み、雑音の増加を無声音
の継続と誤検出することを防止しようとしたためであ
る。
条件式は、最大パワーレベルMAX(k) 及び周波数軸音
声検出器31が求めた入力信号についてのパワー平均F
_AV(k) 間のレベル「比」を閾値と比較するものであ
ったが、この条件式に代えて、最大パワーレベルMAX
(k) 及びパワー平均F_AV(k) 間のレベル「差」を閾
値と比較する条件式を用いるようにしても良い。
消去装置も、全体構成及び動作は、第1の実施形態と同
様であるので、第1の実施形態と同様な効果を奏するこ
とができる。
周波数軸音声検出器31、周波数軸の有声、無声判定器
32及びカウンタ33を設け、音声検出及び有声音無声
音判定を周波数領域で行ない、入力信号に音声信号があ
ると判定したときには、カウンタ33を1だけ増加さ
せ、さらに、音声が有声音であるときにはカウンタ33
を増加させず、音声が無声音であるときにはカウンタ3
3を1だけ増加させるようにしたので、入力信号の種別
をより明確に、有声音、無声音、雑音に識別でき、消去
すべき背景雑音を精度良く推定して除去することがで
き、一段と音質向上を期待できる。
を図面を参照しながら詳述する。
装置の全体構成を示すブロック図であり、第1の実施形
態に係る図1との同一、対応部分には同一符号を付して
示している。
に、第3の実施形態の背景雑音消去装置は、適応窓関数
発生部19の内部構成が第1の実施形態とは異なってお
り、適応窓関数発生部19以外の構成は、第1の実施形
態と同様であり、その説明は省略する。
は、パワー最大値周波数検索器20、ピーク基本周期探
索部40、小領域最大値検索器41及びカウンタ23か
ら構成されている。
も、加算器14からの出力信号E1(f) の周波数特性に
応じて、窓関数処理を施すものである。図12及び図1
3は、第3の実施形態の適応窓関数発生部19による窓
関数作成方法の説明図であり、適応窓関数発生部19の
各部の機能をこれら図12及び図13をも参照しながら
説明する。
実施形態と同様に、加算器14からの出力信号E1(f)
について、処理周波数の中で最大のパワーを示す周波数
fmax (点a)を検索する。そして、最大パワー周波数
fmax (点aの周波数fa)の情報をピーク基本周期探
索部40に出力する。
4の出力信号E1(f) が与えられており、ピーク基本周
期探索部40は、パワー最大値周波数検索器20で検索
された最大値周波数fmax から周波数上方に対して、以
下のようにして極大値を検索する。まず、(28)式に従っ
て、信号E1(f) の傾きdef3(f) を計算し、その
後、符号反転を監視して極大値を検出する。
さらに周波数上方に向かわせ、傾きdef3(f) が正に
なったとき以降に、極大値検出を開始し、再び、傾きが
負に変化した周波数を極大値とする。
検索は行なわれず、極大値は点eから点dに向かいなが
ら計算される。図12の場合、点dが極大値(第2の最
大パワー周波数fmax2=fd)として検出される。
式に示すピーク間周波数幅SBを求める。以後、この周
波数幅SBを基準幅として、極大値の検出を行なう。
関数を作成する。すなわち、最大パワー周波数fmax の
周波数上下にそれぞれΔ1/2の幅をもち、最大パワー
周波数fmax (点a)及び第2の最大パワー周波数fma
x2(点d)の中点周波数を最下点(点e;周波数fe)
とする図13に示すような窓関数を計算する。今、周波
数幅Δ1を2・qで表すと、ピーク基本周期検索部40
は、最大パワー周波数fmax (=fa)側の傾斜部で
は、(30)式で表される窓関数係数W(f) を有し、第2の
最大パワー周波数fmax2(=fd)側の傾斜部では、(3
1)式で表される窓関数係数W(f) を有する窓関数を形成
して、小領域最大値検索器41を経由してスペクトル修
正部18に出力する。
波数幅Δ1の余裕を持たせるようにしたのは、音声信号
成分のスペクトルの広がりに対応するためである。
を終了すると、第2のピーク最大周波数fmax2は小領域
最大値検索器41に出力される。小領域最大値検索器4
1は、第2の最大パワー周波数fmax2を新たな最大パワ
ー周波数fmax として置き換えると共に、この置き換え
られた最大パワー周波数fmax を基点とした周波数上方
での範囲SB−Δ〜SB+Δ内でのみ新たな第2の最大
パワー周波数(ここではfmax3で表す)を検出する。こ
こで、Δはスペクトルのピーク周期のばらつきを吸収す
るための定数であり、例えば、Δ=10Hzに選定できる
が、これに限定するものではない。
て、最大パワー周波数fmax (=fmax2)と第2の最大
パワー周波数fmax3が得られると、小領域最大値検索器
41は、パワー最大値周波数検索器20と同様にして、
これら2個の最大値パワー周波数fmax 及びfmax3に基
づいて、窓関数を作成し、得られた窓関数係数をスペク
トル修正部18に出力する。
が窓関数を作成する毎にカウント値を1だけ増加させ
る。このカウンタ23のカウント値が予め定めた個数
(例えば2個)に達するまで、小領域最大値検索器41
は、上述した処理を繰返す。
最大パワー周波数fmax より、周波数軸で下方への方向
に対しても、処理の方向が周波数軸上で逆であることを
除けば、ピーク基本周期探索部40及び小領域最大値検
索器41は、上述したと同様な窓関数作成処理を行な
う。
消去装置も、全体構成及び動作は、第1の実施形態と同
様であるので、第1の実施形態と同様な効果を奏するこ
とができる。
適応窓関数発生部において、周波数領域で最大値を示す
周波数を検索するパワー最大値周波数検索器を設けて、
最大パワー周波数と第2の最大パワー周波数を求め、ピ
ーク基本周期探索部で基本部分の窓関数を発生すると共
に基本探索周期を決め、また、第2回目以後の窓関数を
求めるための小領域最大値検索器を設けて、第2回目以
後は上記で定めた基本探索周期に対して多少の余裕を持
たせた期間に限定して最大値を求め、その求めた最大値
までを小領域での窓関数幅として窓関数を作成するよう
にしたので、窓関数作成時の演算処理工程を節約でき、
適応窓関数発生部におけるソフトウエア、ハードウエア
規模の縮小が期待できる。
を図面を参照しながら詳述する。
装置の全体構成を示すブロック図であり、第1、第2及
び第3の実施形態に係る図1、図8、図11との同一、
対応部分には同一符号を付して示している。
1、図8、図11と比較することで明らかなように、第
4の実施形態の背景雑音消去装置は、第1の実施形態の
時間軸信号種別判定部10に代えて、第2の実施形態で
説明した周波数軸信号種別判定部30を設けた点が、第
1の実施形態の適応窓関数発生部19に代えて、第3の
実施形態で説明した適応窓関数発生部19を設けた点
が、第1の実施形態と異なっている。
の機能説明は既に終了しているので、その説明は省略す
る。
消去装置も、全体構成及び動作は、第1の実施形態と同
様であるので、第1の実施形態と同様な効果を奏するこ
とができる。
えて、周波数軸信号種別判定部を設けたことによる第2
の実施形態と同様な効果を奏することができ、また、第
3の実施形態で説明した適応窓関数発生部19を設けた
ことによる第3の実施形態と同様な効果を奏することが
できる。
実施形態の説明を行なったが、本発明は、上記各実施形
態に限定されるものでなく、上述した変形した実施形態
以外の他の実施形態も許容するものである。そのうちの
いくつかを例示すると以下の通りである。
換をFFT、逆FFT演算以外で行なうものであっても
良い。
力信号の処理系を切り替えるためのスイッチの介在位置
は、上記実施形態のものに限定されるものではない。
における引かれる値及び引く値を逆にしたり、音声の有
無や、有音無音判定等に用いる比の分母分子を逆にして
も良いことは勿論である。この場合、閾値等も変化し、
その大小関係と判定結果等も逆になる。
生部が発生する窓関数が単調な直線関数であるものを示
したが、窓関数に公知のハミング窓等を用いることもで
きる。また、適応窓関数発生部に、FFT演算器からの
信号を入力して窓関数を発生させるようにしても良い。
また、適応窓関数発生部が発生する窓関数部分(台形形
状部分)の個数を外部から変更し得るようにしても良
い。
置の音声入力手段に適用することを意図してなされたも
のであるが、他の装置の音声入力手段に適用できること
は勿論である。
置によれば、入力された音響信号に存在する音声信号が
有声音か無声音かによって、雑音消去特性が異なる出力
信号を選択すると共に、有声音を有する音響信号に対す
る減衰特性の谷間の深さを規制する窓関数を入力音響信
号の内容によって適応的に変化させるようにしたので、
出力信号における音感、音質を従来より高めることがで
きる適切な背景雑音消去を実行できるようになる。
る。
る。
る。
明図(その1)である。
明図(その2)である。
明図である。
る。
(その1)である。
(その2)である。
る。
の説明図(その1)である。
の説明図(その2)である。
る。
部、4…FFT演算器、5、17…スイッチ、6…背景
雑音推定部、7…背景雑音保持部、8、9…乗算器、1
0…時間軸信号種別判定部、11…時間軸音声検出器、
12、32…有声、無声判定器、13、14…加算器、
15…信号レベル計算部、16…単純減衰部、18…ス
ペクトル修正部、19…適応窓関数発生部、20…パワ
ー最大値周波数探索器、21…交差点検出器、22…周
辺極大値探索器、23…カウンタ、24…窓関数オーバ
ラップ、25…逆FFT演算器、26…D/A変換器、
30…周波数軸信号種別判定部、31…周波数軸音声検
出器、40…ピーク基本周期探索器、41…小領域最大
値探索器。
Claims (11)
- 【請求項1】 時間軸上の入力音響信号を周波数軸上の
信号に変換する時間軸/周波数軸変換手段と、 入力音響信号が背景雑音だけか、入力音響信号が音声信
号を含むか、音声信号を含む場合に有声音か無声音かを
判別する信号種別判定手段と、 上記時間軸/周波数軸変換手段で変換された周波数軸上
の音響信号に基づいて、入力音響信号が背景雑音だけの
ときだけに入力音響信号に追従しながら背景雑音を推定
した推定雑音信号を形成すると共に、入力音響信号が音
声信号を含むときに、音声信号が含まれる直前の推定雑
音信号を繰返し出力する背景雑音推定出力手段と、 少なくとも入力音響信号が音声信号を含むときに、当該
背景雑音推定出力手段からの推定雑音信号に第1の係数
を乗算する第1の乗算手段と、 上記時間軸/周波数軸変換手段で変換された周波数軸上
の音響信号から、第1の係数が乗算された推定雑音信号
を減じる第1の雑音消去演算手段と、 この第1の雑音消去演算手段からの出力信号又は上記時
間軸/周波数軸変換手段からの出力信号の周波数特性に
応じて、窓関数を作成する適応窓関数発生手段と、 上記第1の雑音消去演算手段からの出力信号のスペクト
ルを、上記窓関数発生手段が作成した窓関数に応じて修
正するスペクトル修正手段と、 入力音響信号に有声音の音声信号があるときに、上記ス
ペクトル修正手段からの出力信号を選択し、入力音響信
号に無声音の音声信号があるときに、上記第1の雑音消
去演算手段からの出力信号を選択する雑音消去信号選択
手段と、 この雑音消去信号選択手段で選択された周波数軸上の信
号を時間軸上の信号に変換する周波数軸/時間軸変換手
段とを有することを特徴とする背景雑音消去装置。 - 【請求項2】 少なくとも入力音響信号が背景雑音だけ
を含むときに、上記背景雑音推定出力手段からの推定雑
音信号に、第1の係数より大きな第2の係数を乗算する
第2の乗算手段と、 変換された周波数軸上の音響信号から、第2の係数が乗
算された推定雑音信号を減じる第2の雑音消去演算手段
と、 この第2の雑音消去演算手段による雑音消去処理前後の
信号レベルの関係に応じて、変換された周波数軸上の音
響信号を音質を変化させずに減衰させる無歪減衰手段と
をさらに備えると共に、 上記雑音消去信号選択手段が、入力音響信号が背景雑音
だけを含むときに、上記無歪減衰手段からの出力信号を
選択することを特徴とする請求項1に記載の背景雑音消
去装置。 - 【請求項3】 上記信号種別判定部が、 時間軸上の入力音響信号の短期平均及び長期平均を計算
し、短期平均及び長時間平均の差が、第1の閾値を超え
るときに音声ありと判定する時間軸音声検出器と、 この時間軸音声検出器が音声ありと判定した場合におい
て、上記短期平均が第2の閾値を超過したとき有声音と
判定し、第2の閾値以下のときに無声音と判定する有
声、無声判定器とを有することを特徴とする請求項1又
は2に記載の背景雑音消去装置。 - 【請求項4】 上記信号種別判定部が、 上記背景雑音推定出力手段からの推定背景雑音信号の周
波数軸でのパワー平均値と、上記時間軸/周波数軸変換
手段で変換された周波数軸上の音響信号のパワー平均値
の差又は比でなる平均値間関係値を第1の閾値と比較し
て音声の有無を検出する周波数軸音声検出器と、 音声ありの場合において、上記平均値間関係値と第2の
閾値との大小関係、及び、周波数軸での最大値と推定背
景雑音信号のパワー比と第3の閾値との大小関係に応じ
て、有声音か無声音かを判定する有声、無声判定器とを
有することを特徴とする請求項1又は2に記載の背景雑
音消去装置。 - 【請求項5】 上記信号種別判定部は、音声信号なしの
ときにリセットされ、有声音の音声信号ありのときに1
だけカウントアップし、無声音の音声信号ありのときに
2だけカウントアップするカウンタをさらに備え、 このカウンタのカウント値が所定の閾値を超えるとき
に、上記周波数軸音声検出器の検出結果を音声なしに切
替えることを特徴とする請求項4に記載の背景雑音消去
装置。 - 【請求項6】 上記適応窓関数発生手段は、 当該適応窓関数発生手段への入力信号の最大ピークパワ
ーをとるパワー最大値周波数を検索するパワー最大値周
波数探索器と、 当該適応窓関数発生手段への入力信号のレベルと、上記
背景雑音推定出力手段から出力された推定雑音信号のレ
ベルとが交差する交点周波数を求める交差点検出器と、 パワー最大値周波数近傍の極大値を持つ周波数を検出す
る周辺極大値検索器とを有し、 求めた極大値周波数、パワー最大値周波数及び交点周波
数に基づいて、上記スペクトル修正手段に出力する窓関
数を作成することを特徴とする請求項1〜5のいずれか
に記載の背景雑音消去装置。 - 【請求項7】 上記適応窓関数発生手段は、 当該適応窓関数発生手段への入力信号の最大ピークパワ
ーをとるパワー最大値周波数を検索するパワー最大値周
波数探索器と、 パワー最大値周波数を基準として周波数のピーク間の基
本幅を計算するピーク基本周期探索器と、 求めたピーク間基本幅ずつずれた小領域におけるピーク
周波数を検索する小領域最大値探索器とを有し、 求めたパワー最大値周波数及び小領域内ピーク周波数に
基づいて、上記スペクトル修正手段に出力する窓関数を
作成することを特徴とする請求項1〜5のいずれかに記
載の背景雑音消去装置。 - 【請求項8】 上記適応窓関数発生手段は、窓関数にお
ける台形形状の窓関数部分の個数をパワー最大値周波数
を中心とした周波数の上方及び下方にそれぞれ所定個数
に制限して作成させる窓関数部分作成個数制限部をさら
に有することを特徴とする請求項6又は7に記載の背景
雑音消去装置。 - 【請求項9】 周波数の上方に所定個数を越えた周波数
領域における窓関数のゲインを0に選定していることを
特徴とする請求項8に記載の背景雑音消去装置。 - 【請求項10】 上記スペクトル修正手段は、上記窓関
数発生手段からの窓関数に応じて修正した後の信号にお
ける谷間の深さが過度に小さくなったときに、その過度
に小さくなった部分を所定レベルまで持ち上げて出力す
ることを特徴とする請求項1〜9のいずれかに記載の背
景雑音消去装置。 - 【請求項11】 上記スペクトル修正手段は、上記窓関
数発生手段からの窓関数に応じて修正した後の信号レベ
ルが、上記第2の雑音消去演算手段による雑音消去処理
後の信号レベルより小さくなった周波数部分を、谷間の
深さが過度に小さくなった周波数部分と捕らえて、上記
第2の雑音消去演算手段による雑音消去処理後の信号に
置き換えることを特徴とする請求項10に記載の背景雑
音消去装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15379096A JP3264831B2 (ja) | 1996-06-14 | 1996-06-14 | 背景雑音消去装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15379096A JP3264831B2 (ja) | 1996-06-14 | 1996-06-14 | 背景雑音消去装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH103297A JPH103297A (ja) | 1998-01-06 |
JP3264831B2 true JP3264831B2 (ja) | 2002-03-11 |
Family
ID=15570199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15379096A Expired - Fee Related JP3264831B2 (ja) | 1996-06-14 | 1996-06-14 | 背景雑音消去装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3264831B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013139038A1 (en) * | 2012-03-23 | 2013-09-26 | Siemens Aktiengesellschaft | Speech signal processing method and apparatus and hearing aid using the same |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60135127A (ja) * | 1983-12-23 | 1985-07-18 | Fanuc Ltd | 放電加工機の位置出し用電源装置 |
KR100640865B1 (ko) | 2004-09-07 | 2006-11-02 | 엘지전자 주식회사 | 음성 품질 향상 방법 및 장치 |
JP4650163B2 (ja) * | 2005-08-25 | 2011-03-16 | パナソニック電工株式会社 | 拡声通話装置 |
JP2008052117A (ja) * | 2006-08-25 | 2008-03-06 | Oki Electric Ind Co Ltd | 雑音除去装置、方法及びプログラム |
JP5614261B2 (ja) | 2010-11-25 | 2014-10-29 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びプログラム |
JP6337519B2 (ja) * | 2014-03-03 | 2018-06-06 | 富士通株式会社 | 音声処理装置、雑音抑圧方法、およびプログラム |
JP6561011B2 (ja) * | 2016-05-02 | 2019-08-14 | 大井電気株式会社 | 無線装置 |
CN114176623B (zh) * | 2021-12-21 | 2023-09-12 | 深圳大学 | 声音降噪方法、系统、降噪设备及计算机可读存储介质 |
JPWO2023148955A1 (ja) * | 2022-02-07 | 2023-08-10 |
-
1996
- 1996-06-14 JP JP15379096A patent/JP3264831B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013139038A1 (en) * | 2012-03-23 | 2013-09-26 | Siemens Aktiengesellschaft | Speech signal processing method and apparatus and hearing aid using the same |
CN104205213A (zh) * | 2012-03-23 | 2014-12-10 | 西门子公司 | 语音信号处理方法及装置以及使用其的助听器 |
CN104205213B (zh) * | 2012-03-23 | 2018-01-05 | 西门子公司 | 语音信号处理方法及装置以及使用其的助听器 |
Also Published As
Publication number | Publication date |
---|---|
JPH103297A (ja) | 1998-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3297307B2 (ja) | 背景雑音消去装置 | |
US7706550B2 (en) | Noise suppression apparatus and method | |
KR950011964B1 (ko) | 신호처리장치 | |
Erkelens et al. | Tracking of nonstationary noise based on data-driven recursive noise power estimation | |
KR100739905B1 (ko) | 소스 음성 신호에서 잡음을 억제하는 방법 및 잡음 억제기 | |
US20050288923A1 (en) | Speech enhancement by noise masking | |
KR101224755B1 (ko) | 음성-상태 모델을 사용하는 다중-감각 음성 향상 | |
JP3484757B2 (ja) | 音声信号の雑音低減方法及び雑音区間検出方法 | |
JP5071346B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP2002149200A (ja) | 音声処理装置及び音声処理方法 | |
WO2005124739A1 (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP2002527785A (ja) | 情報信号にある休止期間の間にノイズ推定値を更新する方法とシステム | |
JP2009031793A (ja) | 調整されたトーンノイズの低減を用いたノイズの低減 | |
JP3264831B2 (ja) | 背景雑音消去装置 | |
JP2014122939A (ja) | 音声処理装置および方法、並びにプログラム | |
JP3269969B2 (ja) | 背景雑音消去装置 | |
JP2002537586A (ja) | 雑音を消去するためのシステム、方法及び装置 | |
JP2000330597A (ja) | 雑音抑圧装置 | |
JP4445460B2 (ja) | 音声処理装置及び音声処理方法 | |
JPH08160994A (ja) | 雑音抑圧装置 | |
JP4123835B2 (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JPH06208395A (ja) | ホルマント検出装置及び音声加工装置 | |
JP2000207000A (ja) | 信号処理装置および信号処理方法 | |
JP2830276B2 (ja) | 信号処理装置 | |
JP3204892B2 (ja) | 背景雑音消去装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081228 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091228 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091228 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101228 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101228 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111228 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111228 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121228 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131228 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |