JP3204892B2 - 背景雑音消去装置 - Google Patents

背景雑音消去装置

Info

Publication number
JP3204892B2
JP3204892B2 JP33177095A JP33177095A JP3204892B2 JP 3204892 B2 JP3204892 B2 JP 3204892B2 JP 33177095 A JP33177095 A JP 33177095A JP 33177095 A JP33177095 A JP 33177095A JP 3204892 B2 JP3204892 B2 JP 3204892B2
Authority
JP
Japan
Prior art keywords
background noise
signal
noise
power
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP33177095A
Other languages
English (en)
Other versions
JPH09171397A (ja
Inventor
真資 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP33177095A priority Critical patent/JP3204892B2/ja
Publication of JPH09171397A publication Critical patent/JPH09171397A/ja
Application granted granted Critical
Publication of JP3204892B2 publication Critical patent/JP3204892B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声入力装置、
特に電話機の送話部における雑音消去装置に関する。
【0002】
【従来の技術】通常、機械との意志の伝達は、ボタン、
マウス或いはキーボード等の入力手段と、ディスプレイ
を用いた文字、画像等の出力手段によって行われる。と
ころが、人にとっては音声による対話が手軽であり、自
然であることから、近年では電話機に限らず、機械との
音声による対話を進めるための音声認識技術に基づく音
声インタフェースの実用化の試みが行われている。
【0003】このような背景における音声入力装置にと
って、特に問題になるのは、入力信号から雑音成分と音
声信号とを分離することである。従来から、例えば適応
的に雑音を推定して、音声信号のみを取り出す方法とし
て、スペクトルサブストラクション法などが開発されて
いる(谷口等「適応的に雑音を推定するスペクトルサブ
ストラクション法」 信学技報 "TECHNICAL REPORT OF I
ECE.SP94-116(1995-03)")。
【0004】
【発明が解決しようとする課題】上記谷口等の論文によ
れば、音声区間の検知を行わなくても動作する適応的雑
音推定を行うことができるとされている。しかし、この
手法を直接に音声通信に用いると処理後の背景ノイズが
トーン性の性質をもち、かつ、時間変動が細かいため、
背景ノイズが耳障りであるという問題があった。また、
背景雑音の推定係数を小さくした場合、背景雑音推定の
平均効果は大きいが、推定速度が遅くなる。このため、
装置の初期立ち上がり特性が悪い。また背景ノイズが急
変した場合や、音声信号直後の場合、処理音が大きく劣
化してしまう等の問題点もあった。
【0005】これらの問題点を回避すべく、チャンネル
分割器によって複数の帯域信号に分割してからノイズレ
ベルを検出する方法が、R.J.ビルマー等によって提
案されている(R.J.ビルマー(Richard J.Vi1mur)
等「雑音抑圧方式(NOISE SUPPRESSION SYSTEM)」(US
PAT.4,811,404))。この方法は、スペクトラルゲイン
変換法と言われ、音声メトリック計算によって分割され
たチャンネル毎のSN比を切り換えるものである。
【0006】しかし、この方法を採用した場合でも、例
えばブザー音又は長期間の母音のみからなる音声信号が
継続的に、例えば1secの間だけ入力されると、それを
雑音と見なして消去してしまうという問題があった。ま
た、音声信号の周波数特性がピーク特性を有する場合、
特に母音などのように周波数的な大きな広がりを持たな
い成分が連続する音声信号に対しては、これをノイズと
みなして強制的に消去してしまう。その結果、ノイズ抑
圧された音声信号の音質が劣化するといった問題点があ
った。
【0007】この発明は、上述のような課題を解決する
ためになされたもので、狭帯域性の、かつ非定常な雑音
成分であっても確実に消去できる背景雑音消去装置を提
供することを目的とする。
【0008】この発明の第2の目的は、装置の初期立ち
上がり応答が俊敏で、かつ、背景ノイズが急変しても、
処理音が安定して、劣化しない背景雑音消去装置を提供
することである。
【0009】この発明の第3の目的は、音声が継続的に
入力されても消去されることがないため通話品質に優れ
た背景雑音消去装置を提供することである。
【0010】この発明の第4の目的は、音声信号の周波
数特性が、周波数的な大きな広がりを持たなくても消去
されない背景雑音消去装置を提供することである。
【0011】
【課題を解決するための手段】請求項1の発明は、音声
が雑音成分を含んで入力された入力信号から周波数領域
での減算によって雑音成分を除去する背景雑音消去装置
において、上記入力信号内の音声の有無を検出する音声
検出手段と、上記入力信号のパワーを計算する信号パワ
ー計算手段と、上記音声検出手段による音声検出が終了
してから所定の時間だけ背景雑音を推定し、その推定値
を保持する背景雑音推定保持手段と、上記信号パワー計
算手段で計算された信号パワーから背景雑音推定保持手
段の背景雑音パワーを減算して出力する演算手段とを備
えることを特徴とする。
【0012】請求項2の発明は、上記演算手段から出力
される信号パワーを平滑化する平滑演算手段を備え、上
記背景雑音更新手段により、装置の初期立ち上がり、及
び、音声期間終了後の一定時間は上記平滑演算手段にお
ける平滑演算を急峻に行い、そのほかは緩やかに行うこ
とを特徴とする。
【0013】請求項3の発明は、上記背景雑音推定保持
手段は、推定した背景雑音を保持する背景雑音保持器
と、上記音声検出器での検出結果により背景ノイズの更
新を止めるスイッチとを含むことを特徴とする。
【0014】請求項4の発明は、上記背景雑音更新手段
は、音声期間、装置始動期間、雑音期間で、それぞれ上
記平滑演算手段の平滑演算係数を変更することを特徴と
する。
【0015】請求項5の発明は、上記演算手段の出力を
予め定めた複数の帯域に分割する帯域分割器と、上記帯
域分割器で分割された各帯域毎の信号値を対数変換する
対数計算部と、上記対数計算部で計算された対数値に基
づいて各領域毎にs/nを計算するs/n計算部と、計
算されたs/nに従って帯域別に各チャンネルのパワー
を減衰させるパワー減衰部と、上記パワー減衰部の出力
を平滑化する平滑演算器とを備え、上記平滑演算器の係
数を可変にすることを特徴とする。
【0016】請求項6の発明は、上記平滑演算器の平滑
処理は、装置の初期立ち上がり、及び、音声期間終了後
一定時間は急峻に行い、そのほかは緩やかに行うことを
特徴とする。
【0017】請求項7の発明は、狭帯域信号のピーク周
波数を割り出すピーク周波数探査部と、上記ピーク周波
数探査部の出力からピーク周波数の隣接周波数における
パワー計算を行う隣接周波数パワー監視部と、上記隣接
周波数パワー監視部から狭帯域ノイズを判定する狭帯域
ノイズ判定部とを備え、上記狭帯域ノイズ判定部の判定
結果に応じて、特定チャンネル、もしくは特定周波数の
成分を減衰させて狭帯域ノイズを除去することを特徴と
する。
【0018】請求項8の発明は、上記ピーク周波数探査
部の探査結果に基づいて各ピーク周波数の倍数関係を計
算するピーク周波数倍数関係検索部と、上記隣接周波数
パワー監視部と上記ピーク周波数倍数関係検索部とか
ら、狭帯域ノイズを判定する狭帯域ノイズ判定部とを備
えることを特徴とする。
【0019】請求項9の発明は、上記狭帯域ノイズ判定
部の判定結果に応じて、上記パワー減衰部で作成される
ゲインを用いて減少させることによって、上記特定周波
数を減衰することを特徴とする。
【0020】請求項10の発明は、上記狭帯域ノイズ判
定部の判定結果に応じて、上記帯域分割器の特定の周波
数成分を上記背景雑音保持器に加算し、さらに上記演算
手段によって入力信号から減算させることによって、上
記特定周波数を減衰することを特徴とする。
【0021】請求項11の発明は、上記入力信号をディ
ジタル信号に変換するA/D変換器と、上記ディジタル
信号を高速フーリエ変換処理によつて周波数領域の信号
に変換する高速フーリエ変換器と、周波数領域の信号を
時間領域の信号に再変換する高速逆フーリエ変換器と、
再変換されたディジタル信号をアナログ信号に変換する
D/A変換器とを備えることを特徴とする。
【0022】
【発明の実施の形態】以下、添付した図面を参照して、
この発明の実施の形態を詳細に説明する。
【0023】実施の形態1 図1は、本発明の第1の実施の形態を示すブロック図で
ある。
【0024】図1において、1はアナログ/ディジタル
変換器(以下、A/D変換器という)、2は窓関数演算
器、3は高速フーリエ変換器(以下、FFTという)、
4は信号位相計算器、5は高速逆フーリエ変換器(以
下、IFFTという)、6は窓関数オーバラップ演算
部、7はディジタル/アナログ変換器(以下、D/A変
換器という)である。
【0025】A/D変換器1には、入力信号が入力端子
INからアナログ音声として供給され、これをディジタ
ル信号に変換している。このA/D変換器1で変換され
たディジタル信号は、フレーム単位の信号に区切られ
て、窓関数演算器2及び音声検出器8に入力される。窓
関数演算器2では窓演算処理、例えばハミング(hammin
g)窓演算、あるいはハニング(hanning)窓演算等の公
知の窓関数演算処理が施される。窓関数演算器2の出力
はFFT3に出力され、FFT3では入力信号を高速フ
ーリエ変換処理によつて周波数領域の信号成分に変換さ
れる。
【0026】また、8は音声検出器であって、その設置
位置については、A/D変換器1の後段の他にも、例え
ば窓関数演算器2の後段、或いは後述する加算器15の
後段、帯域分割器13の後段、帯域別パワー減衰部18
の後段、平滑演算器19の後段、或いはΙFFT5の後
段のいずれかであっても良く、また、これら複数箇所に
それぞれ配置することによって音声検出の精度を高める
ことも可能である。
【0027】図1において、9は第1のカウンタ、10
はスイッチ、11は背景雑音更新部、12は背景雑音保
持器、13は周波数帯域分割器、14は信号パワー計算
部、15は加算器である。
【0028】上記FFT3で変換された信号は、信号位
相計算器4と信号パワー計算部14に出力されている。
また、上記第1のカウンタ9は音声検出器8と接続さ
れ、音声検出動作の開始からの時間を計数し、背景雑音
更新部11に対する更新許可条件を設定している。上記
スイッチ10も音声検出器8と接続され、音声検出器8
の検出結果で制御されるものであって、音声検出器8の
検出結果が有音であるときにはスイッチ10が開き、そ
れ以外の期間にはスイッチ10を閉じるように動作す
る。背景雑音保持器12は背景雑音更新部11と互いに
接続されて、背景雑音更新保持手段を構成している。信
号パワー計算部14は、スイッチ10を介して背景雑音
更新部11と接続されるとともに、加算器15の+入力
端子と接続される。加算器15の−入力端子は背景雑音
保持器12と接続され、さらに加算器15の出力は、上
記周波数帯域分割器13と後述するピーク周波数探査部
21とに入力されている。
【0029】また、図1において、16は対数計算部、
17は信号対ノイズ比(以下、s/nという)計算部、
18は帯域別パワー減衰部、19は平滑演算器、20は
第2のカウンタである。
【0030】上記加算器15での演算結果は周波数帯域
分割器13に入力され、ここで加算器15の出力は予め
定めた複数の帯域に分割される。また、背景雑音保持器
12からの出力もこの帯域分割器13に入力される。周
波数帯域分割器13は、対数計算部16及び帯域別パワ
ー減衰部18と接続される。対数計算部16は、更にs
/n計算部17を介して帯域別パワー減衰部18と接続
される。帯域別パワー減衰部18の出力は、平滑演算器
19に入力される。平滑演算器19には、この他に音声
検出器8からの検出出力と、第2のカウンタ20からの
出力信号とが入力されている。また、第2のカウンタ2
0には音声検出器8の検出出力が入力されている。
【0031】さらに、図1において、21はピーク周波
数探査部、22は隣接周波数パワー監視部、23は狭帯
域ノイズ判定部、24はピーク周波数倍数関係検索部で
ある。
【0032】ピーク周波数探査部21は、加算器15の
出力信号から狭帯域信号のピーク周波数を割り出すもの
であって、割出されたピーク周波数は隣接周波数パワー
監視部22及びピーク周波数倍数関係検索部24に出力
される。また、狭帯域ノイズ判定部23はピーク周波数
がノイズによって生成されたものか、音声信号によるも
のかを判定し、その結果によって減衰制御信号を帯域別
パワー減衰部18に出力している。
【0033】以下、上記実施の形態1のノイズ抑圧動作
について説明する。
【0034】本発明が適用される背景雑音消去装置にお
いては、少なくとも装置始動の直後(これを「装置始動
期間」という)には、雑音のみで音声の無い期間(これ
を「雑音期間」という)が存在し、その後に、雑音が含
まれる音声を受信して、その雑音を消去する期間(これ
を「音声期間」という)が継続するものとする。勿論、
音声期間の途中に雑音期間は挿入され得る。また、背景
ノイズが狭帯域成分のノイズであるとき、これを「狭帯
域ノイズ期間」という。
【0035】はじめに、雑音期間の信号が入力端子IN
からA/D変換器1に入力されるものとして、以下の説
明を行う。この実施の形態1では、入力信号のフレーム
の区切り方としては、ディジタル信号の256サンプル
で1フレームを構成するものとするが、適切に決めれ
ば、この値は256サンプルに限られない。
【0036】A/D変換器1の出力は、音声検出器8と
窓関数演算器2に入力される。音声検出器8における音
声検出の方法は、長時間、短時間の時間平均を用いる方
法など、音声の有無を区別する方法であればどのような
方法でも良い。
【0037】音声検出器8で判定された検出結果は、第
2のカウンタ20を介して、あるいは直接に平滑演算器
19に入力され、その処理動作を制御する。この平滑演
算器19における処理動作の詳細については、後述す
る。
【0038】FFT3では、窓関数演算器2の出力が高
速フーリエ変換処理によつて周波数領域の信号成分に変
換される。この際、FFT3の周波数領域出力として虚
数成分と実数成分とが発生し、これらの信号成分をそれ
ぞれ信号位相計算器4と信号パワー計算部14に出力さ
れる。信号位相計算器4では、得られた信号の位相に関
する値を計算して、保持している。なお、この位相に関
する値は、 余弦成分=(実成分)2/(信号パワーP)2 正弦成分=(虚成分)2/(信号パワーP)2 等のように、IFFT5で必要とされる形で保存するこ
とが好ましい。
【0039】信号パワー計算部14では、フーリエ変換
された周波数領域の信号成分から信号パワーP、例えば
自乗平均パワーが計算される。すなわち、以下の式
(1)によるパワーp(k)が求めれらる。
【0040】 p(k)={実数成分(k)2+虚数成分(k)21/2 (1) 装置始動時の初期状態ではスイッチ10は閉じられてい
るから、信号パワー計算部14での演算結果であるパワ
ーp(k)は、このスイッチ10を経由して背景雑音更
新部11に出力される。前述したように、スイッチ10
は音声検出器8での音声検出結果によって開閉制御され
るものであって、音声検出器8の検出結果が有音である
とき、即ち音声期間にはスイッチ10を開く。また、音
声検出器8の検出結果が無音となる雑音期間にはスイッ
チ10を閉じるように制御される。
【0041】なお、信号パワー計算部14では、(1)
式に示す平方根計算を実行しているが、平方根を計算せ
ずに、p(k)2 を背景雑音更新部11に入力しても良
い。
【0042】図2は、背景雑音更新部11の具体的な構
成を示すブロック図である。この図において、201、
203は乗算器、202は加算器、204は背景雑音保
持器12を構成する遅延レジスタ(D)である。スイッ
チ10を経由した信号p(k)は、背景雑音更新部11
の乗算器201に入力される。また、この乗算器201
には、平均化の追従速度を決定する係数値αが入力さ
れ、乗算器203には係数値(1−α)が入力される。
その結果、加算器202の出力値として、以下の式
(2)で表わされる推定背景ノイズのパワーN′(k)
が求められる。ここで、変数kは時間軸上のサンプル点
に相当し、N′(k)は第k回目の更新結果であること
を表している。
【0043】 N′(k)=α(p(k))+(1−α)N′(k−1) (2) また、平均化の追従速度を決定する係数であるαは、装
置の初期立ち上がりの際、あるいは最後に音声検出結果
が有音であった時間からしばらくの時間は、大きな値α
1、たとえば1.0に設定されるが、その他の場合は小さ
な値α2、たとえばに0.1に設定される。この時間の監
視は第1のカウンタ9で行われ、以下の手順で係数設定
される。
【0044】まず、第1のカウンタ9では、装置が初期
の動作開始からの時間t、あるいは背景ノイズ状態変化
から一定期間の時間tを計数している。この第1のカウ
ンタ9で時間tを計数することによって、一般に予め設
定された閾値t1 、例えば500msを越えていない期間に
は、上記係数αを、 α≦1.0 の範囲で大きく設定される。この実施形態では、時間閾
値t1 を64msに設定し、この値以下のタイミングには、
α=1.0に設定される。
【0045】また、上記t1 を超過した時間、即ち、 t≧t1 の場合には、上記説明したαよりも小さな値α1をαと
して設定する。このときα1<αの関係が成り立ってい
る。この実施形態では、α1=0.1としている。
【0046】このようにαを設定することにより、装置
の初期立ち上がりの特性を迅速に向上させ、音声期間直
後に発生する背景ノイズ攪乱をなくして音質を向上する
ことができる。
【0047】一方、背景雑音保持器12の出力である
N′(k)は、加算器15の−入力端子に入力される。
この加算器15の+入力端子には、信号パワー計算部1
4からのパワーp(k)が入力として供給され、加算器
15ではこれら背景雑音保持器12のN′(k)と信号
パワー計算部14のp(k)との間で減算が行われる。
即ち、次の(3)式が実行される。
【0048】 s(k)=p(k)−N′(k) (3) この(3)式で計算される減算結果s(k)は、S
(k)を音声信号パワー、Ν(k)を背景ノイズパワ
ー、e(k)を残差ノイズのパワーとすると、入力端子
INへの入力信号が音声信号とノイズとの混合信号であ
るときは、 s(k)=S(k)+N(k)−N′(k) =S(k)+e(k) (4) となる。また、(3)式の減算結果s(k)は、入力信
号がノイズのみであるときは、 s(k)=N(k)−N′(k) =e(k) (5) となる。そこで、推定背景ノイズのパワーN′(k)が
十分に収束していれば、実際の背景ノイズパワーN
(k)に等しくなるので、残差ノイズのパワーe(k)
は0となる。また、入力端子INへの入力信号が音声信
号とノイズとの混合信号であれば、(3)式の減算結果
s(k)は入力信号からノイズ成分を除去した信号のパ
ワーに等しくなっている。
【0049】つぎに、周波数帯域分割器13の動作につ
いて説明する。
【0050】(3)式の減算処理された信号s(k)
は、加算器15から周波数帯域分割器13に入力され、
帯域分割される。ここで帯域分割とは、信号処理を行お
うとする音声信号を、周波数軸上で表された、いくつか
の予め定められた小領域へと限定することを意味する。
したがって、従来のR.J.ビルマー等の「雑音抑圧方
式」のように、実際の入力信号の全周波数成分を分割帯
域(以下、チャンネルという)毎に分割した周波数信号
を個別に用意する必要はない。
【0051】ここでは、処理の対象となる全周波数帯域
(全チャンネル)、たとえば250〜3500ΗZを2
50ΗZ毎に等分割しても良いし、扱う音声信号に含ま
れる周波数が集中する範囲を重点的に細分化し、残りの
周波数領域の範囲は大まかな分割数で分割してもよい。
要するに、この分割の方法は適用する系によって、適切
に定めればどのようなものであってもかまわない。
【0052】この実施形態では、例えば図3に示すよう
に、250Ηz〜3500ΗZの帯域を250Hz毎に
13分割の等分割を行っている。また、背景雑音保持器
12からの出力も帯域分割器13に入力される。この場
合に、背景ノイズの帯域分割方法も、加算器15から出
力された信号を分割する分割方法と同一になる。
【0053】帯域分割器13で処理領域が定められた信
号は、対数計算部16に入力される。対数計算部16で
は、入力された残差信号e(k)、推定背景ノイズN′
(k)が、各々分割されたチャンネル毎に対数変換され
る。この対数変換の方法は、公知のもの、例えば、あら
かじめ定めた変換表を用いる方法であっても良いし、線
形近似などで対数を求める方法を使用してもかまわな
い。対数変換を施された信号はs/n計算部17に入力
される。
【0054】s/n計算部17は各チャンネル毎の領域
s/n計算器によって構成され、対応するs/n計算器
に入力された周波数信号に基づいて、各チャンネル毎の
s/n推定値が以下の様にして、S/Ν(m)として計
算される。すなわち、第k回目の更新結果による第mチ
ャンネルの信号パワーをE(k,m)とし、同じくその
背景ノイズパワーをΝ′(k,m)とすれば、 E(k、m)=ΣE(k、f) (6) N′(k、m)=ΣN′(k、f) (7) S/Ν(m)=logE(m)−logN′(m) (8) となる。これら(6)、(7)式において、Σはチャン
ネル開始周波数sfとチャンネル終了周波数efとの範
囲の周波数領域についての加算を意味する。たとえば、
今、第1チャンネルを250Ηz〜500Hzに設定す
るならば、sf=250、ef=500、m=1とな
る。
【0055】なお、この実施の形態では、対数計算部1
6を用いてs/nの計算を対数領域での減算によって行
っているが、より簡易な方法でも支障が無い場合は、直
接に(6)、(7)式の結果を用いて、E(m)/N′
(m)の除算を実行してもかまわない。
【0056】さて、先に説明したように有音時には、s
(k)≒S(K)であり、またN′(k)=N(k)で
あることから、上記(8)式は、 S/Ν(m)≒logE(m)−IogN(m) (8′) となる。これは、 音声信号パワー/推定背景ノイズパワー≒音声信号パワ
ー/背景ノイズパワー を対数で表したものである。これまでに説明したことか
ら、背景ノイズが音声信号に混入した入力信号であって
も、s/n計算部17においてチャンネル毎のs/nが
S/N(m)として正しく求められることがわかる。
【0057】つぎに、帯域別パワー減衰部18の動作に
ついて説明する。
【0058】s/n計算部17で計算された各チャンネ
ルのs/n推定値は、帯域別パワー減衰部18に入力さ
れる。帯域別パワ一減衰部18では、前述の帯域分割器
13から出力された信号を、s/n計算部17からの出
力、即ちチヤンネル毎のs/n推定値に応じて、減衰量
を決めて減衰させている。この減衰量の決定には、公知
の参照表をチャンネル毎に用いても良いし、評価式を定
め、それによってs/n推定値であるS/Ν(m)に応
じて減衰を与える方法であっても良い。この実施形態1
では、s/nを変数xとし、減衰量を関数値yとしたと
き、 y=−(2/3)x+20 :x≦30 (9) y=0 :x>30 (10) の評価式により決定している。したがって、(4)、
(5)式で表される残差ノイズe(k)は、各チャンネ
ルのs/nに応じて減衰を受ける。この結果、s/nの
小さい雑音周波数チャンネルだけが更に減衰を受けて、
全体として音質が向上される。
【0059】つぎに、平滑演算器19の動作について説
明する。
【0060】平滑演算器19は、可変のフィルタ係数β
を有する複数の平滑フィルタ(図示せず)で構成され
る。この平滑演算器19には、帯域別パワー減衰部18
の出力が入力される。ここには、この他に、音声検出器
8からの検出出力と、第2のカウンタ20からの出力信
号とが入力されている。また、第2のカウンタ20には
音声検出器8の検出出力が入力されている。第2のカウ
ンタ20は、装置の初期立ち上げ後に、または音声検出
器8が最後に有音と判定した後に、即ち音声が途絶えて
からの経過時間t3を計数している。この第2のカウン
タ20では、その計数結果t3が予め設定された閾値n
v3よりも大きくなったとき、平滑演算器19に係数制
御信号を出力して、平滑フィルタの係数βをβ1に変更
する。それ以外のタイミングでは、平滑フィルタの係数
βはβ≦1.0の範囲で、例えば以下のようなβ2に設定
している。また、音声検出器8の検出結果が音声期間で
あったときには、係数βは例えば以下のようなβ3に設
定される。なお、これら係数値β1及びβ2、β3の関
係は、次の(11)式で規定される。
【0061】 1.0≧β2≧β3≧β1≧0.0 (11) この実施形態では、 nv3=48ms、β2=1.0、β3=0.3、β1=0.1 としている。しかし、これらβの値は、系を適用する構
成に最適なものを設定すればよく、実施の形態の数値に
限定するものではない。
【0062】この平滑演算器19では、以下の様に平滑
信号sth(k)を作成して、IFFT5に出力してい
る。
【0063】 sth(k)=β×e(f,k)+(1−β)×sth(k−1) (12) ここで、βは定数である。
【0064】 β=1.0 :t3≦nv3 (13) β=0.1 :t3>nv3 (14) β=0.8 :音声期間 このように、平滑演算器19では各周波数で時間平均を
施された信号として平滑信号sth(k)を出力する。こ
の平滑信号sth(k)はIFFT5に入力される。IF
FT5では、周波数領域の信号を時間領域の信号に変換
するが、時間領域の信号に変換した後、高速逆フーリエ
変換の出力を窓関数オーバラップ演算部6を介してD/
A変換器7に出力している。なお、高速逆フーリエ変換
の出力をそのままD/A変換器7に出力しても良いが、
hamming窓等の窓関数を用いて窓関数をオーバラップす
ることによって、出力信号のつながりを滑らかにするこ
とができる。この実施の形態では、公知のハミング窓関
数を用い、窓関数を50%の重複する窓関数オーバラッ
プ演算部6を使用している。窓関数オーバラップ演算部
6からの出力は、D/A変換器7に出力される。D/A
変換器7ではディジタル信号をアナログ信号に変換し、
出力端子OUTへと出力する。
【0065】つぎに、狭帯域ノイズの判定動作について
説明する。上記加算器15の出力はピーク周波数探査部
21に入力され、このピーク周波数探査部21では、周
波数領域の信号に含まれるピークを示す周波数を割り出
している。そこで、このピーク周波数探査部21におけ
る一つのピーク検出方法について説明する。
【0066】図3は、ピークを有する周波数特性の一例
を示す図である。なお、横軸は周波数、縦軸は自乗平均
パワーである。
【0067】まず、周波数全域にわたってパワーの平均
値avl1を求める。その平均値avl1を、各チャン
ネルのパワーE(m)と比較する。そして、ピーク周波
数探査部21に予め設定されたピーク検出閾値thpeek
と平均値avl1を加算した値が以下の関係であればピ
ーク有りとして、そのチャンネルmをピーク特性を含む
チャンネルであると判定する。
【0068】E(m)≧avl1+thpeek ピーク
有りチャンネル E(m)<avl1+thpeek ピークなしチャンネ
ル 図4は、ピーク周波数探査部21でピーク特性を求める
第2の方法を示している。この第2の方法では、次の
(15)式から全周波数の帯域にわたって所定の周波数
間隔でパワーfの差分符号def(k)を求める。即
ち、 def(k)=f(k+1)−f(k) (15) ここで、kは整数であり、{(高速フーリエ変換時のサ
ンプル数)−1}を最大とする整数である。図4から分
かるように、周波数の小さい方向から(15)式による
演算を実施すると、パワーfが増加する間は常に、 def(k)>0 であり、パワーが減少する場合には、 def(k)<0 となる。ただし、def(k)=0の場合はパワーが増
加する場合と同様の取り扱いを行う。
【0069】つぎに、ピークを計算するために、以下の
(16−1)、(16−2)式に基づいてピーク符号p
eek(k)を計算する。
【0070】すなわち、def(k)≧0の時、 peek(k)=def(k)×def(k+1) (16−1) として、def(k)<0の時、 peek(k)=const:const=正の定数 (16−2) とする。
【0071】これら(16−1)、(16−2)式を演
算して、peek(k)≧0であればピークは無しと判
定し、peek(Κ)<0であればピークが存在し、そ
のピークの周波数はf(k)であると判定する。以上の
判定動作は、ピーク周波数探査部21の内部で行われ
る。図4では、fl及びf2にピーク成分が有る場合で
あって、それぞれ差分符号def(k)とピーク符号の
例を示している。この実施の形態では、第2の方法、即
ち(16−1)、(16−2)式に基づいた方法によっ
てピーク周波数探査を実行している。
【0072】つぎに、このようなピーク周波数探査方法
の結果を用いて狭帯域ノイズの判定を行う方法について
説明する。
【0073】上記ピーク周波数探査部21では、ピーク
成分の有無、及びピーク周波数を分析し終えると、その
結果を隣接周波数パワー監視部22に出力する。隣接周
波数パワー監視部22では、ピーク周波数探査部21で
検出された周波数を中心に、ピーク周波数以外の上下Δ
fの周波数、たとえば上下20Hzの周波数のパワーp
f3を計算する。この計算結果は、さらに狭帯域ノイズ判
定部23に入力される。そして、狭帯域ノイズ判定部2
3ではこのパワーpf3と予め設定した閾値th2との関
係から、以下のようにして、検出したピーク性をもつ加
算器15の出力信号s(k)に狭帯域雑音が含まれてい
るか否かを判定している。ここでは、音声信号と狭帯域
ノイズのパワー成分との間の次の様な相違を利用してい
る。すなわち、音声信号のピークであればそのピークは
緩やかであって、ピーク周辺にもある程度のパワー成分
が存在するが、狭帯域ノイズのパワー成分であればその
ピークが急峻であって、ピーク周波数の付近には、ピー
ク周波数でのパワーほど大きなパワーが存在しないこと
を利用したものである。
【0074】 pf3≦th2 狭帯域ノイズ (17) pf3>th2 音声信号 (18) ここでth2は、予め定めた狭帯域検出の定数であっ
て、この実施形態では、上下20Hzの周波数のパワー
pf3の計算値に応じて、th2=pf3/2.0に設定して
いる。しかし、このth2の値は発明を適用する信号や
回路構成に応じて適宜に定めることができ、この数値に
限定されるものではない。
【0075】狭帯域ノイズ判定部23では、(17)式
の条件が検出されると、帯域別パワー減衰部18に対し
て、ピークが含まれているチャンネルのパワーを減衰さ
せる様に制御信号を出力する。帯域別パワー減衰部18
では、このピークが含まれるチャンネルのパワーを選択
的に減衰させる。したがって、帯域別パワー減衰部18
の出力は狭帯域信号、特に隣接チャンネルにパワーの少
ない定常的な狭帯域雑音が除去された出力となる。
【0076】また、ピーク周波数探査部21の出力は、
ピーク周波数倍数関係検索部24にも出力される。ピー
ク周波数倍数関係検索部24ではピーク周波数探査部2
1で見つけたピーク周波数に対して、その倍数関係にな
い周波数成分にピークが存在しているかどうかを検出す
る。
【0077】図5は、音声信号に非定常なピークを有す
る狭帯域雑音が混入した場合の入力信号の周波数特性を
示す図である。図5は、ピーク雑音と音声信号が入力さ
れた時の、加算器15の出力信号s(k)の特性に相当
する。以下、ピーク周波数倍数関係検索部24の動作に
ついて説明する。
【0078】図5において、横軸は周波数である。ピー
ク周波数倍数関係検索部24にはピーク周波数探査部2
1から、検出結果として周波数fl〜f7のピーク特性
を持つことが入力されている。そこで、ピーク周波数倍
数関係検索部24はそれぞれのピーク周波数fl〜f7
に対して、そのピークが倍数関係の周波数として検出さ
れているかどうかの検索を行う。検索の方法には、検出
周波数どうしの剰余計算が実行される。これを図5の例
で説明すると、f6以外の周波数では、互いに倍数関係
がある。たとえばf1とf2では、 mod(f2,f1)=0 となる。ここでmod(a,b)とは、aをbで除算し
たときの剰余を表す。
【0079】このように、ピーク周波数倍数関係検索部
24では互いに倍数関係にない、独立した狭帯域信号が
検出される。狭帯域ノイズ判定部23は、ピーク周波数
倍数関係検索部24での検出結果として、mod(a,
b)が0とならない周波数を狭帯域雑音と判定する。図
5の例では、f6の周波数が狭帯域雑音と判定される。
判定結果は帯域別パワー減衰部18に出力され、帯域別
パワー減衰部18で、前述した判定結果の周波数f6、
もしくはこの周波数f6が含まれるチャンネルのパワー
を減衰する。このようにして、時間的に変動する狭帯域
性のノイズ成分を除去した音声信号を得ることができ
る。なお、この減衰された信号は平滑演算器19に入力
され、その後の処理は先に説明した通りである。
【0080】実施の形態2 図6は、本発明の第2の実施の形態を示すブロック図で
ある。第1の実施の形態(図1)と対応するブロックに
は、同一の参照番号を付けて、それらの説明は省略す
る。
【0081】この第2の実施の形態では、狭帯域ノイズ
判定部23で狭帯域ノイズと判定した周波数を帯域分割
器13へと出力し、更にこの帯域分割器13では、判定
結果である狭帯域信号を背景雑音保持器12に出力し
て、加算器15で狭帯域ノイズ周波数のパワーを背景雑
音として減算する構成とした。すなわち、背景雑音保持
器12は、出力された狭帯域信号を含めてノイズと見な
して、加算器15に出力する。加算器15では背景雑音
保持器12から出力された狭帯域信号に基づいて更新さ
れた新しい背景ノイズ推定値が、信号パワーs(k)か
ら減算される。このため加算器15の出力は、狭帯域ノ
イズのパワー成分が削除された信号となる。なお、帯域
分割器13から背景雑音保持器12への出力は、狭帯域
ノイズ判定部23からの出力があったときのみ出力され
る。
【0082】ここでは本発明を電話機の送話部における
背景雑音消去装置として説明したが、電話機の他に、音
声入力装置、録音機等の音声の入力を伴う装置について
も適用可能である。
【0083】
【発明の効果】この発明は、以上に説明したように構成
されているので、以下に示すような効果を奏する背景雑
音消去装置を提供できる。
【0084】第1に、信号パワー計算部で計算したパワ
ーから、背景雑音保持器で推定され、保持されている背
景雑音のパワーを常に減算しているから、従来の技術で
問題となった時間変動が細かい背景ノイズを除去でき
る。
【0085】第2に、平滑演算器のフィルタ係数を可変
にして、装置の初期立ち上がり応答を俊敏にしたので、
背景ノイズが急変しても、処理音を安定して取り出すこ
とができ、劣化することがない。
【0086】第3に、各ピーク周波数の倍数関係を計算
することによって、音声が継続的に入力されても消去さ
れることがなく、そのため通話品質が優れている。
【0087】第4に、ピーク信号の隣接パワーを監視す
るようにしたため、音声信号の周波数特性が、周波数的
な大きな広がりを持たない(母音など)成分の時でもこ
れをノイズとみなして強制的に消去してしまう事がな
い。
【図面の簡単な説明】
【図1】 この発明の実施の形態1を示すブロック図で
ある。
【図2】 背景雑音更新部の具体的な構成を示すブロッ
ク図である。
【図3】 ピークを有する周波数特性の一例を示す図で
ある。
【図4】 ピーク周波数探査部でピーク特性を求める第
2の方法を示す図である。
【図5】 音声信号に非定常なピークを有する狭帯域雑
音が混入した場合の入力信号の周波数特性を示す図であ
る。
【図6】 この発明の実施の形態2を示すブロック図で
ある。
【符号の説明】
1 アナログ/ディジタル変換器、2 窓関数演算器、
3 高速フーリエ変換器、4 信号位相計算器、5 高
速逆フーリエ変換器、6 窓関数オーバラップ演算部、
7 ディジタル/アナログ変換器。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−230798(JP,A) 特開 平3−266899(JP,A) 特開 昭57−20876(JP,A) 特開 平7−306695(JP,A) 特開 平4−340599(JP,A) 特開 昭58−123599(JP,A) 特表 昭63−500543(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 21/02

Claims (11)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声が雑音成分を含んで入力された入力
    信号から周波数領域での減算によって雑音成分を除去す
    る背景雑音消去装置において、 上記入力信号内の音声の有無を検出する音声検出手段
    と、 上記入力信号のパワーを計算する信号パワー計算手段
    と、 上記音声検出手段による音声検出が終了してから所定の
    時間だけ背景雑音を推定し、その推定値を保持する背景
    雑音推定保持手段と、 上記信号パワー計算手段で計算された信号パワーから背
    景雑音推定保持手段の背景雑音パワーを減算して出力す
    る演算手段とを備えることを特徴とする背景雑音消去装
    置。
  2. 【請求項2】 上記演算手段から出力される信号パワー
    を平滑化する平滑演算手段を備え、上記背景雑音更新手
    段により、装置の初期立ち上がり、及び、音声期間終了
    後の一定時間は上記平滑演算手段における平滑演算を急
    峻に行い、そのほかは緩やかに行うことを特徴とする請
    求項1に記載の背景雑音消去装置。
  3. 【請求項3】 上記背景雑音推定保持手段は、 推定した背景雑音を保持する背景雑音保持器と、 上記音声検出器での検出結果により背景ノイズの更新を
    止めるスイッチとを含むことを特徴とする請求項1また
    は2に記載の背景雑音消去装置。
  4. 【請求項4】 上記背景雑音更新手段は、音声期間、装
    置始動期間、雑音期間で、それぞれ上記平滑演算手段の
    平滑演算係数を変更することを特徴とする請求項2に記
    載の背景雑音消去装置。
  5. 【請求項5】 上記演算手段の出力を予め定めた複数の
    帯域に分割する帯域分割器と、 上記帯域分割器で分割された各帯域毎の信号値を対数変
    換する対数計算部と、 上記対数計算部で計算された対数値に基づいて各領域毎
    にs/nを計算するs/n計算部と、 計算されたs/nに従って帯域別に各チャンネルのパワ
    ーを減衰させるパワー減衰部と、 上記パワー減衰部の出力を平滑化する平滑演算器とを備
    え、上記平滑演算器の係数を可変にすることを特徴とす
    る請求項1乃至4のいずれかに記載の背景雑音消去装
    置。
  6. 【請求項6】 上記平滑演算器の平滑処理は、装置の初
    期立ち上がり、及び、音声期間終了後一定時間は急峻に
    行い、そのほかは緩やかに行うことを特徴とする請求項
    5に記載の背景雑音消去装置。
  7. 【請求項7】 狭帯域信号のピーク周波数を割り出すピ
    ーク周波数探査部と、 上記ピーク周波数探査部の出力からピーク周波数の隣接
    周波数におけるパワー計算を行う隣接周波数パワー監視
    部と、 上記隣接周波数パワー監視部から狭帯域ノイズを判定す
    る狭帯域ノイズ判定部とを備え、 上記狭帯域ノイズ判定部の判定結果に応じて、特定チャ
    ンネル、もしくは特定周波数の成分を減衰させて狭帯域
    ノイズを除去することを特徴とする請求項1乃至6のい
    ずれかに記載の背景雑音消去装置。
  8. 【請求項8】 上記ピーク周波数探査部の探査結果に基
    づいて各ピーク周波数の倍数関係を計算するピーク周波
    数倍数関係検索部と、 上記隣接周波数パワー監視部と上記ピーク周波数倍数関
    係検索部とから、狭帯域ノイズを判定する狭帯域ノイズ
    判定部とを備えることを特徴とする請求項7に記載の背
    景雑音消去装置。
  9. 【請求項9】 上記狭帯域ノイズ判定部の判定結果に応
    じて、上記パワー減衰部で作成されるゲインを用いて減
    少させることによって、上記特定周波数を減衰すること
    を特徴とする請求項7または請求項8に記載の背景雑音
    消去装置。
  10. 【請求項10】 上記狭帯域ノイズ判定部の判定結果に
    応じて、上記帯域分割器の特定の周波数成分を上記背景
    雑音保持器に加算し、さらに上記演算手段によって入力
    信号から減算させることによって、上記特定周波数を減
    衰することを特徴とする請求項7または請求項8に記載
    の背景雑音消去装置。
  11. 【請求項11】 上記入力信号をディジタル信号に変換
    するA/D変換器と、 上記ディジタル信号を高速フーリエ変換処理によつて周
    波数領域の信号に変換する高速フーリエ変換器と、 周波数領域の信号を時間領域の信号に再変換する高速逆
    フーリエ変換器と、 再変換されたディジタル信号をアナログ信号に変換する
    D/A変換器とを備えることを特徴とする請求項1乃至
    10のいずれかに記載の背景雑音消去装置。
JP33177095A 1995-12-20 1995-12-20 背景雑音消去装置 Expired - Fee Related JP3204892B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33177095A JP3204892B2 (ja) 1995-12-20 1995-12-20 背景雑音消去装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33177095A JP3204892B2 (ja) 1995-12-20 1995-12-20 背景雑音消去装置

Publications (2)

Publication Number Publication Date
JPH09171397A JPH09171397A (ja) 1997-06-30
JP3204892B2 true JP3204892B2 (ja) 2001-09-04

Family

ID=18247435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33177095A Expired - Fee Related JP3204892B2 (ja) 1995-12-20 1995-12-20 背景雑音消去装置

Country Status (1)

Country Link
JP (1) JP3204892B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4533126B2 (ja) * 2004-12-24 2010-09-01 日本電信電話株式会社 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
JP2008052117A (ja) * 2006-08-25 2008-03-06 Oki Electric Ind Co Ltd 雑音除去装置、方法及びプログラム
CN101465122A (zh) * 2007-12-20 2009-06-24 株式会社东芝 语音的频谱波峰的检测以及语音识别方法和系统
JP5678445B2 (ja) * 2010-03-16 2015-03-04 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
CN112615648B (zh) * 2020-12-02 2023-11-10 江苏芯云电子科技有限公司 一种用于电力线载波通信Rx过程中的精准抗窄带噪声方法

Also Published As

Publication number Publication date
JPH09171397A (ja) 1997-06-30

Similar Documents

Publication Publication Date Title
US5839101A (en) Noise suppressor and method for suppressing background noise in noisy speech, and a mobile station
JP4279357B2 (ja) 特に補聴器における雑音を低減する装置および方法
US6687669B1 (en) Method of reducing voice signal interference
US7366294B2 (en) Communication system tonal component maintenance techniques
EP2008379B1 (en) Adjustable noise suppression system
JP4307557B2 (ja) 音声活性度検出器
US9373343B2 (en) Method and system for signal transmission control
KR950011964B1 (ko) 신호처리장치
AU756511B2 (en) Signal noise reduction by spectral subtraction using linear convolution and causal filtering
US20040078199A1 (en) Method for auditory based noise reduction and an apparatus for auditory based noise reduction
EP1806739B1 (en) Noise suppressor
US20090024387A1 (en) Communication system noise cancellation power signal calculation techniques
RU2684194C1 (ru) Способ получения кадра модификации речевой активности, устройство и способ обнаружения речевой активности
CN106663450B (zh) 用于评估劣化语音信号的质量的方法及装置
CN111554315A (zh) 单通道语音增强方法及装置、存储介质、终端
JP3269969B2 (ja) 背景雑音消去装置
EP1995722B1 (en) Method for processing an acoustic input signal to provide an output signal with reduced noise
JP2000047697A (ja) ノイズキャンセラ
JP2000330597A (ja) 雑音抑圧装置
JP3204892B2 (ja) 背景雑音消去装置
JP4123835B2 (ja) 雑音抑圧装置および雑音抑圧方法
JP2001159899A (ja) 騒音抑圧装置
JPH08160994A (ja) 雑音抑圧装置
JP2001516902A (ja) デジタル音声信号中のノイズを抑制する方法
JP3693022B2 (ja) 音声認識方法及び音声認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010619

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090629

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090629

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130629

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees