JPH08221094A

JPH08221094A - 音声信号の雑音低減方法及び装置

Info

Publication number: JPH08221094A
Application number: JP7029337A
Authority: JP
Inventors: Jiyosefu Chiyan; チャン・ジョセフ; Masayuki Nishiguchi; 正之西口
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1995-02-17
Filing date: 1995-02-17
Publication date: 1996-08-30
Anticipated expiration: 2018-10-06
Also published as: PL312846A1; DE69612770T2; KR100394759B1; ATE201276T1; CA2169422A1; MY114695A; TW291556B; AU4444596A; ES2158992T3; CN1141548A; US5752226A; EP0727768B1; EP0727768A1; DE69612770D1; KR960032293A; JP3453898B2; TR199600131A2; BR9600762A; SG52257A1; CN1083183C

Abstract

(57)【要約】【目的】入力信号の雑音抑圧を行うのに演算を簡略化
すると共に、入力信号中の子音部分の抑圧を抑えること
が可能になる。【構成】入力音声信号から雑音除去することで雑音抑
圧を行うと共に、雑音低減量が制御信号に応じて可変で
ある雑音低減処理部としてのスペクトラム修正部１０
と、上記入力音声信号に含まれる子音部分を検出する子
音部分検出手段である子音検出部４１と、上記子音部分
検出手段にて得られる子音検出結果に応じて上記雑音低
減量を抑える制御を行う制御手段としてのＨｎ値計算部
７とを有して成るものである。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、入力音声信号から雑音
除去することで雑音抑圧を行う音声信号の雑音低減方法
に関し、また、上記音声信号の雑音低減方法に基づいた
雑音除去を行う音声信号の雑音低減装置に関する。

【０００２】

【従来の技術】携帯用電話機や音声認識等の応用におい
て、収音された音声信号に含まれる環境雑音や背景雑音
等の雑音を抑圧し、音声成分を強調することが必要とさ
れている。

【０００３】このような音声強調、あるいは雑音低減の
技術として、減衰ファクタの調整のために条件付き確率
関数を用いる例が、文献「軟判定雑音抑圧フィルタを用
いる音声強調」（Speech Enhancement Using a SoftーDe
cision Noise Suppression Filter, R.J.McAulay, M.L.
Malpass, IEEE Trans. Acoust., Speech, Signal Proce
ssing, Vol.28, pp.137-145, April 1980 ）や、「移動
電話システムにおける周波数領域雑音抑圧研究」（Freq
uency Domain Noise Suppression Approach inMobil Te
lephone Systems, J.Yang, IEEE ICASSP, Vol.II, pp.3
63-366, April1993 ）等に開示されている。

【０００４】

【発明が解決しようとする課題】しかしながら、これら
の雑音抑圧技術においては、不適切な固定のＳＮＲ（信
号対雑音比）に基づく動作をするため、または不適切な
抑圧フィルタにより、音色の不自然さや歪んだ音声を生
ずることがある。実際の運用の際に、最適の性能を得る
ために雑音抑圧装置のパラメータの１つであるＳＮＲを
調整することは、ユーザにとって望ましいことではな
い。さらに、従来の音声信号強調技術は、短時間ＳＮＲ
の大きな変動がある音声信号に対して副作用として発生
してしまう歪を持たせずに充分雑音を除去することは困
難である。

【０００５】また、このような音声強調、あるいは雑音
低減方法においては、雑音区間検出の技術が用いられ、
入力レベルやパワー等を所定の閾値で比較することによ
り、雑音区間判別を行っているが、音声にトラッキング
することを防ぐために閾値の時定数を大きくすると、ノ
イズレベルが変化するとき、特に増加するときに追従で
きなくなり、誤判別が生じ易くなる。

【０００６】ここで、本発明人は、上述した問題を解決
するために、特願平６−９９８６９号において、音声信
号の雑音低減方法を提案している。

【０００７】上記音声信号の雑音低減方法は、入力音声
信号に基づいて算出された信号レベルと雑音レベルとの
比いわゆるＳＮ比及び音声存在確率に基づいて、音声成
分を算出するための最尤フィルタを適応的に制御するこ
とで雑音抑圧を行う音声信号の雑音低減方法であって、
上記音声存在確率の算出に、入力信号のスペクトルから
推定雑音スペクトルを減算したものを用いることを特徴
とするものである。

【０００８】また、上記音声信号の雑音低減方法によれ
ば、上記最尤フィルタが上記入力音声信号のＳＮ比に応
じて最適の抑圧フィルタに調整されるため、上記入力音
声信号に対して充分な雑音除去を行うことが可能であ
る。

【０００９】ところが、上記音声存在確率を算出するの
に、複雑な演算を有すると共に、膨大な演算量が要求さ
れるため、演算の簡略化が望まれる。

【００１０】また、上記入力音声信号中の子音、特にこ
の入力音声信号のバックグランドノイズ中に存在する子
音が抑圧され易いため、子音成分を抑圧しないような改
善が望まれる。

【００１１】そこで、本発明は、上述した実情に鑑みて
なされたものであり、入力信号の雑音抑圧を行うのに演
算を簡略化すると共に、入力信号中の子音部分の抑圧を
抑えることが可能である音声信号の雑音低減方法及びこ
の音声信号の雑音低減方法が適用される音声信号の雑音
低減装置を提供することを目的とする。

【００１２】

【課題を解決するための手段】本発明に係る音声信号の
雑音低減方法は、上述した問題を解決するために、入力
音声信号から雑音除去することで雑音抑圧を行う音声信
号の雑音低減方法であって、上記入力音声信号に含まれ
る子音部分を検出する工程と、上記子音部分を検出する
工程にて得られる子音検出結果に応じて、上記入力音声
信号から雑音を除去する際の雑音低減量を抑える制御を
行う工程とを有するものである。

【００１３】また、本発明は、上記音声信号の雑音低減
方法において、上記入力音声信号を周波数軸の信号に変
換する変換工程を設けて、上記雑音低減量を抑える制御
を行う工程は、上記変換工程にて得られる入力信号スペ
クトルに基づいて設定されるフィルタ特性を、上記子音
部分を検出する工程にて得られる子音検出結果に応じて
可変制御する工程であるものである。

【００１４】また、本発明は、上述の各音声信号の雑音
低減方法において、上記子音部分を検出する工程は、上
記入力音声信号の短区間でのエネルギの変化と、上記入
力音声信号の周波数成分の分布を示す値と、上記入力音
声信号中のゼロクロスの数との少なくとも１つを用い
て、上記入力音声信号中において検出される音声信号部
分の近傍で子音検出を行う工程であるものである。

【００１５】さらに、本発明は、上述の各音声信号の雑
音低減方法において、上記入力音声信号の周波数成分の
分布を示す値は、高域における入力音声信号のスペクト
ルの平均レベルと、低域における入力音声信号のスペク
トルの平均レベルとの比に基づいて求められる値として
いる。

【００１６】また、本発明は、上述の各音声信号の雑音
低減方法において、上記フィルタ特性は、上記変換工程
にて得られる入力信号スペクトルと、上記入力信号スペ
クトル中に含まれる推定雑音スペクトルとの比に基づい
て求められる第一の値と、上記入力信号スペクトルの信
号レベルと推定雑音レベルとの比の最大値、推定雑音レ
ベル及び子音検出結果を示す子音効果因子に基づいて求
められる第二の値とで制御されるものとしている。

【００１７】また、本発明に係る音声信号の雑音低減装
置は、入力音声信号から雑音除去することで雑音抑圧を
行うと共に、雑音低減量が制御信号に応じて可変である
雑音低減処理部と、上記入力音声信号に含まれる子音部
分を検出する子音部分検出手段と、上記子音部分検出手
段にて得られる子音検出結果に応じて上記雑音低減量を
抑える制御を行う制御手段とを有して成るものである。

【００１８】また、本発明は、上記音声信号の雑音低減
装置において、上記入力音声信号を周波数軸の信号に変
換する変換手段を設けて、上記子音部分検出手段は、上
記変換手段にて得られる入力信号スペクトルから子音検
出を行うものである。

【００１９】また、本発明は、上述の各音声信号の雑音
低減装置において、上記制御手段は、上記雑音低減量を
決定するフィルタ特性を、上記子音検出結果に応じて可
変制御するものである。

【００２０】さらに、本発明は、上述の各音声信号の雑
音低減装置において、上記フィルタ特性は、上記入力信
号スペクトルと、上記入力信号スペクトル中に含まれる
推定雑音スペクトルとの比に基づいて求められる第一の
値と、上記入力信号スペクトルの信号レベルと推定雑音
レベルとの比の最大値、推定雑音レベル及び子音検出結
果を示す子音効果因子に基づいて求められる第二の値と
で制御されるものである。

【００２１】また、本発明は、上述の各音声信号の雑音
低減装置において、上記子音部分検出手段は、上記入力
音声信号の短区間でのエネルギの変化と、上記入力音声
信号の周波数成分の分布を示す値と、上記入力音声信号
中のゼロクロスの数との少なくとも１つを用いて、上記
入力音声信号中において検出される音声信号部分の近傍
で子音検出を行うものである。

【００２２】また、本発明は、上述の各音声信号の雑音
低減装置において、上記入力音声信号の周波数成分の分
布を示す値は、高域における入力音声信号のスペクトル
の平均レベルと、低域における入力音声信号のスペクト
ルの平均レベルとの比に基づいて求められるものであ
る。

【００２３】

【作用】本発明の音声信号の雑音低減方法によれば、入
力音声信号から子音部分を検出し、この子音が検出され
たところで雑音低減量を抑えるように、上記入力音声信
号から雑音を除去して雑音抑圧を行うため、雑音抑圧を
行う際に子音部分をも除去することが回避される。

【００２４】また、上記音声信号の雑音低減方法におい
て、変換工程を設ける場合、上記変換工程にて上記入力
音声信号が周波数軸の信号に変換され、上記子音部分の
検出が上記周波数軸の信号毎に行われ、この子音検出結
果に応じて、各周波数軸の信号に対してフィルタ特性が
設定され、このフィルタ特性に応じて雑音抑圧が行われ
る。

【００２５】また、本発明によれば、上記子音部分の検
出は、上記入力音声信号の短区間でのエネルギの変化
と、上記入力音声信号の周波数成分の分布を示す値と、
上記入力音声信号中のゼロクロスの数とを算出して、こ
れら値の少なくとも１つを用いて、上記入力音声信号中
の音声信号部分の近傍で行われる。

【００２６】さらに、本発明によれば、上記入力音声信
号の周波数成分の分布を示す値は、上記入力音声信号の
高域における平均レベルと、上記入力音声信号の低域に
おける平均レベルとの比をとることで算出される。

【００２７】また、本発明によれば、上記フィルタ特性
を制御するための第一の値は、上記変換工程にて上記入
力音声信号から得られる入力信号スペクトルと、この入
力信号スペクトル中に含まれる雑音推定スペクトルとの
比に基づいて算出される値であると共に、上記フィルタ
特性の初期値を設定する。また、上記フィルタ特性を制
御するための第二の値は、上記入力信号スペクトルの信
号レベルと推定雑音レベルとの比の最大値いわゆる推定
最大ＳＮ比、推定雑音レベル及び子音検出結果を示す子
音効果因子に基づいて算出される値であると共に、上記
フィルタ処理による最大雑音低減量を略線形的に変化さ
せるように上記フィルタ特性を可変制御する。

【００２８】また、本発明の音声信号の雑音低減装置に
よれば、雑音低減処理部にてなされる雑音抑圧の雑音低
減量が、制御手段にて、子音部分検出手段にて検出され
る入力音声信号の子音部分に基づいて、例えば子音部分
が検出されるとこの雑音低減量が抑えられるように可変
制御される。

【００２９】また、本発明において変換手段を設ける場
合、この変換手段にて上記入力音声信号が周波数軸に変
換され、上記子音部分検出手段にて、この周波数軸の信
号毎に子音部分が検出される。

【００３０】また、本発明によれば、上記制御手段は、
上記雑音低減量を決定するフィルタ特性を可変制御する
ことで、この雑音低減量は子音検出結果に応じて抑えら
れる。

【００３１】また、本発明によれば、上記フィルタ特性
を制御するための第一の値は、上記変換工程にて得られ
る入力信号スペクトルと、この入力信号スペクトル中に
含まれる雑音推定スペクトルとの比に基づいて算出され
る値であると共に、上記フィルタ特性の初期値を設定す
る。また、上記フィルタ特性を制御するための第二の値
は、上記入力信号スペクトルの推定最大ＳＮ比、推定雑
音レベル及び子音検出結果を示す子音効果因子に基づい
て算出される値であると共に、上記フィルタ処理による
最大雑音低減量を略線形的に変化させるように上記フィ
ルタ特性を可変制御する。

【００３２】また、本発明によれば、子音部分の検出
は、上記入力音声信号中の音声信号部分に変化が見られ
る部分を、上記入力音声信号の短区間でのエネルギの変
化と、上記入力音声信号の周波数成分の分布を示す値
と、上記入力音声信号中のゼロクロスの数との少なくと
も１つを用いて検出して、この部分の近傍で行われる。

【００３３】さらに、本発明によれば、上記入力音声信
号の周波数成分の分布を示す値は、上記入力音声信号の
高域における平均レベルと、上記入力音声信号の低域に
おける平均レベルとの比をとることで算出される。

【００３４】

【実施例】以下、本発明に係る音声信号の雑音低減方法
及び装置について、図面を参照しながら詳細に説明す
る。

【００３５】ここで、本発明の音声信号の雑音低減方法
を適用した音声信号の雑音低減装置の一例を図１に示
す。

【００３６】上記音声信号の雑音低減装置は、入力音声
信号から雑音除去することで雑音抑圧を行うと共に、雑
音低減量が制御信号に応じて可変である雑音低減処理部
としてのスペクトラム修正部１０と、上記入力音声信号
に含まれる子音部分を検出する子音部分検出手段である
子音検出部４１と、上記子音部分検出手段にて得られる
子音検出結果に応じて上記雑音低減量を抑える制御を行
う制御手段としてのＨｎ値計算部７とを有して成るもの
である。

【００３７】さらに、上記音声信号の雑音低減装置は、
上記入力音声信号を周波数軸の信号に変換する変換手段
としての高速フーリエ変換処理部３を有している。

【００３８】上記音声信号の雑音低減装置において、音
声信号入力端子１３から入力される入力音声信号ｙ
［ｔ］は、フレーム化処理部１に送られる。このフレー
ム化処理部１からの出力であるフレーム化信号ｙ−ｆｒ
ａｍｅ_j,k は、窓かけ処理部２、雑音推定部５内の自乗
平均値の平方根（ＲＭＳ：root mean square）計算部２
１及びフィルタ処理部８に送られる。

【００３９】窓かけ処理部２からの出力は、高速フーリ
エ変換処理部３に送られる。また、高速フーリエ変換処
理部３からの出力は、スペクトル修正部１０に送られる
他、バンド分割部４にも送られる。

【００４０】バンド分割部４からの出力は、上記スペク
トル修正部１０、上記雑音推定部５内の雑音スペクトル
推定部２６、Ｈｎ値計算部７及び子音検出部４１内のゼ
ロクロス検出部４２とトーン検出部４３とに送られる。
また、スペクトル修正部１０からの出力は、逆高速フー
リエ変換処理部１１及びオーバーラップ加算部１２を介
して、音声信号出力端子１４に送られる。

【００４１】また、上記ＲＭＳ計算部２１からの出力
は、相対エネルギ計算部２２、最大ＲＭＳ計算部２３、
推定雑音レベル計算部２４、雑音スペクトル推定部２６
及び子音検出部４１内の音声近接フレーム検出部４４と
子音成分検出部４５とに送られる。さらに、上記最大Ｒ
ＭＳ計算部２３からの出力は、推定雑音レベル計算部２
４及び最大ＳＮ比計算部２５に送られる。また、相対エ
ネルギ計算部２２からの出力は、上記雑音スペクトル推
定部２６に送られる。推定雑音レベル計算部２４からの
出力は、フィルタ処理部８、最大ＳＮ比計算部２５、雑
音スペクトル推定部２６及びＮＲ値計算部６に送られ
る。また、最大ＳＮ比計算部２５からの出力は、ＮＲ値
計算部６及び上記雑音スペクトル推定部２６に送られ
る。また、雑音スペクトル推定部２６からの出力は、Ｈ
ｎ値計算部７に送られる。

【００４２】また、ＮＲ値計算部６からの出力は、再度
ＮＲ値計算部６に送られる他、ＮＲ２値計算部４６にも
送られる。

【００４３】また、ゼロクロス検出部４２からの出力
は、上記音声近接フレーム検出部４４及び上記子音成分
検出部４５に送られる。トーン検出部４３からの出力
は、上記子音成分検出部４５に送られる。また、音声近
接フレーム検出部４４からの出力は上記子音成分検出部
４５に送られる。この子音成分検出部４５からの出力
は、上記ＮＲ２値計算部４６に送られる。

【００４４】上記ＮＲ２値計算部４６からの出力は、上
記Ｈｎ値計算部７に送られる。

【００４５】上記Ｈｎ値計算部７からの出力は、フィル
タ処理部８及びバンド変換部９を介して、上記スペクト
ル修正部１０に送られる。

【００４６】以下、上記音声信号の雑音低減装置の第一
の例の動作を説明する。なお、各構成部の動作に該当す
る動作を示す図２のフローチャートのステップ番号は、
括弧内に示される。

【００４７】音声信号入力端子１３には、音声（Speec
h）成分と雑音（Noise ）成分とを含む入力音声信号ｙ
［ｔ］が供給されている（ステップＳ０）。この入力音
声信号ｙ［ｔ］は、例えば標本化周波数がＦＳのディジ
タル信号であり、フレーム化処理部１に送られて、フレ
ーム長がＦＬサンプルのフレームに分割され、以下各フ
レーム毎に処理が行われる。このフレームの時間軸方向
の移動量であるフレーム間隔はＦＩサンプルであり、第
（ｋ＋１）フレームは第ｋフレームからＦＩサンプル後
に開始されることになる。また、上記周波数やサンプル
数の具体例を挙げると、標本化周波数ＦＳを８０００、
または８ｋＨｚとするとき、フレーム間隔ＦＩを８０サ
ンプルとすると１０ｍｓに、また、フレーム長ＦＬを１
６０サンプルとすると２０ｍｓに相当することになる。

【００４８】窓かけ処理部２では、次の直交変換であ
る、例えば高速フーリエ変換処理部２での計算に先立っ
て、上記フレーム化処理部１より送られる各フレーム化
信号ｙ−ｆｒａｍｅ_j,k に対して、窓関数ｗ_input によ
る窓かけ処理が施される。なお、各フレーム毎の信号処
理の終段での後述する逆高速フーリエ変換処理のあとに
は、出力信号に対して窓関数ｗ_outputによる窓かけ処理
が施される。このような各窓関数ｗ_input 及びｗ_output
の一例を、次の（１）式及び（２）式にそれぞれ示す。

【００４９】

【数１】

【００５０】次に、高速フーリエ変換処理部３では、２
５６ポイントの高速フーリエ変換処理が施され（ステッ
プＳ１）、得られた周波数スペクトル振幅値は、バンド
分割部４により、例えば１８バンドに分割される。これ
らの各バンドの周波数レンジの一例を、次の表に示す。
このバンド分割された周波数スペクトルの振幅値は、入
力信号スペクトルの振幅Ｙ［ｗ，ｋ］となり、上述した
ように、各部に出力される。

【００５１】

【表１】

【００５２】これらの周波数帯域は、人間の聴覚システ
ムが高域ほど知覚分解能が劣化することに基づいてい
る。各帯域の振幅として、対応する周波数レンジ内の最
大ＦＦＴ（高速フーリエ変換処理における周波数帯域
の）振幅を用いる。

【００５３】次に、雑音推定部５においては、フレーム
化信号ｙ−ｆｒａｍｅ_j,k のノイズが音声（speech）か
ら区別され、ノイズと推定されるフレームが検出される
と共に、推定雑音レベル値と、信号レベルと推定雑音レ
ベルとの比の最大値いわゆる推定最大ＳＮ比とがＮＲ値
計算部６に送られている。この雑音区間推定、あるいは
ノイズフレーム検出処理は、例えば３種類の検出処理を
組み合わせている。この雑音区間推定の具体例について
説明する。

【００５４】ＲＭＳ計算部２１では、上記各フレーム誤
毎の信号のＲＭＳ値の計算が行われ、出力される。第ｋ
フレームのＲＭＳ値であるＲＭＳ［ｋ］は、次式で計算
される。

【００５５】

【数２】

【００５６】相対エネルギ計算部２２では、前フレーム
からの減衰エネルギに関連する第ｋフレームの相対エネ
ルギを示すｄＢ_rel［ｋ］が計算され、得られた値が出
力されている。このｄＢ表示の相対エネルギｄＢ
_rel［ｋ］は、次の（４）式により計算され、この
（４）式中のエネルギ値Ｅ［ｋ］及び減衰エネルギ値Ｅ
_decay［ｋ］は、それぞれ次の（５）式及び（６）式に
より求められる。

【００５７】

【数３】

【００５８】ここで、上記（５）式は、ＦＬ・（ＲＭＳ
［ｋ］）² と表すことができるが、ＲＭＳ計算部２１で
の上記（３）式の計算の途中で得られる上記（５）式の
値をそのまま相対エネルギ計算部２１に送るようにして
もよいことは勿論である。また、上記（６）式において
は、減衰時間（ディケイタイム）を０．６５秒とした例
を示している。

【００５９】このような、エネルギＥ［ｋ］及び減衰エ
ネルギＥ_decay［ｋ］の具体例を、図３に示す。

【００６０】最大ＲＭＳ計算部２３では、後述する推定
雑音レベル値と最大ＳＮ比とを見積もるのに必要な最大
ＲＭＳ値が求められ、出力される。この最大ＲＭＳ値Ｍ
ａｘＲＭＳ［ｋ］は、以下の（７）式にて算出される。
（７）式で、θは減衰定数（decay constant）であり、
例えば３．２秒で最大ＲＭＳ値が１／ｅだけ減衰するよ
うな値、すなわちθ＝０．９９３７６９が用いられる。

【００６１】

【数４】

【００６２】推定雑音レベル計算部２４では、バックグ
ラウンドノイズ、あるいは背景雑音のレベルを評価する
のに好適な最小のＲＭＳ値が求められ、出力される。こ
の推定雑音レベル値ＭｉｎＲＭＳ［ｋ］は、現時点から
前に５個の局所極小値（local minimum ）、すなわち
（８）式を満たす値の内で最小となる値である。

【００６３】

【数５】

【００６４】この推定雑音レベル値ＭｉｎＲＭＳ［ｋ］
は、音声（Speech）無しの背景雑音、いわゆるバックグ
ラウンドノイズのときに上昇してゆくように設定されて
いる。ノイズレベルが高いときの上昇レートは指数関数
的であるが、低いノイズレベルのときには、より大きな
上昇を得るために固定の上昇レートが用いられる。

【００６５】これらのＲＭＳ値ＲＭＳ［ｋ］、推定雑音
レベル値ＭｉｎＲＭＳ［ｋ］及び最大ＲＭＳ値ＭａｘＲ
ＭＳ［ｋ］の具体例を、図４に示す。

【００６６】また、最大ＳＮ比計算部２５では、上記最
大ＲＭＳ値及び上記推定雑音レベル値を用いて、以下の
（９）式により最大ＳＮ比が推定され、この最大ＳＮ比
ＭａｘＳＮＲ［ｋ］が算出され、出力されている。

【００６７】

【数６】

【００６８】また、この最大ＳＮ比値ＭａｘＳＮＲから
は、相対ノイズレベルを示す０から１までの範囲の正規
化パラメータＮＲ＿ｌｅｖｅｌが算出される。このＮＲ
＿ｌｅｖｅｌには、以下の関数が用いられる。

【００６９】

【数７】

【００７０】次に、雑音スペクトル推定部２６での動作
を説明する。上記相対エネルギ計算部２２、推定雑音レ
ベル計算部２４及び最大ＳＮ比計算部２５において算出
した値は、音声（speech）を背景雑音（background noi
se）から区別するために用いられる。次の条件が正しい
とき、第ｋフレーム中の信号は背景雑音として分類され
る。こうして分類された背景雑音が示す振幅値は、ノイ
ズスペクトルの時間平均推定値Ｎ［ｗ，ｋ］として算出
され、出力される。

【００７１】

【数８】

【００７２】ここで図５は、上記（１１）式中のｄＢ表
示の相対エネルギｄＢ_rel［ｋ］と、最大ＳＮ比Ｍａｘ
ＳＮＲ［ｋ］と、雑音判別の閾値の１つであるｄＢｔｈ
ｒｅｓ_rel［ｋ］との具体例を示している。

【００７３】また図６は、上記（１０）式中のＭａｘＳ
ＮＲ［ｋ］の関数としてのＮＲ＿ｌｅｖｅｌ［ｋ］を示
している。

【００７４】第ｋフレームが背景雑音、あるいはノイズ
として分類される場合、上記ノイズスペクトルの時間平
均推定値Ｎ［ｗ，ｋ］は、現在フレームの信号の入力信
号スペクトルの振幅Ｙ［ｗ，ｋ］によって、次の（１
２）式のように更新される。なお、ｗは上記バンド分割
のバンド番号を示すものである。

【００７５】

【数９】

【００７６】ここで、第ｋフレームが音声（speech）と
して分類された場合、Ｎ［ｗ，ｋ］はＮ［ｗ，ｋ−１］
の値をそのまま用いる。

【００７７】ＮＲ値計算部６では、急激にフィルタ応答
が変化することを回避するために用いる値であるＮＲ
［ｗ，ｋ］を計算し、得られたＮＲ［ｗ，ｋ］値が出力
される。このＮＲ［ｗ，ｋ］は、０から１の大きさの値
であり、（１３）式にて定義される値である。

【００７８】

【数１０】

【００７９】また、（１３）式中のａｄｊ［ｗ，ｋ］
は、後述する効果を考慮したパラメータであって、（１
４）式にて定義される。

【００８０】ここで、（１４）式中のａｄｊ１［ｋ］
は、全ての帯域において、高いＳＮ比における後述する
フィルタ処理による雑音抑圧動作を抑える効果を有する
値であり、以下の（１５）式にて定義される。

【００８１】

【数１１】

【００８２】また、（１４）式中のａｄｊ２［ｋ］は、
非常に低いノイズレベルや非常に高いノイズレベルに対
して、上記フィルタ処理による雑音抑圧レートを抑える
効果を有する値であり、以下の（１６）式にて定義され
る。

【００８３】

【数１２】

【００８４】また、（１４）式中のａｄｊ３［ｗ，ｋ］
は、２３７５Ｈｚから４０００Ｈｚの間での１８ｄＢか
ら１５ｄＢへの最大雑音低減量を抑える効果を有する値
であり、以下の（１７）式にて定義される。

【００８５】

【数１３】

【００８６】なお、上述した値であるＮＲ［ｗ，ｋ］
と、最大雑音低減量（ｄＢ）との関係は、図７に示すよ
うに、例えばｄＢ領域において略線形であることがわか
る。

【００８７】次に、図１の子音検出部４１においては、
上記入力信号スペクトルの振幅Ｙ［ｗ，ｋ］からフレー
ム毎に子音成分が検出され、この子音検出結果として子
音効果を示す値ＣＥ［ｋ］が計算され、得られたＣＥ
［ｋ］が出力される。この子音検出処理の具体例につい
て説明する。

【００８８】ゼロクロス検出部４２では、上記Ｙ［ｗ，
ｋ］中の連続するサンプル間で符号が、例えば正から
負、あるいは負から正というように逆転する箇所、また
は、逆の符号を有するサンプル間で０という値を有する
サンプルが存在する箇所がゼロクロスとして検出される
（ステップＳ３）。このゼロクロスの数が、フレーム毎
に検出され、この値がゼロクロス数ＺＣ［ｋ］として出
力される。

【００８９】トーン検出部４３では、トーン、すなわち
上記Ｙ［ｗ，ｋ］の周波数成分の分布を表す値、例え
ば、図８に示すように、高域における上記入力信号スペ
クトルの平均レベルｔ′と低域における上記入力信号ス
ペクトルの平均レベルｂ′との比ｔ′／ｂ´（＝ｔｏｎ
ｅ［ｋ］）が検出され（ステップＳ２）、出力される。
この値ｔ′及び値ｂ´は、以下の（１８）式にて定義さ
れる誤差関数ＥＲＲ（ｆｃ，ｂ，ｔ）が最小値をとるよ
うな値ｔ及び値ｂである。（１８）式において、ＮＢは
バンド数を表し、Ｙ_max ［ｗ，ｋ］はバンドｗにおける
Ｙ［ｗ，ｋ］の最大値を表し、ｆｃは高域と低域とを分
離する点を表す。また、図８において、周波数ｆｃにお
いて、低域側のＹ［ｗ，ｋ］の平均値を値ｂとして、ま
た、高域側のＹ［ｗ，ｋ］の平均値を値ｔとしている。

【００９０】

【数１４】

【００９１】音声近接フレーム検出部４４では、ＲＭＳ
値及びゼロクロス数に基づいて、有声音声が検出された
フレームの近傍のフレーム、すなわち音声近接フレーム
が検出され（ステップＳ４）、このフレーム数として音
節近接フレーム数ｓｐｃｈ＿ｐｒｏｘ［ｋ］が、以下の
（１９）式に基づいて得られ、出力される。

【００９２】

【数１５】

【００９３】子音成分検出部４５では、ゼロクロス数、
音声近接フレーム数、トーン及びＲＭＳ値に基づいて、
各フレームのＹ［ｗ，ｋ］中の子音成分の検出が行われ
る（ステップＳ５）。この子音検出結果は、子音効果を
示す値ＣＥ［ｋ］として出力される。なお、この値ＣＥ
［ｋ］は、以下の（２０）式にて定義される。

【００９４】

【数１６】

【００９５】また、各シンボルＣ１、Ｃ２、Ｃ３、Ｃ
４．１乃至Ｃ４．７は、以下の表にて定義される。

【００９６】

【表２】

【００９７】上記表２において、ＣＤＳ０、ＣＤＳ１、
ＣＤＳ２、Ｔ、Ｚｌｏｗ及びＺｈｉｇｈの各値は、子音
検出の感度を決定する定数であり、例えばＣＤＳ０＝Ｃ
ＤＳ１＝ＣＤＳ２＝１．４１、Ｔ＝２０、Ｚｌｏｗ＝２
０、Ｚｈｉｇｈ＝７５の値をとる。また、（２０）式の
Ｅは、０から１までの値をとるもので、０に近いほど通
常の子音抑圧量に近くなるように後述するフィルタ応答
が調整され、また、１に近いほど子音抑圧量が最低量と
なるように上記フィルタ応答が調整され、例えば０．７
である。

【００９８】また、上記表２によれば、あるフレームに
おいて、シンボルＣ１が成立することは上記フレームの
信号レベルが最低ノイズレベルより大きいことを示し、
シンボルＣ２が成立することは上記フレームのゼロクロ
ス数が所定のゼロクロス数Ｚｌｏｗ、本実施例では２０
より大きいことを示し、また、シンボルＣ３が成立する
ことは上記フレームが有声音声が検出されたフレームよ
りＴフレーム以内、本実施例では２０フレーム以内であ
ることを示している。

【００９９】また、シンボルＣ４．１が成立することは
上記フレームにおいて信号レベルが変化することを示
し、シンボルＣ４．２が成立することは上記フレームが
音声信号が変化して１フレーム後であって信号レベルが
変化するフレームであることを示し、また、シンボルＣ
４．３が成立することは上記フレームが音声信号が変化
して２フレーム後であって信号レベルが変化するフレー
ムであることを示している。また、シンボルＣ４．４が
成立することは、上記フレームにおいて、ゼロクロス数
が所定のゼロクロス数Ｚｈｉｇｈ、本実施例では７５よ
り大きいことを示している。また、シンボルＣ４．５が
成立することは上記フレームにおいてトーン値が変化す
ることを示し、シンボルＣ４．６が成立することは上記
フレームが音声信号が変化して１フレーム後であってト
ーン値が変化するフレームであることを示し、シンボル
Ｃ４．７が成立することは上記フレームが音声信号が変
化して２フレーム後であってトーン値が変化するフレー
ムであることを示している。

【０１００】また、（２０）式によれば、このフレーム
が子音成分を含んでいることの条件は、上述のシンボル
Ｃ１乃至Ｃ３の条件を満たすこと、ｔｏｎｅ［ｋ］が
０．６より大きいこと及び上述のＣ４．１乃至Ｃ４．７
の条件の内の少なくとも１つが満たされることである。

【０１０１】また、図１において、ＮＲ２値計算部４６
では、上記値ＮＲ［ｗ，ｋ］及び上記子音効果を示す値
ＣＥ［ｋ］から、以下の（２１）式に基づいて、ＮＲ２
［ｗ，ｋ］が得られ、このＮＲ２［ｗ，ｋ］が出力され
る。

【０１０２】 NR2[w,k]=(1.0-CE[k])・NR[w,k] ・・・（２１）Ｈｎ値計算部７は、バンド分割された入力信号スペクト
ルの振幅Ｙ［ｗ，ｋ］と、ノイズスペクトルの時間平均
推定値Ｎ［ｗ，ｋ］と、上記ＮＲ２［ｗ，ｋ］とから、
上記バンド分割された入力信号スペクトルの振幅Ｙ
［ｗ，ｋ］から雑音成分を低減するためのプレフィルタ
である。ここでは、Ｙ［ｗ，ｋ］がＮ［ｗ，ｋ］に応じ
てＨｎ［ｗ，ｋ］に変換され、このフィルタ応答Ｈｎ
［ｗ，ｋ］が出力される。なお、このＨｎ［ｗ，ｋ］値
は、以下の（２２）式に基づいて算出される。

【０１０３】

【数１７】

【０１０４】また、上記（２２）式中の値Ｈ［ｗ］［Ｓ
／Ｎ＝ｒ］は、ＳＮ比をある値ｒ、例えば２．７に固定
したとき最適なノイズ抑圧フィルタ特性に当たり、（２
３）式にて求められる値である。また、この値は、予め
求めることができて、Ｙ［ｗ，ｋ］／Ｎ［ｗ，ｋ］の値
に応じてテーブル化することが可能な値である。なお、
（２３）式中のｘ［ｗ，ｋ］はＹ［ｗ，ｋ］／Ｎ［ｗ，
ｋ］に相当し、Ｇ_ｍｉｎはＨ［ｗ］［Ｓ／Ｎ＝ｒ］の最
小利得を示すパラメータであり、例えば−１８ｄＢの値
をとる。また、Ｐ（Ｈ１｜Ｙ_ｗ）［Ｓ／Ｎ＝ｒ］及びＰ
（Ｈ０｜Ｙ_w）［Ｓ／Ｎ＝ｒ］は、各入力信号スペクト
ルの振幅Ｙ［ｗ，ｋ］の状態を示すパラメータであり、
Ｐ（Ｈ１｜Ｙ_w）［Ｓ／Ｎ＝ｒ］はＹ［ｗ，ｋ］に音声
（speech）成分と雑音成分とが混在した状態を指すパラ
メータであり、Ｐ（Ｈ０｜Ｙ_w）［Ｓ／Ｎ＝ｒ］はＹ
［ｗ，ｋ］に雑音成分のみが含まれる状態を指すパラメ
ータである。また、これら値は、以下の（２４）式にて
算出される。

【０１０５】

【数１８】

【０１０６】（２４）式によれば、Ｐ（Ｈ１｜Ｙ_w）
［Ｓ／Ｎ＝ｒ］及びＰ（Ｈ０｜Ｙ_w）［Ｓ／Ｎ＝ｒ］は
ｘ［ｗ，ｋ］の関数であることがわかる。また、Ｉ
₀（２・ｒ・ｘ［ｗ，ｋ］）は、ベッセル関数であり、
ｒとｘ［ｗ，ｋ］との値に応じて求められる。なお、Ｐ
（Ｈ１）及びＰ（Ｈ０）は、共に０．５に固定される。
このように、パラメータを単純化することで、演算量を
従来の略５分の１に削減することができる。

【０１０７】また、フィルタ処理部８では、上記Ｈｎ
［ｗ，ｋ］値が周波数軸方向と時間軸方向とについて円
滑化するフィルタ処理を行い、得られる信号として円滑
化信号Ｈ_{t_smooth}［ｗ，ｋ］が出力される。上記周波数
軸方向へのフィルタ処理は、信号Ｈｎ［ｗ，ｋ］の有効
インパルス応答長を短くする効果がある。これにより周
波数領域での乗算によるフィルタの実現に起因する環状
畳み込みによるエリアシングの発生を未然に防いでい
る。また、上記時間軸方向へのフィルタ処理は、突発的
な雑音を抑えるフィルタの変化の速さを制限する効果が
ある。

【０１０８】先ず、上記周波数軸方向へのフィルタ処理
についての説明を行う。上記各バンドのＨｎ［ｗ，ｋ］
に、メディアン（中央値）フィルタ処理が施される。次
の（２５）式及び（２６）式にて、この方法を示す。

【０１０９】 Step1:H1[w,k]=max(median(Hn[w-1,k],Hn[w,k],Hn[w+1,k]) ,Hn[w,k]) ・・・（２５）但し、（ｗ−１）、又は（ｗ＋１）が存在しないとき
は、H1[w,k]=Hn[w,k] Step2:H2[w,k]=min(median(H1[w-1,k],H1[w,k],H1[w+1,k]) ,H1[w,k]) ・・・（２６）但し、（ｗ−１）、又は（ｗ＋１）が存在しないとき
は、H2[w,k]=H1[w,k] 第１段階（Step1 ）において、Ｈ１［ｗ，ｋ］は、単一
の、あるいは孤立した０のバンドを無くしたＨｎ［ｗ，
ｋ］であり、第２段階（Step2 ）において、Ｈ２［ｗ，
ｋ］は、単一の、あるいは孤立した突出したバンドを無
くしたＨ１［ｗ，ｋ］である。このようにして、上記Ｈ
ｎ［ｗ，ｋ］は、Ｈ２［ｗ，ｋ］に変換される。

【０１１０】次に、上記時間軸方向へのフィルタ処理に
ついての説明を行う。この時間軸方向へのフィルタ処理
を施す際において、入力信号には、音声（speech）、バ
ックグラウンドノイズ、そして音声（speech）の立ち上
がり部分である過度的状態の３種あることを考慮に入れ
る。音声の信号Ｈ_speech［ｗ，ｋ］に対しては、次の
（２７）式に示すように、時間軸での円滑化、あるいは
スムージングを行う。

【０１１１】Ｈ_speech［ｗ，ｋ］＝0.7・H2[w,k]＋0.3・H2[w,kー1] ・・・（２７）また、背景雑音の信号に対しては、次の（２８）式に示
すような時間軸での円滑化、あるいはスムージングを行
う。

【０１１２】Ｈ_noise［ｗ，ｋ］＝0.7・Min_H＋0.3・Max_H ・・・（２８）この（２８）式において、Ｍｉｎ＿Ｈ及びＭａｘ＿Ｈは
それぞれ、 Min_H=min(H2[w,k],H2[w,k-1]) Max_H=max(H2[w,k],H2[w,k-1]) にて求められる。

【０１１３】また、過度的状態の信号に対しては、この
時間軸でのスムージングを行われない。

【０１１４】以上のスムージング処理が行われた信号を
用いて、（２９）式により円滑化出力信号Ｈ
_{t_smooth}［ｗ，ｋ］を得る。

【０１１５】 H_{t_smooth}[w,k] =(1-α_tr)(α_sp・Hspeech[w,k]+(1-α_sp)・Hnoise[w,k])+α_tr・H2[w,k] ・・・（２９）ここで、（２９）式中のα_spは次の（３０）式から、α
_trは次の（３１）式からそれぞれ求められる。

【０１１６】

【数１９】

【０１１７】続いて、バンド変換部９では、フィルタ処
理部８からの、例えば１８バンド分の円滑化信号Ｈ
_{t_smooth}［ｗ，ｋ］が、例えば１２８バンド分の信号Ｈ
₁₂₈ ［ｗ，ｋ］に、補間処理により拡張変換され、この
変換された信号Ｈ₁₂₈ ［ｗ，ｋ］が出力される。この変
換は、例えば２段階で行っており、１８バンドから６４
バンドへの拡張はゼロ次ホールドにより、６４バンドか
ら１２８バンドへの拡張はローパスフィルタ型の補間処
理により、それぞれ行っている。

【０１１８】次に、スペクトラム修正部１０では、高速
フーリエ変換処理部３で得られたフレーム化信号ｙ−ｆ
ｒａｍｅ_j,k の高速フーリエ変換処理にて得られるＦＦ
Ｔ係数の実部と虚部とに各々上記信号Ｈ₁₂₈ ［ｗ，ｋ］
を乗じてスペクトラム修正、すなわち雑音成分を低減す
る処理が行われ、得られた信号が出力される。この結
果、スペクトルの振幅は修正されるが位相は変形を受け
ない。

【０１１９】次に逆高速フーリエ変換処理部１１では、
スペクトラム修正部１０にて得られた信号を用いて、逆
高速フーリエ変換処理が行われ、得られたＩＦＦＴ信号
が出力される。

【０１２０】次に、オーバーラップ加算部１２では、各
フレーム毎のＩＦＦＴ信号のフレーム境界部分について
の重ね合わせが行われ、得られた出力音声信号が音声信
号出力端子１４より出力される。

【０１２１】また、本発明の音声信号の雑音低減方法を
適用した音声信号の雑音低減装置の他の例を図９に示
す。なお、図１に示した音声信号の雑音低減装置の構成
と共通する構成部分については、これら構成部分を図１
と同一の番号で示し、動作説明を省略する。

【０１２２】上記音声信号の雑音低減装置は、入力音声
信号から雑音除去することで雑音抑圧を行うと共に、雑
音低減量が制御信号に応じて可変である雑音低減処理部
としてのスペクトラム修正部１０と、上記入力音声信号
に含まれる子音部分を検出する子音部分検出手段として
のＣＥ値、ａｄｊ１、ａｄｊ２、ａｄｊ３計算部３２
と、上記子音部分検出手段にて得られる子音検出結果に
応じて上記雑音低減量を抑える制御を行う制御手段とし
てのＨｎ値計算部７とを有して成るものである。

【０１２３】さらに、上記音声信号の雑音低減装置は、
上記入力音声信号を周波数軸の信号に変換する変換手段
としての高速フーリエ変換処理部３を有している。

【０１２４】ここで、上記Ｈｎ計算部７と、上記ＣＥ
値、ａｄｊ１、ａｄｊ２、ａｄｊ３計算部３２とを有し
て成る雑音抑圧フィルタ特性生成部３５において、バン
ド分割部４は、高速フーリエ変換処理部３から出力され
る入力音声信号を高速フーリエ変換処理して得られる周
波数スペクトルの振幅値を、例えば１８バンドに分割し
て、バンド毎の振幅Ｙ［ｗ，ｋ］を、信号特性計算部３
１と雑音スペクトル推定部２６と初期フィルタ応答計算
部３３とに出力する。

【０１２５】また、信号特性計算部３１は、フレーム化
処理部１にて出力されるｙ−ｆｒａｍｅ_j,k とバンド分
割部４にて出力されるＹ［ｗ，ｋ］とからフレーム毎の
ＲＭＳ値ＲＭＳ［ｋ］、推定雑音レベル値ＭｉｎＲＭＳ
［ｋ］、最大ＲＭＳ値ＭａｘＲＭＳ［ｋ］、ゼロクロス
数ＺＣ［ｋ］、トーン値ｔｏｎｅ［ｋ］、音声近接フレ
ーム数ｓｐｃｈ＿ｐｒｏｘ［ｋ］を算出し、これら値を
雑音スペクトル推定部２６及びＣＥ値、ａｄｊ１、ａｄ
ｊ２、ａｄｊ３計算部３２に出力する。

【０１２６】また、ＣＥ値、ａｄｊ１、ａｄｊ２、ａｄ
ｊ３計算部３２は、ＲＭＳ［ｋ］、ＭｉｎＲＭＳ［ｋ］
及びＭａｘＲＭＳ［ｋ］に基づいて、ａｄｊ１［ｋ］、
ａｄｊ２［ｋ］及びａｄｊ３［ｗ，ｋ］を算出し、ま
た、ＺＣ［ｋ］、ｔｏｎｅ［ｋ］、ｓｐｃｈ＿ｐｒｏｘ
［ｋ］及びＭｉｎＲＭＳ［ｋ］に基づいて、音声信号に
含まれる子音効果を示す値ＣＥ［ｋ］を算出し、これら
値をＮＲ値及びＮＲ２値計算部３６に送る。

【０１２７】また、初期フィルタ応答計算部３３は、雑
音スペクトル推定部２６から出力される雑音時間平均値
Ｎ［ｗ，ｋ］と、バンド分割部４から出力されるＹ
［ｗ，ｋ］とをフィルタ抑圧曲線テーブル部３４に送
り、フィルタ抑圧曲線テーブル部３４に収納されるＹ
［ｗ，ｋ］とＮ［ｗ，ｋ］とに応じたＨ［ｗ，ｋ］の値
を探し出し、このＨ［ｗ，ｋ］をＨｎ値計算部７に出力
する。なお、フィルタ抑圧曲線テーブル部３４は、Ｈ
［ｗ，ｋ］に関する表が格納されている。

【０１２８】図１に示した音声信号の雑音低減装置や、
図９に示した音声信号の雑音低減装置にて得られた出力
音声信号は、例えば携帯用電話機の各種エンコーダ回路
や、音声認識装置の信号処理回路等に送られる。あるい
は、携帯用電話機のデコーダ出力信号に本雑音抑圧処理
を施してもよい。

【０１２９】また、図１０は、本発明の音声信号の雑音
低減装置の効果を説明する図である。縦軸は各フレーム
の信号のＲＭＳレベルを表し、横軸は各フレームのフレ
ーム番号を表す。なお、このフレームは２０ｍｓ毎に区
切られたものである。

【０１３０】原音の音声信号は、図１０に示すように、
曲線Ｂで表されている。また、この音声に車内のノイ
ズ、いわゆるカーノイズを足した信号は、曲線Ａであ
る。曲線ＡのＲＭＳレベルの方が、全フレーム番号にお
いて、曲線ＢのＲＭＳレベルよりも高いか、あるいは等
しいことがわかる。すなわち、全般的にノイズが混在す
る信号の方が、エネルギが高いことがわかる。

【０１３１】また、本発明の雑音低減方法を適用した雑
音低減装置にて、上記ノイズが混在する信号の雑音を低
減して得られる信号が曲線Ｃで表され、また、従来の雑
音低減方法を適用した雑音低減装置にて、上記ノイズが
混在する信号の雑音を低減して得られる信号が曲線Ｄで
表される。

【０１３２】この曲線Ｃと曲線Ｄとによれば、フレーム
番号が略１５のエリアａ１と、フレーム番号が略６０の
エリアａ２と、フレーム番号が略６０から略６５までの
エリアａ３と、フレーム番号が略１００から略１０５ま
でのエリアａ４と、フレーム番号が略１１０のエリアａ
５と、フレーム番号が略１５０から略１６０までのエリ
アａ６と、フレーム番号が略１７５から略１８０までの
エリアａ７とにおいて、曲線ＣのＲＭＳレベルの方が、
曲線ＤのＲＭＳレベルよりも高いことがわかる。すなわ
ち、各エリアａ１乃至ａ７に対応するフレーム番号の信
号において、雑音低減量が抑えられていることがわか
る。

【０１３３】なお、本発明の実施例として図２で示した
音声信号の雑音低減方法によれば、音声信号中の子音成
分を検出するのに、周波数領域の信号の振幅の分布を示
す数であるｔｏｎｅ［ｋ］が先に検出されてから、上記
信号中のゼロクロスが検出されるが、これに限定される
ことはなく、先に上記ゼロクロスが検出されてから上記
ｔｏｎｅ［ｋ］が検出されても、両方同時に検出されて
もよい。

【０１３４】

【発明の効果】以上説明したように、本発明に係る音声
信号の雑音低減方法によれば、入力音声信号から子音部
分を検出し、この子音が検出されたところで雑音低減量
を抑えるように、上記入力音声信号から雑音を除去して
雑音抑圧を行うため、雑音抑圧を行う際に子音部分をも
除去したり、また、子音部分が歪んだりすることの回避
が可能になる。さらに、簡単な構成にて上記雑音抑圧を
行う際の演算量を削減することが可能になる。

【０１３５】また、上記音声信号の雑音低減方法によれ
ば、上記入力音声信号を周波数軸に変換することで、上
記入力音声信号に含まれる重要な特徴のみを取り出して
上記雑音抑圧を行う際の演算を行うことが可能になるた
め、この演算量を削減することが可能になる。

【０１３６】また、上述の各音声信号の雑音低減方法に
よれば、子音部分を検出する工程にて、上記入力音声信
号の短区間でのエネルギの変化と、上記入力音声信号の
周波数成分の分布を示す値と、上記入力音声信号のゼロ
クロスの数とを検出することで、これら値の少なくとも
１つを用いて子音検出を行うことが可能になり、この子
音が検出されたところで雑音低減量を抑えるように、上
記入力音声信号から雑音を除去して雑音抑圧を行うた
め、雑音抑圧を行う際に子音部分をも除去したり、ま
た、子音部分が歪んだりすることの回避が可能になる。
さらに、上記雑音抑圧を行う際の演算量を削減すること
が可能になる。

【０１３７】また、上述の各音声信号の雑音低減方法に
よれば、第一の値及び子音部分の検出結果に応じた第二
の値を用いて、入力音声信号から雑音を除去するフィル
タ処理のフィルタ特性を制御することで、上記入力音声
信号の最大ＳＮ比に応じたフィルタ処理にて上記入力音
声信号から雑音を除去する、特に高いＳＮ比での上記フ
ィルタ処理による音声信号の歪を小さくすることが可能
になり、また、雑音抑圧を行う際に子音部分をも除去し
たり、また、子音部分が歪んだりすることの回避が可能
になる。さらに、上記フィルタ特性を得るための演算量
の削減を図ることが可能になる。

【０１３８】また、本発明に係る音声信号の雑音低減装
置によれば、入力音声信号から子音部分を検出し、この
子音が検出されたところで雑音低減量を抑えるように、
上記入力音声信号から雑音を除去して雑音抑圧を行うた
め、雑音抑圧を行う際に子音部分をも除去したり、ま
た、子音部分が歪んだりすることの回避が可能になる。
さらに、上記雑音抑圧を行う際の演算量を削減すること
が可能になる。

【０１３９】また、上記音声信号の雑音低減装置によれ
ば、上記入力音声信号を周波数軸に変換することで、上
記入力音声信号に含まれる重要な特徴のみを取り出して
上記雑音抑圧を行う際の演算を行うことが可能になるた
め、この演算量を削減することが可能になる。

【０１４０】また、上述の各音声信号の雑音低減装置に
よれば、子音部分を検出する工程にて、上記入力音声信
号の短区間でのエネルギの変化と、上記入力音声信号の
周波数成分の分布を示す値と、上記入力音声信号のゼロ
クロスの数とを検出することで、これら値の少なくとも
１つを用いて子音検出を行うことが可能になり、この子
音が検出されたところで雑音低減量を抑えるように、上
記入力音声信号から雑音を除去して雑音抑圧を行うた
め、雑音抑圧を行う際に子音部分をも除去したり、ま
た、子音部分が歪んだりすることの回避が可能になる。
さらに、上記雑音抑圧を行う際の演算量を削減すること
が可能になる。

【０１４１】また、上述の各音声信号の雑音低減装置に
よれば、第一の値及び子音部分の検出結果に応じた第二
の値を用いて、入力音声信号から雑音を除去するフィル
タ処理のフィルタ特性を制御することで、上記入力音声
信号の最大ＳＮ比に応じたフィルタ処理にて上記入力音
声信号から雑音を除去する、特に高いＳＮ比での上記フ
ィルタ処理による音声信号の歪を小さくすることが可能
になり、また、雑音抑圧を行う際に子音部分をも除去し
たり、また、子音部分が歪んだりすることの回避が可能
になる。さらに、上記フィルタ特性を得るための演算量
の削減を図ることが可能になる。

【図面の簡単な説明】

【図１】本発明の音声信号の雑音低減装置の一例の概略
を示すブロック図である。

【図２】本発明の音声信号の雑音低減方法の動作を示す
フローチャートである。

【図３】本発明の実施例におけるエネルギＥ［ｋ］及び
減衰エネルギＥ_decay［ｋ］の具体例を示す図である。

【図４】本発明の実施例におけるＲＭＳ値ＲＭＳ
［ｋ］、推定雑音レベル値ＭｉｎＲＭＳ［ｋ］及び最大
ＲＭＳ値ＭａｘＲＭＳ［ｋ］の具体例を示す図である。

【図５】本発明の実施例におけるｄＢ表示の相対エネル
ギｄＢ_rel［ｋ］、最大ＳＮ比ＭａｘＳＮＲ［ｋ］、及
び雑音判別の閾値の１つであるｄＢｔｈｒｅｓ_rel
［ｋ］の具体例を示す図である。

【図６】本発明の実施例における最大ＳＮ比ＭａｘＳＮ
Ｒ［ｋ］に対して定義される関数としてのＮＲ＿ｌｅｖ
ｅｌ［ｋ］を示すグラフである。

【図７】本発明の実施例におけるＮＲ［ｗ，ｋ］と最大
雑音低減量との関係をｄＢ表示で示すグラフである。

【図８】本発明の実施例における入力信号スペクトルの
周波数領域の分布を示す値を求める方法を説明する図で
ある。

【図９】本発明の音声信号の雑音低減装置の他の例の概
略を示すブロック図である。

【図１０】本発明の効果を説明する図である。

【符号の説明】

３高速フーリエ変換処理部４バンド分割部５雑音推定部６ＮＲ値計算部７Ｈｎ値計算部２１ＲＭＳ計算部２２相対エネルギ計算部２３最大ＲＭＳ計算部２４推定雑音レベル計算部２５最大ＳＮＲ計算部２６雑音スペクトル推定部３１信号特性計算部３２ＣＥ値、ａｄｊ１、ａｄｊ２、ａｄｊ３計算部３３初期フィルタ応答計算部３４フィルタ抑圧曲線テーブル部３５雑音抑圧フィルタ特性生成部３６ＮＲ値及びＮＲ２値計算部４１子音検出部４２ゼロクロス検出部４３トーン検出部４４音声近接フレーム検出部４５子音成分検出部４６ＮＲ２値計算部

Claims

【特許請求の範囲】

【請求項１】入力音声信号から雑音除去することで雑
音抑圧を行う音声信号の雑音低減方法であって、上記入力音声信号に含まれる子音部分を検出する工程
と、上記子音部分を検出する工程にて得られる子音検出結果
に応じて、上記入力音声信号から雑音を除去する際の雑
音低減量を抑える制御を行う工程とを有することを特徴
とする音声信号の雑音低減方法。
【請求項２】上記入力音声信号を周波数軸の信号に変
換する変換工程を設けて、上記雑音低減量を抑える制御を行う工程は、上記変換工
程にて得られる入力信号スペクトルに基づいて設定され
るフィルタ特性を、上記子音部分を検出する工程にて得
られる子音検出結果に応じて可変制御する工程であるこ
とを特徴とする請求項１記載の音声信号の雑音低減方
法。
【請求項３】上記子音部分を検出する工程は、上記入
力音声信号の短区間でのエネルギの変化と、上記入力音
声信号の周波数成分の分布を示す値と、上記入力音声信
号中のゼロクロスの数との少なくとも１つを用いて、上
記入力音声信号中において検出される音声信号部分の近
傍で子音検出を行う工程であることを特徴とする請求項
１または２記載の音声信号の雑音低減方法。
【請求項４】上記入力音声信号の周波数成分の分布を
示す値は、高域における入力音声信号のスペクトルの平
均レベルと、低域における入力音声信号のスペクトルの
平均レベルとの比に基づいて求められることを特徴とす
る請求項３記載の音声信号の雑音低減方法。
【請求項５】上記フィルタ特性は、上記変換工程にて
得られる入力信号スペクトルと、上記入力信号スペクト
ル中に含まれる推定雑音スペクトルとの比に基づいて求
められる第一の値と、上記入力信号スペクトルの信号レ
ベルと推定雑音レベルとの比の最大値、推定雑音レベル
及び子音検出結果を示す子音効果因子に基づいて求めら
れる第二の値とで制御されることを特徴とする請求項２
記載の音声信号の雑音低減方法。
【請求項６】入力音声信号から雑音除去することで雑
音抑圧を行うと共に、雑音低減量が制御信号に応じて可
変である雑音低減処理部と、上記入力音声信号に含まれる子音部分を検出する子音部
分検出手段と、上記子音部分検出手段にて得られる子音検出結果に応じ
て上記雑音低減量を抑える制御を行う制御手段とを有し
て成ることを特徴とする音声信号の雑音低減装置。
【請求項７】上記入力音声信号を周波数軸の信号に変
換する変換手段を設けて、上記子音部分検出手段は、上記変換手段にて得られる入
力信号スペクトルから子音検出を行うことを特徴とする
請求項６記載の音声信号の雑音低減装置。
【請求項８】上記制御手段は、上記雑音低減量を決定
するフィルタ特性を、上記子音検出結果に応じて可変制
御することを特徴とする請求項６または７記載の音声信
号の雑音低減装置。
【請求項９】上記フィルタ特性は、上記入力信号スペ
クトルと、上記入力信号スペクトル中に含まれる推定雑
音スペクトルとの比に基づいて求められる第一の値と、
上記入力信号スペクトルの信号レベルと推定雑音レベル
との比の最大値、推定雑音レベル及び子音検出結果を示
す子音効果因子に基づいて求められる第二の値とで制御
されることを特徴とする請求項８記載の音声信号の雑音
低減装置。
【請求項１０】上記子音部分検出手段は、上記入力音
声信号の短区間でのエネルギの変化と、上記入力音声信
号の周波数成分の分布を示す値と、上記入力音声信号中
のゼロクロスの数との少なくとも１つを用いて、上記入
力音声信号中において検出される音声信号部分の近傍で
子音検出を行うことを特徴とする請求項６または７記載
の音声信号の雑音低減装置。
【請求項１１】上記入力音声信号の周波数成分の分布
を示す値は、高域における入力音声信号のスペクトルの
平均レベルと、低域における入力音声信号のスペクトル
の平均レベルとの比に基づいて求められることを特徴と
する請求項１０記載の音声信号の雑音低減装置。