JPH0916194A

JPH0916194A - 音声信号の雑音低減方法

Info

Publication number: JPH0916194A
Application number: JP7187966A
Authority: JP
Inventors: Jiyosefu Chiyan; チャン・ジョセフ; Masayuki Nishiguchi; 正之西口
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1995-06-30
Filing date: 1995-06-30
Publication date: 1997-01-17
Anticipated expiration: 2019-11-17
Also published as: EP0751491B1; MY116658A; CA2179871C; DE69627580D1; JP3591068B2; US5812970A; DE69627580T2; EP0751491A2; KR970002850A; CA2179871A1; ID20523A; EP0751491A3

Abstract

(57)【要約】【目的】入力音声信号のピッチ強度の大きいときに所
定の帯域の抑圧を抑えることが可能である音声信号の雑
音低減方法を提供する。【構成】信号特性計算部３１にて入力音声信号のピッ
チ強度を求め、ａｄｊ計算部３２にて上記ピッチ強度に
応じたａｄｊ値を求め、ＣＥ値及びＮＲ値計算部にて上
記ピッチ強度に応じたＮＲ値を求め、Ｈｎ値計算部７に
て上記ＮＲ値に応じたＨｎ値を求めて、上記入力音声信
号の雑音抑圧量を設定し、スペクトラム修正部１０にて
上記雑音抑圧量に基づいて上記入力音声信号中の雑音を
低減する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、入力される音声信号の
所定の周波数帯域を抑圧するフィルタを有する音声符号
化装置に音声信号を供給する音声信号の雑音低減方法に
関する。

【０００２】

【従来の技術】携帯用電話機や音声認識等の応用におい
て、収音された音声信号に含まれる環境雑音や背景雑音
等の雑音を抑圧し、音声成分を強調することが必要とさ
れている。

【０００３】このような音声強調、あるいは雑音低減の
技術として、減衰ファクタの調整のために条件付き確率
関数を用いる例が、文献「軟判定雑音抑圧フィルタを用
いる音声強調」（Speech Enhancement Using a Soft-De
cision Noise Suppression Filter, R.J.McAulay, M.L.
Malpass, IEEE Trans. Acoust., Speech, Signal Proce
ssing, Vol.28, pp.137-145, April 1980 ）や、「移動
電話システムにおける周波数領域雑音抑圧研究」（Freq
uency Domain Noise Suppression Approach inMobil Te
lephone Systems, J.Yang, IEEE ICASSP, Vol.II, pp.3
63-366, April1993 ）等に開示されている。

【０００４】

【発明が解決しようとする課題】しかしながら、これら
の雑音抑圧技術においては、不適切な固定のＳＮＲ（信
号対雑音比）に基づく動作をするため、または不適切な
抑圧フィルタにより、音色の不自然さや歪んだ音声を生
ずることがある。実際の運用の際に、最適の性能を得る
ために雑音抑圧装置のパラメータの１つであるＳＮＲを
調整することは、ユーザにとって望ましいことではな
い。さらに、従来の音声信号強調技術は、短時間ＳＮＲ
の大きな変動がある音声信号に対して副作用として発生
してしまう歪を持たせずに充分雑音を除去することは困
難である。

【０００５】また、このような音声強調、あるいは雑音
低減方法においては、雑音区間検出の技術が用いられ、
入力レベルやパワー等を所定の閾値で比較することによ
り、雑音区間判別を行っているが、音声にトラッキング
することを防ぐために閾値の時定数を大きくすると、ノ
イズレベルが変化するとき、特に増加するときに追従で
きなくなり、誤判別が生じ易くなる。

【０００６】ここで、本発明人は、上述した問題を解決
するために、特願平６−９９８６９号に記載の明細書及
び図面において、音声信号の雑音低減方法を提案してい
る。

【０００７】上記音声信号の雑音低減方法は、入力音声
信号に基づいて算出された信号レベルと雑音レベルとの
比いわゆるＳＮ比及び音声存在確率に基づいて、音声成
分を算出するための最尤フィルタを適応的に制御するこ
とで雑音抑圧を行う音声信号の雑音低減方法であって、
上記音声存在確率の算出に、入力信号のスペクトルから
推定雑音スペクトルを減算したものを用いることを特徴
とするものである。

【０００８】また、上記音声信号の雑音低減方法によれ
ば、上記最尤フィルタが上記入力音声信号のＳＮ比に応
じて最適の抑圧フィルタに調整されるため、上記入力音
声信号に対して充分な雑音除去を行うことが可能であ
る。

【０００９】ところが、上記音声存在確率を算出するの
に、複雑な演算を有すると共に、膨大な演算量が要求さ
れるため、演算の簡略化が望まれる。

【００１０】また、例えば音声信号符号化装置に雑音低
減装置にて処理を施した音声信号を入力する場合を考え
ると、上記音声信号符号化装置は予め高域通過フィルタ
を有していたり、高域側をブーストするフィルタを有し
ているため、上記雑音低減装置で低域側の抑圧が既にな
されていると上記音声信号符号化装置においてさらに低
域側が抑圧され周波数特性が変化し、聴覚上不自然な音
声が出力される虞がある。

【００１１】また、従来の雑音低減方法では、雑音低減
処理は、入力される音声信号の強さ例えばピッチ強度に
基づいてではなく、単に推定される雑音レベルに応じて
行われるため、やはり聴覚上不自然な音声が出力される
虞がある。

【００１２】そこで、上記ピッチ強度を求めるのに、先
ずピッチラグを時間波形のピーク値とピーク値との間で
求め、このピッチラグで自己相関値を求める方法が知ら
れているが、この場合高速フーリエ変換処理における自
己相関関数を用いており、（ＮｌｏｇＮ）の項の計算が
必要で、さらにＮの算出も必要となるため演算が複雑に
なってしまう。

【００１３】そこで、本発明は、上述した実情に鑑みて
なされたものであり、入力信号の雑音抑圧を行うのに演
算を簡略化することが可能である音声信号の雑音低減方
法を提供することを目的とする。

【００１４】また、本発明は、特に上記入力音声信号の
ピッチ強度の大きいときに所定の帯域の抑圧を抑えるこ
とが可能である音声信号の雑音低減方法を提供すること
も目的とする。

【００１５】

【課題を解決するための手段】本発明は、上述の問題を
解決するために、入力される音声信号の所定の周波数帯
域を抑圧するフィルタを有する音声符号化装置に音声信
号を供給する音声信号の雑音低減方法において、上記所
定の周波数帯域における雑音抑圧量を小さくするように
周波数特性が制御されるものである。

【００１６】また、上記音声符号化装置のフィルタは、
上記入力される音声信号のピッチ強度に応じて抑圧量が
変化するものであり、上記雑音抑圧量を上記入力される
音声信号のピッチ強度に応じて変化させることが挙げら
れる。

【００１７】また、上記所定の周波数帯域は、音声信号
の低域側であり、上記雑音抑圧量は、上記入力される音
声信号の低域側の雑音抑圧を小さくするように変化する
ことが挙げられる。

【００１８】また、本発明は、上述の問題を解決するた
めに、入力される音声信号の所定の周波数帯域を抑圧す
るフィルタを有する音声符号化装置に音声信号を供給す
る音声信号の雑音低減方法において、上記入力される音
声信号のピッチ強度に応じて、雑音抑圧を行う際の各周
波数帯域毎の信号レベルと雑音レベルとの比に対する雑
音抑圧特性を変化させるものである。

【００１９】また、本発明は、上述の問題を解決するた
めに、入力される音声信号の所定の周波数帯域を抑圧す
るフィルタを有する音声符号化装置に音声信号を供給す
る音声信号の雑音低減方法において、雑音抑圧の特性を
決定する各パラメータをニューラルネットに入力し、上
記入力される音声信号の音声区間及び雑音区間の判別が
行われるものである。

【００２０】また、本発明は、上述の問題を解決するた
めに、入力される音声信号の所定の周波数帯域を抑圧す
るフィルタを有する音声符号化装置に音声信号を供給す
る音声信号の雑音低減方法において、雑音抑圧する際の
特性に基づいて処理される最大抑圧量は、ｄＢ領域で略
線形的に変化するものである。

【００２１】また、本発明は、上述の問題を解決するた
めに、入力される音声信号の所定の周波数帯域を抑圧す
るフィルタを有する音声符号化装置に音声信号を供給す
る音声信号の雑音低減方法において、上記入力される音
声信号のピッチ強度は、信号レベルのピークを選出して
得られるピッチ位置の近傍での自己相関を計算すること
で求められ、雑音抑圧する際の特性は、上記ピッチ強度
に基づいて制御されるものである。

【００２２】また、本発明は、上述の問題を解決するた
めに、入力される音声信号の所定の周波数帯域を抑圧す
るフィルタを有する音声符号化装置に音声信号を供給す
る音声信号の雑音低減方法において、上記入力される音
声信号のフレーム化処理は、当該音声信号の特徴を示す
パラメータの算出用フレームと、算出されたパラメータ
を用いてスペクトルの修正を行うフレームとでそれぞれ
独立して行われるものである。

【００２３】

【作用】本発明の音声信号の雑音低減方法によれば、雑
音低減に用いるフィルタの特性を制御し、入力される音
声信号の所定の周波数帯域における雑音抑圧量を小さく
することで、入力される音声信号の所定の周波数帯域を
抑圧するフィルタを有する音声符号化装置に音声信号を
供給する。

【００２４】また、上記音声符号化装置が、音声信号の
低域側を抑圧するフィルタを有している場合、入力され
る音声信号の低域側の雑音抑圧を小さくするように雑音
抑圧量を制御する。

【００２５】また、本発明の音声信号の雑音低減方法に
よれば、入力される音声信号のピッチが検出され、検出
されたピッチのピッチ強度が得られる。得られたピッチ
強度に応じて、雑音抑圧する際の周波数特性が制御され
る。

【００２６】また、本発明の音声信号の雑音低減方法に
よれば、雑音抑圧する際の周波数特性を決定する各パラ
メータをニューラルネットワークに入力すると、入力さ
れる音声信号の音声区間及び雑音区間の判別が行われ、
この判別は処理を行う回数が増加する程正確になる。

【００２７】また、本発明の音声信号の雑音低減方法に
よれば、入力される音声信号のピッチ強度は、例えば１
つの位相内で２つのピークを選出し、各ピークにおける
自己相関値とピーク間の相互相関値とを算出し、これら
自己相関値及び相互相関値に基づいて得られる。また、
上記ピッチ強度に応じて、雑音抑圧する際の周波数特性
が制御される。

【００２８】また、本発明の音声信号の雑音低減方法に
よれば、入力される音声信号のフレーム化処理をスペク
トルの修正用と、当該音声信号の特徴を示すパラメータ
の算出用とでそれぞれ独立して行い、例えば上記パラメ
ータの算出用のフレーム化処理を上記スペクトルの修飾
用のフレーム化処理よりもサンプル数を多くとるように
する。

【００２９】

【実施例】以下、本発明の音声信号の雑音低減方法につ
いて、図面を参照しながら説明する。

【００３０】ここで、雑音低減装置に適用した本発明の
音声信号の雑音低減方法の一例を図１に示す。

【００３１】上記雑音低減装置は、雑音抑圧フィルタ特
性生成部３５において音声信号入力端子１３からの入力
音声信号の雑音抑圧量を設定し、スペクトラム修正部１
０にて後述するように、上記雑音抑圧量に基づいて上記
入力音声信号中の雑音を低減する。また、音声信号出力
端子１４から出力される音声信号は、例えば符号励振線
形予測符号化のアルゴリズムにより動作する符号化装置
に送られる。

【００３２】上記雑音低減装置において、音声信号入力
端子１３には、音声（Speech）成分と雑音（Noise ）成
分とを含む入力音声信号ｙ［ｔ］が供給されている。こ
の入力音声信号ｙ［ｔ］は、例えば標本化周波数がＦＳ
のディジタル信号である。り、フレーム化処理部２１に
送られて、フレーム長がＦＬサンプルのフレームに分割
され、以下各フレーム毎に処理が行われる。

【００３３】フレーム化処理部２１は、上記入力音声信
号のフレーム化処理を、スペクトルの修飾用の処理を行
う第１フレーム化処理部２２と、当該音声信号の特徴を
示すパラメータの算出用の処理を行う第２フレーム化処
理部１とでそれぞれ独立して行う部分であり、一方は後
述するように雑音抑圧フィルタ特性生成部３５に送られ
上記入力音声信号の信号特性を示すパラメータを算出す
るのに用いられ、もう一方は後述するようにスペクトラ
ム修正部１０にて上記信号特性を示すパラメータに基づ
いて得られる雑音抑圧の特性に応じてスペクトルを修正
するのに用いられる。

【００３４】ここで、第１フレーム化処理部２２は、例
えば図２のＡに示すように、上記入力音声信号を１６８
サンプル単位すなわち上記フレーム長ＦＬが１６８サン
プルのフレームに分割化するいわゆるフレーム化処理を
行っており、ｋ番目のフレームをframe1_k として取り出
して窓掛け処理部２に出力している。なお、第１フレー
ム化処理２２にて得られる各フレームframe1_k は１６０
サンプルを周期として取り出され、前後のフレームとは
８サンプルのオーバーラップを有している。

【００３５】また、第２フレーム化処理部１は、例えば
図２のＢに示すように、上記入力音声信号を２００サン
プル単位すなわち上記フレーム長ＦＬが２００サンプル
となるようにフレーム化処理しており、ｋ番目のフレー
ムをframe2_k として取り出して信号特性計算部３１とフ
ィルタ処理部８とに出力している。なお、第２フレーム
化処理部１にて得られる各フレームframe2_k は、１６０
サンプルを周期として取り出され、１つ前のフレームで
あるframe2_k+1 とは８サンプル、また、１つ後のフレー
ムであるframe2_k-1 とは４０サンプルのオーバーラップ
を有している。

【００３６】また、上記周波数やサンプル数の具体例を
挙げると、標本化周波数ＦＳを８０００Ｈｚ、すなわち
８ｋＨｚとすると、上記第１フレーム化処理部２２及び
第２フレーム化処理部１ともに、フレーム間隔ＦＩが１
６０サンプルであるため、２０ｍｓ毎にフレーム化処理
が行われることになる。

【００３７】図１に戻って、窓かけ処理部２では、次の
直交変換である、例えば高速フーリエ変換処理部３での
計算に先立って、上記第１フレーム化処理部２２より送
られる各フレーム化信号ｙ-frame1_j,k に対して、窓関
数ｗ_input による窓かけ処理が施される。なお、各フレ
ーム毎の信号処理の終段での後述する逆高速フーリエ変
換処理のあとには、出力信号に対して窓関数ｗ_outputに
よる窓かけ処理が施される。このような各窓関数ｗ
_input 及びｗ_outputの一例を、次の（１）式及び（２）
式にそれぞれ示す。

【００３８】

【数１】

【００３９】次に、高速フーリエ変換処理部３では、窓
関数ｗ_input による窓かけ処理が施されたフレーム化信
号ｙ-frame1_j,kに対して、２５６ポイントの高速フーリ
エ変換処理が施され、得られた周波数スペクトル振幅値
は、バンド分割部４及びスペクトラム修正部１０に出力
される。

【００４０】また、雑音抑圧フィルタ特性生成部３５
は、信号特性計算部３１、上記ａｄｊ値計算部３２、Ｃ
Ｅ値及びＮＲ値計算部３６及びＨｎ計算部７を有して成
る部分である。

【００４１】上記雑音抑圧フィルタ特性生成部３５にお
いて、バンド分割部４は、高速フーリエ変換処理部３か
ら出力される入力音声信号を高速フーリエ変換処理して
得られる周波数スペクトルの振幅値を、例えば１８バン
ドに分割して、バンドを識別するバンド番号をｗとし
て、各バンドの振幅Ｙ［ｗ，ｋ］を、信号特性計算部３
１と雑音スペクトル推定部２６と初期フィルタ応答計算
部３３とに出力する。ここで、バンド分割する際の周波
数レンジの一例を次の表に示す。

【００４２】

【表１】

【００４３】これらの周波数帯域は、人間の聴覚システ
ムが高域ほど知覚分解能が劣化することに基づいてい
る。各帯域の振幅として、対応する周波数レンジ内の最
大ＦＦＴ（高速フーリエ変換処理における周波数帯域
の）振幅を用いる。

【００４４】また、信号特性計算部３１は、第２フレー
ム化処理部１にて出力されるｙ-frame2_j,kとバンド分割
部４にて出力されるＹ［ｗ，ｋ］とからフレーム毎のＲ
ＭＳ値であるＲＭＳ［ｋ］、フレーム毎の相対エネルギ
であるｄＢ_rel ［ｋ］、フレーム毎の推定雑音レベル値
であるＭｉｎＲＭＳ［ｋ］、フレーム毎の最大ＲＭＳ値
であるＭａｘＲＭＳ［ｋ］、フレーム毎の最大ＳＮＲ値
であるＭａｘＳＮＲ［ｋ］を算出する。また、ｙ-frame
2_j,kから後述するピッチを検出し、このピッチ強度を求
める。

【００４５】先ず、上記ピッチの検出とピッチ強度の算
出について説明する。

【００４６】ピッチの検出において、例えば図３に示す
ように、入力音声信号ｙ-frame2_j,kの各フレーム中で１
番強いピークがピークｘ［ｍ１］として検出され、ピー
ク［ｍ１］と同じ位相内で２番目に強いピークがピーク
ｘ［ｍ２］として検出される。なお、ｍ１及びｍ２は、
各ピークに対応する時間ｔの値である。また、ピッチｐ
の距離がピークｘ［ｍ１］及びピークｘ［ｍ２］間の距
離｜ｍ１−ｍ２｜として得られる。このピッチｐの最大
ピッチ強度ｍａｘ_Ｒxx は、（６）式に示すように、
（３）式乃至（５）式にて求められるピークｘ［ｍ１］
とピークｘ［ｍ２］との相互相関値ｎｒｇ０、ピークｘ
［ｍ１］の自己相関値ｎｒｇ１及びピークｘ［ｍ２］の
自己相関値ｎｒｇ２に基づいて得ることができる。

【００４７】

【数２】

【００４８】続いて、上記各値の算出方法を説明する。

【００４９】ＲＭＳ［ｋ］は、第ｋフレームframe2_k の
ＲＭＳ値であって、例えば次式で計算される。

【００５０】

【数３】

【００５１】第ｋフレームframe2_k の相対エネルギｄＢ
_rel ［ｋ］は、前フレームframe2_k-1 からの減衰エネル
ギに関連する第ｋフレームの相対エネルギを示すもので
あって、このｄＢ表示の相対エネルギｄＢ_rel ［ｋ］
は、例えば次の（８）式により計算され、この（８）式
中のエネルギ値Ｅ［ｋ］及び減衰エネルギ値Ｅ_decay
［ｋ］は、それぞれ次の（９）式及び（１０）式によ
り求められる。

【００５２】

【数４】

【００５３】また、上記（１０）式においては、減衰時
間（ディケイタイム）を０．６５秒とした例を示してい
る。

【００５４】このような、エネルギＥ［ｋ］及び減衰エ
ネルギＥ_decay ［ｋ］の具体例を、図４に示す。

【００５５】また、第ｋフレームframe2_k の最大ＲＭＳ
値ＭａｘＲＭＳ［ｋ］は、後述する各フレームの推定雑
音レベル値と最大ＳＮ比とを見積もるのに必要な値であ
って、以下の（１１）式にて算出される。（１１）式
で、θは減衰定数（decay constant）であり、例えば
３．２秒で最大ＲＭＳ値が１／ｅだけ減衰するような
値、すなわちθ＝０．９９３７６９が用いられる。

【００５６】

【数５】

【００５７】第ｋフレームframe2_k の推定雑音レベル値
ＭｉｎＲＭＳ［ｋ］は、バックグラウンドノイズ、ある
いは背景雑音のレベルを評価するのに好適な最小のＲＭ
Ｓ値であって、現時点から前に５個の局所極小値（loca
l minimum ）、すなわち（１２）式を満たす値の内で最
小となる値である。

【００５８】

【数６】

【００５９】この推定雑音レベル値ＭｉｎＲＭＳ［ｋ］
は、音声（Speech）無しの背景雑音、いわゆるバックグ
ラウンドノイズのときに上昇してゆくように設定されて
いる。ノイズレベルが高いときの上昇レートは指数関数
的であるが、低いノイズレベルのときには、より大きな
上昇を得るために固定の上昇レートが用いられる。

【００６０】これらのＲＭＳ値ＲＭＳ［ｋ］、推定雑音
レベル値ＭｉｎＲＭＳ［ｋ］及び最大ＲＭＳ値ＭａｘＲ
ＭＳ［ｋ］の具体例を、図５に示す。

【００６１】第ｋフレームframe2_k の最大ＳＮ比Ｍａｘ
ＳＮＲ［ｋ］は、ＭａｘＲＭＳ［ｋ］とＭｉｎＲＭＳ
［ｋ］とに基づいて、以下の（１３）式により推定され
る値である。

【００６２】

【数７】

【００６３】また、この最大ＳＮ比値ＭａｘＳＮＲから
は、相対ノイズレベルを示す０から１までの範囲の正規
化パラメータＮＲ_level［ｋ］が算出される。このＮＲ
_level［ｋ］には、以下の関数が用いられる。

【００６４】

【数８】

【００６５】次に、雑音スペクトル推定部２６は、ＲＭ
Ｓ［ｋ］、ｄＢ_rel ［ｋ］、ＮＲ_level［ｋ］、Ｍｉｎ
ＲＭＳ［ｋ］及びＭａｘＳＮＲ［ｋ］に基づいて、音声
（speech）を背景雑音（background noise）から区別す
る。すなわち、次の条件が正しいとき、第ｋフレーム中
の信号は背景雑音として分類される。こうして分類され
た背景雑音が示す振幅値は、ノイズスペクトルの時間平
均推定値Ｎ［ｗ，ｋ］として算出され、初期フィルタ応
答計算部３３に出力される。

【００６６】

【数９】

【００６７】ここで図６は、上記（１５）式中のｄＢ表
示の相対エネルギｄＢ_rel ［ｋ］と、最大ＳＮ比Ｍａｘ
ＳＮＲ［ｋ］と、雑音判別の閾値の１つであるｄＢthre
s_rel［ｋ］との具体例を示している。

【００６８】また図７は、上記（１４）式中のＭａｘＳ
ＮＲ［ｋ］の関数としてのＮＲ_level［ｋ］を示してい
る。

【００６９】第ｋフレームが背景雑音、あるいはノイズ
として分類される場合、上記ノイズスペクトルの時間平
均推定値Ｎ［ｗ，ｋ］は、現在フレームの信号の入力信
号スペクトルの振幅Ｙ［ｗ，ｋ］によって、次の（１
６）式のように更新される。なお、ｗは上記バンド分割
のバンド番号を示すものである。

【００７０】

【数１０】

【００７１】ここで、第ｋフレームが音声（speech）と
して分類された場合、Ｎ［ｗ，ｋ］はＮ［ｗ，ｋ−１］
の値をそのまま用いる。

【００７２】次に、ａｄｊ値計算部３２は、ＲＭＳ
［ｋ］、ＭｉｎＲＭＳ［ｋ］及びＭａｘＲＭＳ［ｋ］に
基づいて、後述するａｄｊ１［ｋ］、ａｄｊ２［ｋ］及
びａｄｊ３［ｗ，ｋ］を用いて、（１７）式によりａｄ
ｊ［ｗ，ｋ］を算出し、ＣＥ値及びＮＲ値計算部３６に
出力する。

【００７３】

【数１１】

【００７４】ここで、（１７）式中のａｄｊ１［ｋ］
は、全ての帯域において、高いＳＮ比における後述する
フィルタ処理による雑音抑圧動作を抑える効果を有する
値であり、以下の（１８）式にて定義される。

【００７５】

【数１２】

【００７６】また、（１７）式中のａｄｊ２［ｋ］は、
非常に低いノイズレベルや非常に高いノイズレベルに対
して、上記フィルタ処理による雑音抑圧レートを抑える
効果を有する値であり、以下の（１９）式にて定義され
る。

【００７７】

【数１３】

【００７８】また、（１７）式中のａｄｊ３［ｗ，ｋ］
は、図３で示したような入力音声信号のピッチｐの強
度、特に最大ピッチ強度ｍａｘ_Ｒxx が大きいときに、
低域側と高域側とにおける雑音抑圧量を低減するように
制御する値であり、例えばピッチ強度が所定値より大き
くかつ入力音声信号レベルが雑音レベルより大きい場合
は、図８のＡに示すような低域側で所定値をとり高域側
で周波数ｗに対して線形的に変化するとともに他の周波
数帯域では０である値であり、また、その他の場合は、
図８のＢに示すように低域側で所定値をとるとともに他
の周波数帯域では０である値である。

【００７９】このａｄｊ３［ｗ，ｋ］の定義の一例を、
（２０）式に示す。

【００８０】

【数１４】

【００８１】この（２０）式において、最大ピッチ強度
ｍａｘ_Ｒxx［ｔ］は、最初の最大ピッチ強度ｍａｘ_
Ｒxx［０］で規格化して用いており、また、入力音声
レベルと雑音レベルとの比較は、ＭｉｎＲＭＳ［ｋ］及
びＭａｘＲＭＳ［ｋ］を用いて得られる値を用いて行わ
れる。

【００８２】また、ＣＥ値及びＮＲ値計算部３６は、フ
ィルタ特性を制御するＮＲ値を求めてＨｎ値計算部７に
出力する。

【００８３】ここで、例えば上記ＮＲ値であるＮＲ
［ｗ，ｋ］は、以下の（２１）式で定義される。

【００８４】

【数１５】

【００８５】（２１）式のＮＲ´［ｗ，ｋ］は、上記ａ
ｄｊ値計算部３２から送られるａｄｊ［ｗ，ｋ］を用い
て（２２）式にて求められる値である。

【００８６】また、上記ＣＥ値及びＮＲ値計算部３６
は、（２１）式で用いるＣＥ［ｋ］の算出も行ってい
る。このＣＥ［ｋ］は、上記入力信号スペクトルの振幅
Ｙ［ｗ，ｋ］中に含まれる子音成分をフレーム毎に検出
した子音検出結果を表す値である。この子音検出処理の
具体例について説明する。

【００８７】上記ピッチ強度が所定値より大きくかつ入
力音声信号レベルが雑音レベルより大きい場合、すなわ
ち（２０）式の最初に示されている条件が満たされる場
合、ＣＥ［ｋ］は、例えば０．５をとる。また、上記条
件を満たさない場合は、以下の方法で決定されるＣＥ
［ｋ］を用いる。

【００８８】先ず、上記Ｙ［ｗ，ｋ］中の連続するサン
プル間で符号が、例えば正から負、あるいは負から正と
いうように逆転する箇所、または、逆の符号を有するサ
ンプル間で０という値を有するサンプルが存在する箇所
がゼロクロスとして検出される。このゼロクロスの数
が、フレーム毎に検出され、この値がゼロクロス数ＺＣ
［ｋ］として以下の処理に用いられる。

【００８９】次に、トーン、すなわち上記Ｙ［ｗ，ｋ］
の周波数成分の分布を表す値、例えば、図９に示すよう
に、高域における上記入力信号スペクトルの平均レベル
ｔ′と低域における上記入力信号スペクトルの平均レベ
ルｂ′との比ｔ′／ｂ´（＝ｔｏｎｅ［ｋ］）が検出さ
れる。この値ｔ′及び値ｂ´は、以下の（２３）式にて
定義される誤差関数ＥＲＲ（ｆｃ，ｂ，ｔ）が最小値を
とるような値ｔ及び値ｂである。（２３）式において、
ＮＢはバンド数を表し、Ｙ_max ［ｗ，ｋ］はバンドｗに
おけるＹ［ｗ，ｋ］の最大値を表し、ｆｃは高域と低域
とを分離する点を表す。また、図９において、周波数ｆ
ｃにおいて、低域側のＹ［ｗ，ｋ］の平均値を値ｂとし
て、また、高域側のＹ［ｗ，ｋ］の平均値を値ｔとして
いる。

【００９０】

【数１６】

【００９１】さらに、ＲＭＳ値及びゼロクロス数に基づ
いて、有声音声が検出されたフレームの近傍のフレー
ム、すなわち音声近接フレームが検出され、このフレー
ム数として音節近接フレーム数spch_prox［ｋ］が、以
下の（２４）式に基づいて得られ、出力される。

【００９２】

【数１７】

【００９３】そして、上記ゼロクロス数、上記音声近接
フレーム数、上記トーン及びＲＭＳ値に基づいて、各フ
レームのＹ［ｗ，ｋ］中の子音成分の検出が行われる。
この子音検出結果としてＣＥ［ｋ］が、以下の（２５）
式に基づいて得られる。

【００９４】

【数１８】

【００９５】また、各シンボルＣ１、Ｃ２、Ｃ３、Ｃ
４．１乃至Ｃ４．７は、以下の表にて定義される。

【００９６】

【表２】

【００９７】上記表２において、ＣＤＳ０、ＣＤＳ１、
ＣＤＳ２、Ｔ、Ｚｌｏｗ及びＺｈｉｇｈの各値は、子音
検出の感度を決定する定数であり、例えばＣＤＳ０＝Ｃ
ＤＳ１＝ＣＤＳ２＝１．４１、Ｔ＝２０、Ｚｌｏｗ＝２
０、Ｚｈｉｇｈ＝７５の値をとる。また、（２５）式の
Ｅは、０から１までの値をとるもので、０に近いほど通
常の子音抑圧量に近くなるように後述するフィルタ応答
が調整され、また、１に近いほど子音抑圧量が最低量と
なるように上記フィルタ応答が調整される値であり、例
えば０．７が用いられる。

【００９８】また、上記表２によれば、あるフレームに
おいて、シンボルＣ１が成立することは上記フレームの
信号レベルが最低ノイズレベルより大きいことを示し、
シンボルＣ２が成立することは上記フレームのゼロクロ
ス数が所定のゼロクロス数Ｚｌｏｗ、本実施例では２０
より大きいことを示し、また、シンボルＣ３が成立する
ことは上記フレームが有声音声が検出されたフレームよ
りＴフレーム以内、本実施例では２０フレーム以内であ
ることを示している。

【００９９】また、シンボルＣ４．１が成立することは
上記フレームにおいて信号レベルが変化することを示
し、シンボルＣ４．２が成立することは上記フレームが
音声信号が変化して１フレーム後であって信号レベルが
変化するフレームであることを示し、また、シンボルＣ
４．３が成立することは上記フレームが音声信号が変化
して２フレーム後であって信号レベルが変化するフレー
ムであることを示している。また、シンボルＣ４．４が
成立することは、上記フレームにおいて、ゼロクロス数
が所定のゼロクロス数Ｚｈｉｇｈ、本実施例では７５よ
り大きいことを示している。また、シンボルＣ４．５が
成立することは上記フレームにおいてトーン値が変化す
ることを示し、シンボルＣ４．６が成立することは上記
フレームが音声信号が変化して１フレーム後であってト
ーン値が変化するフレームであることを示し、シンボル
Ｃ４．７が成立することは上記フレームが音声信号が変
化して２フレーム後であってトーン値が変化するフレー
ムであることを示している。

【０１００】また、（２５）式によれば、このフレーム
が子音成分を含んでいることの条件は、上述のシンボル
Ｃ１乃至Ｃ３の条件を満たすこと、ｔｏｎｅ［ｋ］が
０．６より大きいこと及び上述のＣ４．１乃至Ｃ４．７
の条件の内の少なくとも１つが満たされることである。

【０１０１】また、初期フィルタ応答計算部３３は、雑
音スペクトル推定部２６から出力される雑音時間平均値
Ｎ［ｗ，ｋ］と、バンド分割部４から出力されるＹ
［ｗ，ｋ］とをフィルタ抑圧曲線テーブル部３４に送
り、フィルタ抑圧曲線テーブル部３４に収納されるＹ
［ｗ，ｋ］とＮ［ｗ，ｋ］とに応じたＨ［ｗ，ｋ］の値
を探し出し、このＨ［ｗ，ｋ］をＨｎ値計算部７に出力
する。なお、フィルタ抑圧曲線テーブル部３４は、Ｈ
［ｗ，ｋ］に関する表が格納されている。

【０１０２】Ｈｎ値計算部７は、バンド分割された入力
信号スペクトルの振幅Ｙ［ｗ，ｋ］と、ノイズスペクト
ルの時間平均推定値Ｎ［ｗ，ｋ］と、上記ＮＲ［ｗ，
ｋ］とから、上記バンド分割された入力信号スペクトル
の振幅Ｙ［ｗ，ｋ］から雑音成分を低減するためのプレ
フィルタである。ここでは、Ｙ［ｗ，ｋ］がＮ［ｗ，
ｋ］に応じてＨｎ［ｗ，ｋ］に変換され、このフィルタ
応答Ｈｎ［ｗ，ｋ］が出力される。なお、このＨｎ
［ｗ，ｋ］値は、以下の（２６）式に基づいて算出され
る。

【０１０３】

【数１９】

【０１０４】また、上記（２６）式中の値Ｈ［ｗ］［Ｓ
／Ｎ＝ｒ］は、ＳＮ比をある値ｒに固定したとき最適な
ノイズ抑圧フィルタ特性に当たり、この値は、Ｙ［ｗ，
ｋ］／Ｎ［ｗ，ｋ］の値に応じてテーブル化されてお
り、上記フィルタ抑圧曲線テーブル部３４に格納されて
いる。なお、上記Ｈ［ｗ］［Ｓ／Ｎ＝ｒ］は、ｄＢ領域
で直線的に変化する値である。

【０１０５】さらに、上記（２６）式を（２７）式のよ
うに変形すると、最大抑圧量の関数である左辺は、ＮＲ
［ｗ，ｋ］と直線関係にあることが示され、両者の関係
を図１０のように示すことができる。

【０１０６】また、フィルタ処理部８では、上記Ｈｎ
［ｗ，ｋ］値が周波数軸方向と時間軸方向とについて円
滑化するフィルタ処理を行い、得られる信号として円滑
化信号Ｈ_{t_smooth}［ｗ，ｋ］が出力される。上記周波数
軸方向へのフィルタ処理は、Ｈｎ［ｗ，ｋ］の有効イン
パルス応答長を短くする効果がある。これにより周波数
領域での乗算によるフィルタの実現に起因する環状畳み
込みによるエリアシングの発生を未然に防いでいる。ま
た、上記時間軸方向へのフィルタ処理は、突発的な雑音
を抑えるフィルタの変化の速さを制限する効果がある。

【０１０７】先ず、上記周波数軸方向へのフィルタ処理
についての説明を行う。上記各バンドのＨｎ［ｗ，ｋ］
に、メディアン（中央値）フィルタ処理が施される。次
の（２８）式及び（２９）式にて、この方法を示す。

【０１０８】

【数２０】

【０１０９】（２８）式の第１段階（Step1 ）におい
て、Ｈ１［ｗ，ｋ］は、単一の、あるいは孤立した０の
バンドを無くしたＨｎ［ｗ，ｋ］であり、（２９）式の
第２段階（Step2 ）において、Ｈ２［ｗ，ｋ］は、単一
の、あるいは孤立した突出したバンドを無くしたＨ１
［ｗ，ｋ］である。このようにして、上記Ｈｎ［ｗ，
ｋ］は、Ｈ２［ｗ，ｋ］に変換される。

【０１１０】次に、上記時間軸方向へのフィルタ処理に
ついての説明を行う。この時間軸方向へのフィルタ処理
を施す際において、入力信号には、音声（speech）、バ
ックグラウンドノイズ、そして音声（speech）の立ち上
がり部分である過度的状態の３種あることを考慮に入れ
る。音声の信号Ｈ_speech［ｗ，ｋ］に対しては、次の
（３０）式に示すように、時間軸での円滑化、あるいは
スムージングを行う。

【０１１１】

【数２１】

【０１１２】また、背景雑音の信号に対しては、次の
（３１）式に示すような時間軸での円滑化、あるいはス
ムージングを行う。

【０１１３】また、過度的状態の信号に対しては、この
時間軸でのスムージングを行われない。

【０１１４】以上のスムージング処理が行われた信号を
用いて、（３２）式により円滑化出力信号Ｈ
_{t_smooth}［ｗ，ｋ］を得る。

【０１１５】

【数２２】

【０１１６】ここで、（３２）式中のα_spは次の（３
３）式から、α_trは次の（３４）式からそれぞれ求めら
れる。

【０１１７】続いて、バンド変換部９では、フィルタ処
理部８からの、例えば１８バンド分の円滑化信号Ｈ
_{t_smooth}［ｗ，ｋ］が、例えば１２８バンド分の信号Ｈ
₁₂₈ ［ｗ，ｋ］に、補間処理により拡張変換され、この
変換された信号Ｈ₁₂₈ ［ｗ，ｋ］が出力される。この変
換は、例えば２段階で行っており、１８バンドから６４
バンドへの拡張はゼロ次ホールドにより、６４バンドか
ら１２８バンドへの拡張はローパスフィルタ型の補間処
理により、それぞれ行っている。

【０１１８】次に、スペクトラム修正部１０では、高速
フーリエ変換処理部３で得られたフレーム化信号ｙ−ｆ
ｒａｍｅ_j,k の高速フーリエ変換処理にて得られるＦＦ
Ｔ係数の実部と虚部とに各々上記信号Ｈ₁₂₈ ［ｗ，ｋ］
を乗じてスペクトラム修正、すなわち雑音成分を低減す
る処理が行われ、得られた信号が出力される。この結
果、スペクトルの振幅は修正されるが位相は変形を受け
ない。

【０１１９】次に逆高速フーリエ変換処理部１１では、
スペクトラム修正部１０にて得られた信号を用いて、逆
高速フーリエ変換処理が行われ、得られたＩＦＦＴ信号
が出力される。

【０１２０】次に、オーバーラップ加算部１２では、各
フレーム毎のＩＦＦＴ信号のフレーム境界部分について
の重ね合わせが行われ、得られた出力音声信号が音声信
号出力端子１４より出力される。

【０１２１】さらに、この出力を例えば符号励振線形予
測符号化のアルゴリズムに用いた場合を考える。

【０１２２】ここで、上記符号励振線形予測符号化のア
ルゴリズムによる符号化装置を図１１に、また、復号化
装置を図１２にそれぞれ示す。

【０１２３】上記符号化装置は、図１１に示すように、
入力端子６１から入力音声信号が入力され、線形予測符
号分析またはＬＰＣ（linear pridictive coding）分析
部６２及び減算器６４に送られる。

【０１２４】ＬＰＣ分析部６２は、上記入力音声信号の
線形予測を行いこの予測フィルタ係数を合成フィルタ６
３に出力する。合成フィルタ６３は、２つのコードブッ
クの１つである固定コードブック６７からのコードワー
ドに乗算器８１の利得を掛けたデータと、ダイナミック
コードブック６８からのコードワードに乗算器８２の利
得とを掛けたデータとを加算器６９にて加算された出力
が、上記ＬＰＣ分析部６２から送られる予測フィルタ係
数を持つＬＰＣ合成フィルタに入力され、その合成出力
が、減算器６４に出力する。

【０１２５】また、減算器６４は、上記入力音声信号と
合成フィルタ６３からの合成出力との差を取り出し聴覚
重み付けフィルタ６５に出力する。聴覚重み付けフィル
タ６５は、周波数帯域毎に入力音声信号のスペクトルに
応じた重みを付けて、誤差検出部６６に出力する。誤差
検出部６６は、聴覚重み付けフィルタ６５からの出力の
重み付き誤差のエネルギを算出して、固定コードブック
６７及びダイナミックコードブック６８のコードブック
サーチにおいて、この重み付き誤差エネルギが最小にな
るような各コードブックのコードワードが取り出され
る。

【０１２６】上記符号化装置からは上記固定コードブッ
ク６７のコードワードのインデックス、ダイナミックコ
ードブック６８のコードワードのインデックス、各乗算
器に対応する利得のインデックス、ＬＰＣ分析部６２か
らフィルタ係数を生成する各パラメータの量子化インデ
ックス等が復号化装置に伝送され、復号化装置にて各イ
ンデックスを用いた復号化処理がなされる。

【０１２７】そこで、上記復号化装置は、図１２に示す
ように、固定コードブック７１は上記符号化装置から送
られる上記固定コードブック６７のコードワードのイン
デックスに基づいて、ダイナミックコードブック７２は
上記ダイナミックコードブック６８のコードワードのイ
ンデックスに基づいて、各コードワードを固定コードブ
ック７１あるいはダイナミックコードブック７２より取
り出す。また、乗算器８３、８４は、各対応する利得イ
ンデックスに基づいて動作し、合成フィルタ７４は、上
記量子化インデックス等の各パラメータが送られ、これ
らパラメータを用いて、２つのコードブックからのコー
ドワードに利得が乗算されたデータを励起信号と合成し
た合成出力をポストフィルタ７５に出力する。ポストフ
ィルタ７５では、いわゆるフォルマント強調を行い、信
号の谷間と山とをより明確にする操作が行われる。フォ
ルマント強調がなされた音声信号が出力端子７６より出
力される。

【０１２８】また、ここで、例えば聴覚上より好ましい
音声信号を得るために、上記アルゴリズムでは、符号化
する音声信号の低域側を抑圧したり、高域側をブートす
るフィルタ処理が含まれており、上記復号化装置からの
デコーダ出力信号は、低域側が抑圧された音声信号とな
っている。

【０１２９】従って、上述のように本発明の音声信号の
雑音低減方法では、上記フィルタ処理に応じて、ａｄｊ
値計算部３２におけるａｄｊ３［ｗ，ｋ］の値を、特に
ピッチが大きい音声信号に対しては低域側で所定値を有
し、さらに高域側で周波数に対して線形関係を有するよ
うに見積もることで、結果的に低域側の音声信号の抑圧
が抑えられるため、上記アルゴリズムの処理によるフォ
ルマント強調がなされた音声信号の低域側は、過度な抑
圧を受ける虞がない、すなわち符号化処理等により本来
の周波数特性の変化を減少させることができる。

【０１３０】なお、ここでは、上記雑音低減装置が、低
域側の音声信号を抑圧したり、高域側ブーストするよう
なフィルタ処理を行う音声符号化装置に出力する例を挙
げたが、雑音抑圧する際の高域側の音声信号の抑圧を抑
えるようにａｄｊ３［ｗ，ｋ］を設定することで、例え
ば高域側の音声信号を抑圧するような音声符号化装置に
出力する場合にも用いることが可能である。

【０１３１】また、ＣＥ値及びＮＲ値計算部３６におい
て、ＣＥ値をピッチの大きさに応じて計算方法を変え
て、このＣＥ値に応じてＮＲ値を決定するため、ピッチ
強度に応じたＮＲ値を得ることが可能であり入力される
音声信号に即したＮＲ値により雑音抑圧を行うことが可
能になるため、スペクトル量子化誤差を減少させること
ができる。

【０１３２】また、Ｈｎ値計算部７において、Ｈｎ
［ｗ，ｋ］を入力されるＮＲ［ｗ，ｋ］に対して、ｄＢ
領域で略直線的に変化させることで、Ｈｎ値の変化に対
するＮＲ値の寄与は常に連続しており、急激にＮＲ値が
変化してもＨｎ値の変化はこれに対応する。

【０１３３】また、信号特性計算部３１にて最大ピッチ
強度を算出するのに、例えば高速フーリエ変換処理にお
いて用いる（Ｎ＋ｌｏｇＮ）といった自己相関関数によ
る複雑な計算を行う必要がなくなり、例えば２００サン
プルの処理を行った場合、上記自己相関関数では５００
００回の処理が必要であったのに対して、本発明では３
０００回の処理で済むため、演算処理の速度を上げるこ
とができる。

【０１３４】また、図２のＡに示したように、第１フレ
ーム化処理部２２のフレーム化処理ではフレーム長ＦＬ
が１６８サンプル、各フレームは前後のフレームと８サ
ンプルずつオーバーラップ部分を有するようにサンプリ
ングされ、また、図２のＢに示したように、第２フレー
ム化処理部１のフレーム化処理をフレーム長ＦＬが２０
０サンプル、各フレームは１つ手前のフレームとは４０
サンプル、１つ先のフレームとは８サンプルのオーバー
ラップ部分を有するようにサンプリングさせて、かつ、
第１フレーム化処理部２２と第２フレーム化処理部１と
で各フレームの開始位置を同じにして、上記第２フレー
ム化処理部１の方が上記第１フレーム化処理部２２より
も３２サンプル分だけ後ろにずらすことで、第１フレー
ム化処理部２２及び第２フレーム化処理部１間で、遅延
が生じることがなく、信号特性値を算出するためのサン
プル数を多くとることができる。

【０１３５】また、上記ＲＭＳ［ｋ］と、上記ＭｉｎＲ
ＭＳ［ｋ］と、上記ｔｏｎｅ［ｗ，ｋ］と、上記ＺＣ
［ｗ，ｋ］と、上記Ｒxxとを、図１３に示すように、例
えばバックプロパゲーションタイプのニューラルネット
ワークの入力として用いて、雑音区間推定を行ってもよ
い。

【０１３６】上記ニューラルネットワークにおいて、上
記ＲＭＳ［ｋ］、上記ＭｉｎＲＭＳ［ｋ］、上記ｔｏｎ
ｅ［ｗ，ｋ］、上記ＺＣ［ｗ，ｋ］、上記Ｒxxの各値が
入力層の各端子に入力される。

【０１３７】入力層の各端子に入力された各値は、中間
層に出力されるが、この際にシナプス荷重いわゆる重み
が付けられる。すなわち、重みが乗ぜられる。

【０１３８】また、中間層では、それぞれに重みが付け
られた各値と、バイアス５１からバイアス値が入力さ
れ、所定の処理が行われた後、処理結果が出力される。
この処理結果には重みが付けられる。

【０１３９】出力層では、中間層から出力される重みが
付けられた処理結果にバイアス５２からバイアス値が入
力され、所定の処理が行われた後、雑音区間推定の結果
が出力される。

【０１４０】なお、バイアス５１、５２から出力される
各バイアス値及び各出力に付けられる重みは、いわゆる
望ましい変換を実現させるために適応的に決定される。
従って、処理されるデータが多ければ多いほど確からし
さが向上する。すなわち、処理が行われれば行われる
程、音声と雑音との分類において、より入力音声信号に
即した推定雑音レベル及びスペクトルが定まり、正確な
Ｈｎ値の算出を行うことができるようになる。

【０１４１】

【発明の効果】以上説明したように、本発明の音声信号
の雑音低減方法によれば、入力される音声信号のピッチ
強度に応じて雑音低減に用いるフィルタの特性を制御
し、上記入力される音声信号の所定の周波数帯域、例え
ば高域側や低域側における雑音抑圧量を小さくすること
で、上記雑音抑圧量に基づいて処理された音声信号を音
声符号化しても聴覚上不自然な音声となる虞がなくな
る、すなわち音質が向上する。

【図面の簡単な説明】

【図１】本発明の音声信号の雑音低減方法を適用した雑
音低減装置の要部を示すブロック図である。

【図２】上記雑音低減装置のフレーム化処理部における
フレーム化処理を説明する図である。

【図３】上記雑音低減装置の信号特性計算部におけるピ
ッチ検出処理を説明する図である。

【図４】上記雑音低減装置におけるエネルギＥ［ｋ］及
び減衰エネルギＥ_decay［ｋ］の具体例を示す図であ
る。

【図５】上記雑音低減装置におけるＲＭＳ値ＲＭＳ
［ｋ］、推定雑音レベル値ＭｉｎＲＭＳ［ｋ］及び最大
ＲＭＳ値ＭａｘＲＭＳ［ｋ］の具体例を示す図である。

【図６】上記雑音低減装置におけるｄＢ表示の相対エネ
ルギｄＢ_rel［ｋ］、最大ＳＮ比ＭａｘＳＮＲ［ｋ］、
及び雑音判別の閾値の１つであるｄＢthres_rel［ｋ］の
具体例を示す図である。

【図７】上記雑音低減装置における最大ＳＮ比ＭａｘＳ
ＮＲ［ｋ］に対して定義される関数としてのＮＲ_level
［ｋ］を示すグラフである。

【図８】上記雑音低減装置のａｄｊ値計算部にて得られ
るａｄｊ３［ｗ，ｋ］と周波数との関係を示すグラフで
ある。

【図９】上記雑音低減装置における入力信号スペクトル
の周波数領域の分布を示す値を求める方法を説明する図
である。

【図１０】上記雑音低減装置のＣＥ値及びＮＲ値計算部
にて得られるＮＲ［ｗ，ｋ］と、Ｈｎ値計算部にて得ら
れる最大抑圧量との関係を表すグラフである。

【図１１】上記雑音低減装置の出力を用いる例としての
符号励振線形予測符号化のアルゴリズムによる符号化装
置の要部を示すブロック図である。

【図１２】上記符号化装置により符号化された音声信号
を復号化するための復号化装置の要部を示すブロック図
である。

【図１３】本発明の音声信号の雑音低減方法において、
雑音区間推定を行う実施例を示す図である。

【符号の説明】

１第２フレーム化処理部７Ｈｎ値計算部２１フレーム化処理部２２第１フレーム化処理部３１信号特性計算部３２ａｄｊ値計算部３６ＣＥ値及びＮＲ値計算部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁶ 識別記号庁内整理番号ＦＩ技術表示箇所Ｇ１０Ｌ 9/10 ３０１Ｇ１０Ｌ 9/10 ３０１ＣＨ０３Ｈ 17/02 ６０１ 8842−5ＪＨ０３Ｈ 17/02 ６０１Ｈ 21/00 8842−5Ｊ 21/00

Claims

【特許請求の範囲】

【請求項１】入力される音声信号の所定の周波数帯域
を抑圧するフィルタを有する音声符号化装置に音声信号
を供給する音声信号の雑音低減方法において、上記所定の周波数帯域における雑音抑圧量を小さくする
ように周波数特性が制御されることを特徴とする音声信
号の雑音低減方法。
【請求項２】上記音声符号化装置のフィルタは、上記
入力される音声信号のピッチ強度に応じて抑圧量が変化
するものであり、上記雑音抑圧量を上記入力される音声
信号のピッチ強度に応じて変化させることを特徴とする
請求項１記載の音声信号の雑音低減方法。
【請求項３】上記雑音抑圧量は、上記入力される音声
信号の高域側の雑音抑圧を小さくするように変化するこ
とを特徴とする請求項２記載の音声信号の雑音低減方
法。
【請求項４】上記所定の周波数帯域は、音声信号の低
域側であり、上記雑音抑圧量は、上記入力される音声信号の低域側の
雑音抑圧を小さくするように変化することを特徴とする
請求項１記載の音声信号の雑音低減方法。
【請求項５】入力される音声信号の所定の周波数帯域
を抑圧するフィルタを有する音声符号化装置に音声信号
を供給する音声信号の雑音低減方法において、上記入力される音声信号のピッチ強度に応じて、雑音抑
圧を行う際の各周波数帯域毎の信号レベルと雑音レベル
との比に対する雑音抑圧特性を変化させることを特徴と
する音声信号の雑音低減方法。
【請求項６】雑音抑圧特性は、雑音抑圧量が上記ピッ
チ強度が大きいときに小さくなるように制御されること
を特徴とする請求項５記載の音声信号の雑音低減方法。
【請求項７】入力される音声信号の所定の周波数帯域
を抑圧するフィルタを有する音声符号化装置に音声信号
を供給する音声信号の雑音低減方法において、雑音抑圧の特性を決定する各パラメータをニューラルネ
ットに入力し、上記入力される音声信号の音声区間及び
雑音区間の判別が行われることを特徴とする音声信号の
雑音低減方法。
【請求項８】上記ニューラルネットに入力されるパラ
メータは、少なくとも上記入力される音声信号の自乗平
均の平方根及び推定雑音レベルであることを特徴とする
請求項７記載の音声信号の雑音低減方法。
【請求項９】入力される音声信号の所定の周波数帯域
を抑圧するフィルタを有する音声符号化装置に音声信号
を供給する音声信号の雑音低減方法において、雑音抑圧する際の特性に基づいて処理される最大抑圧量
は、ｄＢ領域で略線形的に変化することを特徴とする音
声信号の雑音低減方法。
【請求項１０】入力される音声信号の所定の周波数帯
域を抑圧するフィルタを有する音声符号化装置に音声信
号を供給する音声信号の雑音低減方法において、上記入力される音声信号のピッチ強度は、信号レベルの
ピークを選出して得られるピッチ位置の近傍での自己相
関を計算することで求められ、雑音抑圧する際の特性は、上記ピッチ強度に基づいて制
御されることを特徴とする音声信号の雑音低減方法。
【請求項１１】入力される音声信号の所定の周波数帯
域を抑圧するフィルタを有する音声符号化装置に音声信
号を供給する音声信号の雑音低減方法において、上記入力される音声信号のフレーム化処理は、当該音声
信号の特徴を示すパラメータの算出用フレームと、算出
されたパラメータを用いてスペクトルの修正を行うフレ
ームとでそれぞれ独立して行われることを特徴とする音
声信号の雑音低減方法。