JPH08221094A - 音声信号の雑音低減方法及び装置 - Google Patents
音声信号の雑音低減方法及び装置Info
- Publication number
- JPH08221094A JPH08221094A JP7029337A JP2933795A JPH08221094A JP H08221094 A JPH08221094 A JP H08221094A JP 7029337 A JP7029337 A JP 7029337A JP 2933795 A JP2933795 A JP 2933795A JP H08221094 A JPH08221094 A JP H08221094A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- signal
- consonant
- input
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 53
- 230000009467 reduction Effects 0.000 claims abstract description 95
- 238000001228 spectrum Methods 0.000 claims abstract description 75
- 238000001514 detection method Methods 0.000 claims abstract description 49
- 238000012545 processing Methods 0.000 claims abstract description 44
- 230000001629 suppression Effects 0.000 claims abstract description 40
- 230000005236 sound signal Effects 0.000 claims description 75
- 230000000694 effects Effects 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 abstract description 65
- 230000008569 process Effects 0.000 description 14
- 238000001914 filtration Methods 0.000 description 13
- 238000012937 correction Methods 0.000 description 8
- 238000009499 grossing Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000009432 framing Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 102100033126 Phosphatidate cytidylyltransferase 2 Human genes 0.000 description 2
- 101710178746 Phosphatidate cytidylyltransferase 2 Proteins 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 102100033118 Phosphatidate cytidylyltransferase 1 Human genes 0.000 description 1
- 101710178747 Phosphatidate cytidylyltransferase 1 Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/09—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Mobile Radio Communication Systems (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Picture Signal Circuits (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Abstract
すると共に、入力信号中の子音部分の抑圧を抑えること
が可能になる。 【構成】 入力音声信号から雑音除去することで雑音抑
圧を行うと共に、雑音低減量が制御信号に応じて可変で
ある雑音低減処理部としてのスペクトラム修正部10
と、上記入力音声信号に含まれる子音部分を検出する子
音部分検出手段である子音検出部41と、上記子音部分
検出手段にて得られる子音検出結果に応じて上記雑音低
減量を抑える制御を行う制御手段としてのHn値計算部
7とを有して成るものである。
Description
除去することで雑音抑圧を行う音声信号の雑音低減方法
に関し、また、上記音声信号の雑音低減方法に基づいた
雑音除去を行う音声信号の雑音低減装置に関する。
て、収音された音声信号に含まれる環境雑音や背景雑音
等の雑音を抑圧し、音声成分を強調することが必要とさ
れている。
技術として、減衰ファクタの調整のために条件付き確率
関数を用いる例が、文献「軟判定雑音抑圧フィルタを用
いる音声強調」(Speech Enhancement Using a SoftーDe
cision Noise Suppression Filter, R.J.McAulay, M.L.
Malpass, IEEE Trans. Acoust., Speech, Signal Proce
ssing, Vol.28, pp.137-145, April 1980 )や、「移動
電話システムにおける周波数領域雑音抑圧研究」(Freq
uency Domain Noise Suppression Approach inMobil Te
lephone Systems, J.Yang, IEEE ICASSP, Vol.II, pp.3
63-366, April1993 )等に開示されている。
の雑音抑圧技術においては、不適切な固定のSNR(信
号対雑音比)に基づく動作をするため、または不適切な
抑圧フィルタにより、音色の不自然さや歪んだ音声を生
ずることがある。実際の運用の際に、最適の性能を得る
ために雑音抑圧装置のパラメータの1つであるSNRを
調整することは、ユーザにとって望ましいことではな
い。さらに、従来の音声信号強調技術は、短時間SNR
の大きな変動がある音声信号に対して副作用として発生
してしまう歪を持たせずに充分雑音を除去することは困
難である。
低減方法においては、雑音区間検出の技術が用いられ、
入力レベルやパワー等を所定の閾値で比較することによ
り、雑音区間判別を行っているが、音声にトラッキング
することを防ぐために閾値の時定数を大きくすると、ノ
イズレベルが変化するとき、特に増加するときに追従で
きなくなり、誤判別が生じ易くなる。
するために、特願平6−99869号において、音声信
号の雑音低減方法を提案している。
信号に基づいて算出された信号レベルと雑音レベルとの
比いわゆるSN比及び音声存在確率に基づいて、音声成
分を算出するための最尤フィルタを適応的に制御するこ
とで雑音抑圧を行う音声信号の雑音低減方法であって、
上記音声存在確率の算出に、入力信号のスペクトルから
推定雑音スペクトルを減算したものを用いることを特徴
とするものである。
ば、上記最尤フィルタが上記入力音声信号のSN比に応
じて最適の抑圧フィルタに調整されるため、上記入力音
声信号に対して充分な雑音除去を行うことが可能であ
る。
に、複雑な演算を有すると共に、膨大な演算量が要求さ
れるため、演算の簡略化が望まれる。
の入力音声信号のバックグランドノイズ中に存在する子
音が抑圧され易いため、子音成分を抑圧しないような改
善が望まれる。
なされたものであり、入力信号の雑音抑圧を行うのに演
算を簡略化すると共に、入力信号中の子音部分の抑圧を
抑えることが可能である音声信号の雑音低減方法及びこ
の音声信号の雑音低減方法が適用される音声信号の雑音
低減装置を提供することを目的とする。
雑音低減方法は、上述した問題を解決するために、入力
音声信号から雑音除去することで雑音抑圧を行う音声信
号の雑音低減方法であって、上記入力音声信号に含まれ
る子音部分を検出する工程と、上記子音部分を検出する
工程にて得られる子音検出結果に応じて、上記入力音声
信号から雑音を除去する際の雑音低減量を抑える制御を
行う工程とを有するものである。
方法において、上記入力音声信号を周波数軸の信号に変
換する変換工程を設けて、上記雑音低減量を抑える制御
を行う工程は、上記変換工程にて得られる入力信号スペ
クトルに基づいて設定されるフィルタ特性を、上記子音
部分を検出する工程にて得られる子音検出結果に応じて
可変制御する工程であるものである。
低減方法において、上記子音部分を検出する工程は、上
記入力音声信号の短区間でのエネルギの変化と、上記入
力音声信号の周波数成分の分布を示す値と、上記入力音
声信号中のゼロクロスの数との少なくとも1つを用い
て、上記入力音声信号中において検出される音声信号部
分の近傍で子音検出を行う工程であるものである。
音低減方法において、上記入力音声信号の周波数成分の
分布を示す値は、高域における入力音声信号のスペクト
ルの平均レベルと、低域における入力音声信号のスペク
トルの平均レベルとの比に基づいて求められる値として
いる。
低減方法において、上記フィルタ特性は、上記変換工程
にて得られる入力信号スペクトルと、上記入力信号スペ
クトル中に含まれる推定雑音スペクトルとの比に基づい
て求められる第一の値と、上記入力信号スペクトルの信
号レベルと推定雑音レベルとの比の最大値、推定雑音レ
ベル及び子音検出結果を示す子音効果因子に基づいて求
められる第二の値とで制御されるものとしている。
置は、入力音声信号から雑音除去することで雑音抑圧を
行うと共に、雑音低減量が制御信号に応じて可変である
雑音低減処理部と、上記入力音声信号に含まれる子音部
分を検出する子音部分検出手段と、上記子音部分検出手
段にて得られる子音検出結果に応じて上記雑音低減量を
抑える制御を行う制御手段とを有して成るものである。
装置において、上記入力音声信号を周波数軸の信号に変
換する変換手段を設けて、上記子音部分検出手段は、上
記変換手段にて得られる入力信号スペクトルから子音検
出を行うものである。
低減装置において、上記制御手段は、上記雑音低減量を
決定するフィルタ特性を、上記子音検出結果に応じて可
変制御するものである。
音低減装置において、上記フィルタ特性は、上記入力信
号スペクトルと、上記入力信号スペクトル中に含まれる
推定雑音スペクトルとの比に基づいて求められる第一の
値と、上記入力信号スペクトルの信号レベルと推定雑音
レベルとの比の最大値、推定雑音レベル及び子音検出結
果を示す子音効果因子に基づいて求められる第二の値と
で制御されるものである。
低減装置において、上記子音部分検出手段は、上記入力
音声信号の短区間でのエネルギの変化と、上記入力音声
信号の周波数成分の分布を示す値と、上記入力音声信号
中のゼロクロスの数との少なくとも1つを用いて、上記
入力音声信号中において検出される音声信号部分の近傍
で子音検出を行うものである。
低減装置において、上記入力音声信号の周波数成分の分
布を示す値は、高域における入力音声信号のスペクトル
の平均レベルと、低域における入力音声信号のスペクト
ルの平均レベルとの比に基づいて求められるものであ
る。
力音声信号から子音部分を検出し、この子音が検出され
たところで雑音低減量を抑えるように、上記入力音声信
号から雑音を除去して雑音抑圧を行うため、雑音抑圧を
行う際に子音部分をも除去することが回避される。
て、変換工程を設ける場合、上記変換工程にて上記入力
音声信号が周波数軸の信号に変換され、上記子音部分の
検出が上記周波数軸の信号毎に行われ、この子音検出結
果に応じて、各周波数軸の信号に対してフィルタ特性が
設定され、このフィルタ特性に応じて雑音抑圧が行われ
る。
出は、上記入力音声信号の短区間でのエネルギの変化
と、上記入力音声信号の周波数成分の分布を示す値と、
上記入力音声信号中のゼロクロスの数とを算出して、こ
れら値の少なくとも1つを用いて、上記入力音声信号中
の音声信号部分の近傍で行われる。
号の周波数成分の分布を示す値は、上記入力音声信号の
高域における平均レベルと、上記入力音声信号の低域に
おける平均レベルとの比をとることで算出される。
を制御するための第一の値は、上記変換工程にて上記入
力音声信号から得られる入力信号スペクトルと、この入
力信号スペクトル中に含まれる雑音推定スペクトルとの
比に基づいて算出される値であると共に、上記フィルタ
特性の初期値を設定する。また、上記フィルタ特性を制
御するための第二の値は、上記入力信号スペクトルの信
号レベルと推定雑音レベルとの比の最大値いわゆる推定
最大SN比、推定雑音レベル及び子音検出結果を示す子
音効果因子に基づいて算出される値であると共に、上記
フィルタ処理による最大雑音低減量を略線形的に変化さ
せるように上記フィルタ特性を可変制御する。
よれば、雑音低減処理部にてなされる雑音抑圧の雑音低
減量が、制御手段にて、子音部分検出手段にて検出され
る入力音声信号の子音部分に基づいて、例えば子音部分
が検出されるとこの雑音低減量が抑えられるように可変
制御される。
合、この変換手段にて上記入力音声信号が周波数軸に変
換され、上記子音部分検出手段にて、この周波数軸の信
号毎に子音部分が検出される。
上記雑音低減量を決定するフィルタ特性を可変制御する
ことで、この雑音低減量は子音検出結果に応じて抑えら
れる。
を制御するための第一の値は、上記変換工程にて得られ
る入力信号スペクトルと、この入力信号スペクトル中に
含まれる雑音推定スペクトルとの比に基づいて算出され
る値であると共に、上記フィルタ特性の初期値を設定す
る。また、上記フィルタ特性を制御するための第二の値
は、上記入力信号スペクトルの推定最大SN比、推定雑
音レベル及び子音検出結果を示す子音効果因子に基づい
て算出される値であると共に、上記フィルタ処理による
最大雑音低減量を略線形的に変化させるように上記フィ
ルタ特性を可変制御する。
は、上記入力音声信号中の音声信号部分に変化が見られ
る部分を、上記入力音声信号の短区間でのエネルギの変
化と、上記入力音声信号の周波数成分の分布を示す値
と、上記入力音声信号中のゼロクロスの数との少なくと
も1つを用いて検出して、この部分の近傍で行われる。
号の周波数成分の分布を示す値は、上記入力音声信号の
高域における平均レベルと、上記入力音声信号の低域に
おける平均レベルとの比をとることで算出される。
及び装置について、図面を参照しながら詳細に説明す
る。
を適用した音声信号の雑音低減装置の一例を図1に示
す。
信号から雑音除去することで雑音抑圧を行うと共に、雑
音低減量が制御信号に応じて可変である雑音低減処理部
としてのスペクトラム修正部10と、上記入力音声信号
に含まれる子音部分を検出する子音部分検出手段である
子音検出部41と、上記子音部分検出手段にて得られる
子音検出結果に応じて上記雑音低減量を抑える制御を行
う制御手段としてのHn値計算部7とを有して成るもの
である。
上記入力音声信号を周波数軸の信号に変換する変換手段
としての高速フーリエ変換処理部3を有している。
声信号入力端子13から入力される入力音声信号y
[t]は、フレーム化処理部1に送られる。このフレー
ム化処理部1からの出力であるフレーム化信号y−fr
amej,k は、窓かけ処理部2、雑音推定部5内の自乗
平均値の平方根(RMS:root mean square)計算部2
1及びフィルタ処理部8に送られる。
エ変換処理部3に送られる。また、高速フーリエ変換処
理部3からの出力は、スペクトル修正部10に送られる
他、バンド分割部4にも送られる。
トル修正部10、上記雑音推定部5内の雑音スペクトル
推定部26、Hn値計算部7及び子音検出部41内のゼ
ロクロス検出部42とトーン検出部43とに送られる。
また、スペクトル修正部10からの出力は、逆高速フー
リエ変換処理部11及びオーバーラップ加算部12を介
して、音声信号出力端子14に送られる。
は、相対エネルギ計算部22、最大RMS計算部23、
推定雑音レベル計算部24、雑音スペクトル推定部26
及び子音検出部41内の音声近接フレーム検出部44と
子音成分検出部45とに送られる。さらに、上記最大R
MS計算部23からの出力は、推定雑音レベル計算部2
4及び最大SN比計算部25に送られる。また、相対エ
ネルギ計算部22からの出力は、上記雑音スペクトル推
定部26に送られる。推定雑音レベル計算部24からの
出力は、フィルタ処理部8、最大SN比計算部25、雑
音スペクトル推定部26及びNR値計算部6に送られ
る。また、最大SN比計算部25からの出力は、NR値
計算部6及び上記雑音スペクトル推定部26に送られ
る。また、雑音スペクトル推定部26からの出力は、H
n値計算部7に送られる。
NR値計算部6に送られる他、NR2値計算部46にも
送られる。
は、上記音声近接フレーム検出部44及び上記子音成分
検出部45に送られる。トーン検出部43からの出力
は、上記子音成分検出部45に送られる。また、音声近
接フレーム検出部44からの出力は上記子音成分検出部
45に送られる。この子音成分検出部45からの出力
は、上記NR2値計算部46に送られる。
記Hn値計算部7に送られる。
タ処理部8及びバンド変換部9を介して、上記スペクト
ル修正部10に送られる。
の例の動作を説明する。なお、各構成部の動作に該当す
る動作を示す図2のフローチャートのステップ番号は、
括弧内に示される。
h)成分と雑音(Noise )成分とを含む入力音声信号y
[t]が供給されている(ステップS0)。この入力音
声信号y[t]は、例えば標本化周波数がFSのディジ
タル信号であり、フレーム化処理部1に送られて、フレ
ーム長がFLサンプルのフレームに分割され、以下各フ
レーム毎に処理が行われる。このフレームの時間軸方向
の移動量であるフレーム間隔はFIサンプルであり、第
(k+1)フレームは第kフレームからFIサンプル後
に開始されることになる。また、上記周波数やサンプル
数の具体例を挙げると、標本化周波数FSを8000、
または8kHzとするとき、フレーム間隔FIを80サ
ンプルとすると10msに、また、フレーム長FLを1
60サンプルとすると20msに相当することになる。
る、例えば高速フーリエ変換処理部2での計算に先立っ
て、上記フレーム化処理部1より送られる各フレーム化
信号y−framej,k に対して、窓関数winput によ
る窓かけ処理が施される。なお、各フレーム毎の信号処
理の終段での後述する逆高速フーリエ変換処理のあとに
は、出力信号に対して窓関数woutputによる窓かけ処理
が施される。このような各窓関数winput 及びwoutput
の一例を、次の(1)式及び(2)式にそれぞれ示す。
56ポイントの高速フーリエ変換処理が施され(ステッ
プS1)、得られた周波数スペクトル振幅値は、バンド
分割部4により、例えば18バンドに分割される。これ
らの各バンドの周波数レンジの一例を、次の表に示す。
このバンド分割された周波数スペクトルの振幅値は、入
力信号スペクトルの振幅Y[w,k]となり、上述した
ように、各部に出力される。
ムが高域ほど知覚分解能が劣化することに基づいてい
る。各帯域の振幅として、対応する周波数レンジ内の最
大FFT(高速フーリエ変換処理における周波数帯域
の)振幅を用いる。
化信号y−framej,k のノイズが音声(speech)か
ら区別され、ノイズと推定されるフレームが検出される
と共に、推定雑音レベル値と、信号レベルと推定雑音レ
ベルとの比の最大値いわゆる推定最大SN比とがNR値
計算部6に送られている。この雑音区間推定、あるいは
ノイズフレーム検出処理は、例えば3種類の検出処理を
組み合わせている。この雑音区間推定の具体例について
説明する。
毎の信号のRMS値の計算が行われ、出力される。第k
フレームのRMS値であるRMS[k]は、次式で計算
される。
からの減衰エネルギに関連する第kフレームの相対エネ
ルギを示すdBrel[k] が計算され、得られた値が出
力されている。このdB表示の相対エネルギdB
rel[k] は、次の(4)式により計算され、この
(4)式中のエネルギ値E[k]及び減衰エネルギ値E
decay[k] は、それぞれ次の(5)式及び(6)式に
より求められる。
[k])2 と表すことができるが、RMS計算部21で
の上記(3)式の計算の途中で得られる上記(5)式の
値をそのまま相対エネルギ計算部21に送るようにして
もよいことは勿論である。また、上記(6)式において
は、減衰時間(ディケイタイム)を0.65秒とした例
を示している。
ネルギEdecay[k] の具体例を、図3に示す。
雑音レベル値と最大SN比とを見積もるのに必要な最大
RMS値が求められ、出力される。この最大RMS値M
axRMS[k]は、以下の(7)式にて算出される。
(7)式で、θは減衰定数(decay constant)であり、
例えば3.2秒で最大RMS値が1/eだけ減衰するよ
うな値、すなわちθ=0.993769が用いられる。
ラウンドノイズ、あるいは背景雑音のレベルを評価する
のに好適な最小のRMS値が求められ、出力される。こ
の推定雑音レベル値MinRMS[k]は、現時点から
前に5個の局所極小値(local minimum )、すなわち
(8)式を満たす値の内で最小となる値である。
は、音声(Speech)無しの背景雑音、いわゆるバックグ
ラウンドノイズのときに上昇してゆくように設定されて
いる。ノイズレベルが高いときの上昇レートは指数関数
的であるが、低いノイズレベルのときには、より大きな
上昇を得るために固定の上昇レートが用いられる。
レベル値MinRMS[k]及び最大RMS値MaxR
MS[k]の具体例を、図4に示す。
大RMS値及び上記推定雑音レベル値を用いて、以下の
(9)式により最大SN比が推定され、この最大SN比
MaxSNR[k]が算出され、出力されている。
は、相対ノイズレベルを示す0から1までの範囲の正規
化パラメータNR_levelが算出される。このNR
_levelには、以下の関数が用いられる。
を説明する。上記相対エネルギ計算部22、推定雑音レ
ベル計算部24及び最大SN比計算部25において算出
した値は、音声(speech)を背景雑音(background noi
se)から区別するために用いられる。次の条件が正しい
とき、第kフレーム中の信号は背景雑音として分類され
る。こうして分類された背景雑音が示す振幅値は、ノイ
ズスペクトルの時間平均推定値N[w,k]として算出
され、出力される。
示の相対エネルギdBrel[k] と、最大SN比Max
SNR[k]と、雑音判別の閾値の1つであるdBth
resrel[k]との具体例を示している。
NR[k]の関数としてのNR_level[k]を示
している。
として分類される場合、上記ノイズスペクトルの時間平
均推定値N[w,k]は、現在フレームの信号の入力信
号スペクトルの振幅Y[w,k]によって、次の(1
2)式のように更新される。なお、wは上記バンド分割
のバンド番号を示すものである。
して分類された場合、N[w,k]はN[w,k−1]
の値をそのまま用いる。
が変化することを回避するために用いる値であるNR
[w,k]を計算し、得られたNR[w,k]値が出力
される。このNR[w,k]は、0から1の大きさの値
であり、(13)式にて定義される値である。
は、後述する効果を考慮したパラメータであって、(1
4)式にて定義される。
は、全ての帯域において、高いSN比における後述する
フィルタ処理による雑音抑圧動作を抑える効果を有する
値であり、以下の(15)式にて定義される。
非常に低いノイズレベルや非常に高いノイズレベルに対
して、上記フィルタ処理による雑音抑圧レートを抑える
効果を有する値であり、以下の(16)式にて定義され
る。
は、2375Hzから4000Hzの間での18dBか
ら15dBへの最大雑音低減量を抑える効果を有する値
であり、以下の(17)式にて定義される。
と、最大雑音低減量(dB)との関係は、図7に示すよ
うに、例えばdB領域において略線形であることがわか
る。
上記入力信号スペクトルの振幅Y[w,k]からフレー
ム毎に子音成分が検出され、この子音検出結果として子
音効果を示す値CE[k]が計算され、得られたCE
[k]が出力される。この子音検出処理の具体例につい
て説明する。
k]中の連続するサンプル間で符号が、例えば正から
負、あるいは負から正というように逆転する箇所、また
は、逆の符号を有するサンプル間で0という値を有する
サンプルが存在する箇所がゼロクロスとして検出される
(ステップS3)。このゼロクロスの数が、フレーム毎
に検出され、この値がゼロクロス数ZC[k]として出
力される。
上記Y[w,k]の周波数成分の分布を表す値、例え
ば、図8に示すように、高域における上記入力信号スペ
クトルの平均レベルt′と低域における上記入力信号ス
ペクトルの平均レベルb′との比t′/b´(=ton
e[k])が検出され(ステップS2)、出力される。
この値t′及び値b´は、以下の(18)式にて定義さ
れる誤差関数ERR(fc,b,t)が最小値をとるよ
うな値t及び値bである。(18)式において、NBは
バンド数を表し、Ymax [w,k]はバンドwにおける
Y[w,k]の最大値を表し、fcは高域と低域とを分
離する点を表す。また、図8において、周波数fcにお
いて、低域側のY[w,k]の平均値を値bとして、ま
た、高域側のY[w,k]の平均値を値tとしている。
値及びゼロクロス数に基づいて、有声音声が検出された
フレームの近傍のフレーム、すなわち音声近接フレーム
が検出され(ステップS4)、このフレーム数として音
節近接フレーム数spch_prox[k]が、以下の
(19)式に基づいて得られ、出力される。
音声近接フレーム数、トーン及びRMS値に基づいて、
各フレームのY[w,k]中の子音成分の検出が行われ
る(ステップS5)。この子音検出結果は、子音効果を
示す値CE[k]として出力される。なお、この値CE
[k]は、以下の(20)式にて定義される。
4.1乃至C4.7は、以下の表にて定義される。
CDS2、T、Zlow及びZhighの各値は、子音
検出の感度を決定する定数であり、例えばCDS0=C
DS1=CDS2=1.41、T=20、Zlow=2
0、Zhigh=75の値をとる。また、(20)式の
Eは、0から1までの値をとるもので、0に近いほど通
常の子音抑圧量に近くなるように後述するフィルタ応答
が調整され、また、1に近いほど子音抑圧量が最低量と
なるように上記フィルタ応答が調整され、例えば0.7
である。
おいて、シンボルC1が成立することは上記フレームの
信号レベルが最低ノイズレベルより大きいことを示し、
シンボルC2が成立することは上記フレームのゼロクロ
ス数が所定のゼロクロス数Zlow、本実施例では20
より大きいことを示し、また、シンボルC3が成立する
ことは上記フレームが有声音声が検出されたフレームよ
りTフレーム以内、本実施例では20フレーム以内であ
ることを示している。
上記フレームにおいて信号レベルが変化することを示
し、シンボルC4.2が成立することは上記フレームが
音声信号が変化して1フレーム後であって信号レベルが
変化するフレームであることを示し、また、シンボルC
4.3が成立することは上記フレームが音声信号が変化
して2フレーム後であって信号レベルが変化するフレー
ムであることを示している。また、シンボルC4.4が
成立することは、上記フレームにおいて、ゼロクロス数
が所定のゼロクロス数Zhigh、本実施例では75よ
り大きいことを示している。また、シンボルC4.5が
成立することは上記フレームにおいてトーン値が変化す
ることを示し、シンボルC4.6が成立することは上記
フレームが音声信号が変化して1フレーム後であってト
ーン値が変化するフレームであることを示し、シンボル
C4.7が成立することは上記フレームが音声信号が変
化して2フレーム後であってトーン値が変化するフレー
ムであることを示している。
が子音成分を含んでいることの条件は、上述のシンボル
C1乃至C3の条件を満たすこと、tone[k]が
0.6より大きいこと及び上述のC4.1乃至C4.7
の条件の内の少なくとも1つが満たされることである。
では、上記値NR[w,k]及び上記子音効果を示す値
CE[k]から、以下の(21)式に基づいて、NR2
[w,k]が得られ、このNR2[w,k]が出力され
る。
ルの振幅Y[w,k]と、ノイズスペクトルの時間平均
推定値N[w,k]と、上記NR2[w,k]とから、
上記バンド分割された入力信号スペクトルの振幅Y
[w,k]から雑音成分を低減するためのプレフィルタ
である。ここでは、Y[w,k]がN[w,k]に応じ
てHn[w,k]に変換され、このフィルタ応答Hn
[w,k]が出力される。なお、このHn[w,k]値
は、以下の(22)式に基づいて算出される。
/N=r]は、SN比をある値r、例えば2.7に固定
したとき最適なノイズ抑圧フィルタ特性に当たり、(2
3)式にて求められる値である。また、この値は、予め
求めることができて、Y[w,k]/N[w,k]の値
に応じてテーブル化することが可能な値である。なお、
(23)式中のx[w,k]はY[w,k]/N[w,
k]に相当し、GminはH[w][S/N=r]の最
小利得を示すパラメータであり、例えば−18dBの値
をとる。また、P(H1|Yw)[S/N=r]及びP
(H0|Yw)[S/N=r]は、各入力信号スペクト
ルの振幅Y[w,k]の状態を示すパラメータであり、
P(H1|Yw)[S/N=r]はY[w,k]に音声
(speech)成分と雑音成分とが混在した状態を指すパラ
メータであり、P(H0|Yw)[S/N=r]はY
[w,k]に雑音成分のみが含まれる状態を指すパラメ
ータである。また、これら値は、以下の(24)式にて
算出される。
[S/N=r]及びP(H0|Yw)[S/N=r]は
x[w,k]の関数であることがわかる。また、I
0(2・r・x[w,k])は、ベッセル関数であり、
rとx[w,k]との値に応じて求められる。なお、P
(H1)及びP(H0)は、共に0.5に固定される。
このように、パラメータを単純化することで、演算量を
従来の略5分の1に削減することができる。
[w,k]値が周波数軸方向と時間軸方向とについて円
滑化するフィルタ処理を行い、得られる信号として円滑
化信号Ht_smooth[w,k]が出力される。上記周波数
軸方向へのフィルタ処理は、信号Hn[w,k]の有効
インパルス応答長を短くする効果がある。これにより周
波数領域での乗算によるフィルタの実現に起因する環状
畳み込みによるエリアシングの発生を未然に防いでい
る。また、上記時間軸方向へのフィルタ処理は、突発的
な雑音を抑えるフィルタの変化の速さを制限する効果が
ある。
についての説明を行う。上記各バンドのHn[w,k]
に、メディアン(中央値)フィルタ処理が施される。次
の(25)式及び(26)式にて、この方法を示す。
は、H1[w,k]=Hn[w,k] Step2:H2[w,k]=min(median(H1[w-1,k],H1[w,k],H1[w+1,k]) ,H1[w,k]) ・・・(26) 但し、(w−1)、又は(w+1)が存在しないとき
は、H2[w,k]=H1[w,k] 第1段階(Step1 )において、H1[w,k]は、単一
の、あるいは孤立した0のバンドを無くしたHn[w,
k]であり、第2段階(Step2 )において、H2[w,
k]は、単一の、あるいは孤立した突出したバンドを無
くしたH1[w,k]である。このようにして、上記H
n[w,k]は、H2[w,k]に変換される。
ついての説明を行う。この時間軸方向へのフィルタ処理
を施す際において、入力信号には、音声(speech)、バ
ックグラウンドノイズ、そして音声(speech)の立ち上
がり部分である過度的状態の3種あることを考慮に入れ
る。音声の信号Hspeech[w,k]に対しては、次の
(27)式に示すように、時間軸での円滑化、あるいは
スムージングを行う。
すような時間軸での円滑化、あるいはスムージングを行
う。
それぞれ、 Min_H=min(H2[w,k],H2[w,k-1]) Max_H=max(H2[w,k],H2[w,k-1]) にて求められる。
時間軸でのスムージングを行われない。
用いて、(29)式により円滑化出力信号H
t_smooth[w,k]を得る。
trは次の(31)式からそれぞれ求められる。
理部8からの、例えば18バンド分の円滑化信号H
t_smooth[w,k]が、例えば128バンド分の信号H
128 [w,k]に、補間処理により拡張変換され、この
変換された信号H128 [w,k]が出力される。この変
換は、例えば2段階で行っており、18バンドから64
バンドへの拡張はゼロ次ホールドにより、64バンドか
ら128バンドへの拡張はローパスフィルタ型の補間処
理により、それぞれ行っている。
フーリエ変換処理部3で得られたフレーム化信号y−f
ramej,k の高速フーリエ変換処理にて得られるFF
T係数の実部と虚部とに各々上記信号H128 [w,k]
を乗じてスペクトラム修正、すなわち雑音成分を低減す
る処理が行われ、得られた信号が出力される。この結
果、スペクトルの振幅は修正されるが位相は変形を受け
ない。
スペクトラム修正部10にて得られた信号を用いて、逆
高速フーリエ変換処理が行われ、得られたIFFT信号
が出力される。
フレーム毎のIFFT信号のフレーム境界部分について
の重ね合わせが行われ、得られた出力音声信号が音声信
号出力端子14より出力される。
適用した音声信号の雑音低減装置の他の例を図9に示
す。なお、図1に示した音声信号の雑音低減装置の構成
と共通する構成部分については、これら構成部分を図1
と同一の番号で示し、動作説明を省略する。
信号から雑音除去することで雑音抑圧を行うと共に、雑
音低減量が制御信号に応じて可変である雑音低減処理部
としてのスペクトラム修正部10と、上記入力音声信号
に含まれる子音部分を検出する子音部分検出手段として
のCE値、adj1、adj2、adj3計算部32
と、上記子音部分検出手段にて得られる子音検出結果に
応じて上記雑音低減量を抑える制御を行う制御手段とし
てのHn値計算部7とを有して成るものである。
上記入力音声信号を周波数軸の信号に変換する変換手段
としての高速フーリエ変換処理部3を有している。
値、adj1、adj2、adj3計算部32とを有し
て成る雑音抑圧フィルタ特性生成部35において、バン
ド分割部4は、高速フーリエ変換処理部3から出力され
る入力音声信号を高速フーリエ変換処理して得られる周
波数スペクトルの振幅値を、例えば18バンドに分割し
て、バンド毎の振幅Y[w,k]を、信号特性計算部3
1と雑音スペクトル推定部26と初期フィルタ応答計算
部33とに出力する。
処理部1にて出力されるy−framej,k とバンド分
割部4にて出力されるY[w,k]とからフレーム毎の
RMS値RMS[k]、推定雑音レベル値MinRMS
[k]、最大RMS値MaxRMS[k]、ゼロクロス
数ZC[k]、トーン値tone[k]、音声近接フレ
ーム数spch_prox[k]を算出し、これら値を
雑音スペクトル推定部26及びCE値、adj1、ad
j2、adj3計算部32に出力する。
j3計算部32は、RMS[k]、MinRMS[k]
及びMaxRMS[k]に基づいて、adj1[k]、
adj2[k]及びadj3[w,k]を算出し、ま
た、ZC[k]、tone[k]、spch_prox
[k]及びMinRMS[k]に基づいて、音声信号に
含まれる子音効果を示す値CE[k]を算出し、これら
値をNR値及びNR2値計算部36に送る。
音スペクトル推定部26から出力される雑音時間平均値
N[w,k]と、バンド分割部4から出力されるY
[w,k]とをフィルタ抑圧曲線テーブル部34に送
り、フィルタ抑圧曲線テーブル部34に収納されるY
[w,k]とN[w,k]とに応じたH[w,k]の値
を探し出し、このH[w,k]をHn値計算部7に出力
する。なお、フィルタ抑圧曲線テーブル部34は、H
[w,k]に関する表が格納されている。
図9に示した音声信号の雑音低減装置にて得られた出力
音声信号は、例えば携帯用電話機の各種エンコーダ回路
や、音声認識装置の信号処理回路等に送られる。あるい
は、携帯用電話機のデコーダ出力信号に本雑音抑圧処理
を施してもよい。
低減装置の効果を説明する図である。縦軸は各フレーム
の信号のRMSレベルを表し、横軸は各フレームのフレ
ーム番号を表す。なお、このフレームは20ms毎に区
切られたものである。
曲線Bで表されている。また、この音声に車内のノイ
ズ、いわゆるカーノイズを足した信号は、曲線Aであ
る。曲線AのRMSレベルの方が、全フレーム番号にお
いて、曲線BのRMSレベルよりも高いか、あるいは等
しいことがわかる。すなわち、全般的にノイズが混在す
る信号の方が、エネルギが高いことがわかる。
音低減装置にて、上記ノイズが混在する信号の雑音を低
減して得られる信号が曲線Cで表され、また、従来の雑
音低減方法を適用した雑音低減装置にて、上記ノイズが
混在する信号の雑音を低減して得られる信号が曲線Dで
表される。
番号が略15のエリアa1と、フレーム番号が略60の
エリアa2と、フレーム番号が略60から略65までの
エリアa3と、フレーム番号が略100から略105ま
でのエリアa4と、フレーム番号が略110のエリアa
5と、フレーム番号が略150から略160までのエリ
アa6と、フレーム番号が略175から略180までの
エリアa7とにおいて、曲線CのRMSレベルの方が、
曲線DのRMSレベルよりも高いことがわかる。すなわ
ち、各エリアa1乃至a7に対応するフレーム番号の信
号において、雑音低減量が抑えられていることがわか
る。
音声信号の雑音低減方法によれば、音声信号中の子音成
分を検出するのに、周波数領域の信号の振幅の分布を示
す数であるtone[k]が先に検出されてから、上記
信号中のゼロクロスが検出されるが、これに限定される
ことはなく、先に上記ゼロクロスが検出されてから上記
tone[k]が検出されても、両方同時に検出されて
もよい。
信号の雑音低減方法によれば、入力音声信号から子音部
分を検出し、この子音が検出されたところで雑音低減量
を抑えるように、上記入力音声信号から雑音を除去して
雑音抑圧を行うため、雑音抑圧を行う際に子音部分をも
除去したり、また、子音部分が歪んだりすることの回避
が可能になる。さらに、簡単な構成にて上記雑音抑圧を
行う際の演算量を削減することが可能になる。
ば、上記入力音声信号を周波数軸に変換することで、上
記入力音声信号に含まれる重要な特徴のみを取り出して
上記雑音抑圧を行う際の演算を行うことが可能になるた
め、この演算量を削減することが可能になる。
よれば、子音部分を検出する工程にて、上記入力音声信
号の短区間でのエネルギの変化と、上記入力音声信号の
周波数成分の分布を示す値と、上記入力音声信号のゼロ
クロスの数とを検出することで、これら値の少なくとも
1つを用いて子音検出を行うことが可能になり、この子
音が検出されたところで雑音低減量を抑えるように、上
記入力音声信号から雑音を除去して雑音抑圧を行うた
め、雑音抑圧を行う際に子音部分をも除去したり、ま
た、子音部分が歪んだりすることの回避が可能になる。
さらに、上記雑音抑圧を行う際の演算量を削減すること
が可能になる。
よれば、第一の値及び子音部分の検出結果に応じた第二
の値を用いて、入力音声信号から雑音を除去するフィル
タ処理のフィルタ特性を制御することで、上記入力音声
信号の最大SN比に応じたフィルタ処理にて上記入力音
声信号から雑音を除去する、特に高いSN比での上記フ
ィルタ処理による音声信号の歪を小さくすることが可能
になり、また、雑音抑圧を行う際に子音部分をも除去し
たり、また、子音部分が歪んだりすることの回避が可能
になる。さらに、上記フィルタ特性を得るための演算量
の削減を図ることが可能になる。
置によれば、入力音声信号から子音部分を検出し、この
子音が検出されたところで雑音低減量を抑えるように、
上記入力音声信号から雑音を除去して雑音抑圧を行うた
め、雑音抑圧を行う際に子音部分をも除去したり、ま
た、子音部分が歪んだりすることの回避が可能になる。
さらに、上記雑音抑圧を行う際の演算量を削減すること
が可能になる。
ば、上記入力音声信号を周波数軸に変換することで、上
記入力音声信号に含まれる重要な特徴のみを取り出して
上記雑音抑圧を行う際の演算を行うことが可能になるた
め、この演算量を削減することが可能になる。
よれば、子音部分を検出する工程にて、上記入力音声信
号の短区間でのエネルギの変化と、上記入力音声信号の
周波数成分の分布を示す値と、上記入力音声信号のゼロ
クロスの数とを検出することで、これら値の少なくとも
1つを用いて子音検出を行うことが可能になり、この子
音が検出されたところで雑音低減量を抑えるように、上
記入力音声信号から雑音を除去して雑音抑圧を行うた
め、雑音抑圧を行う際に子音部分をも除去したり、ま
た、子音部分が歪んだりすることの回避が可能になる。
さらに、上記雑音抑圧を行う際の演算量を削減すること
が可能になる。
よれば、第一の値及び子音部分の検出結果に応じた第二
の値を用いて、入力音声信号から雑音を除去するフィル
タ処理のフィルタ特性を制御することで、上記入力音声
信号の最大SN比に応じたフィルタ処理にて上記入力音
声信号から雑音を除去する、特に高いSN比での上記フ
ィルタ処理による音声信号の歪を小さくすることが可能
になり、また、雑音抑圧を行う際に子音部分をも除去し
たり、また、子音部分が歪んだりすることの回避が可能
になる。さらに、上記フィルタ特性を得るための演算量
の削減を図ることが可能になる。
を示すブロック図である。
フローチャートである。
減衰エネルギEdecay[k] の具体例を示す図である。
[k]、推定雑音レベル値MinRMS[k]及び最大
RMS値MaxRMS[k]の具体例を示す図である。
ギdBrel[k] 、最大SN比MaxSNR[k]、及
び雑音判別の閾値の1つであるdBthresrel
[k]の具体例を示す図である。
R[k]に対して定義される関数としてのNR_lev
el[k]を示すグラフである。
雑音低減量との関係をdB表示で示すグラフである。
周波数領域の分布を示す値を求める方法を説明する図で
ある。
略を示すブロック図である。
Claims (11)
- 【請求項1】 入力音声信号から雑音除去することで雑
音抑圧を行う音声信号の雑音低減方法であって、 上記入力音声信号に含まれる子音部分を検出する工程
と、 上記子音部分を検出する工程にて得られる子音検出結果
に応じて、上記入力音声信号から雑音を除去する際の雑
音低減量を抑える制御を行う工程とを有することを特徴
とする音声信号の雑音低減方法。 - 【請求項2】 上記入力音声信号を周波数軸の信号に変
換する変換工程を設けて、 上記雑音低減量を抑える制御を行う工程は、上記変換工
程にて得られる入力信号スペクトルに基づいて設定され
るフィルタ特性を、上記子音部分を検出する工程にて得
られる子音検出結果に応じて可変制御する工程であるこ
とを特徴とする請求項1記載の音声信号の雑音低減方
法。 - 【請求項3】 上記子音部分を検出する工程は、上記入
力音声信号の短区間でのエネルギの変化と、上記入力音
声信号の周波数成分の分布を示す値と、上記入力音声信
号中のゼロクロスの数との少なくとも1つを用いて、上
記入力音声信号中において検出される音声信号部分の近
傍で子音検出を行う工程であることを特徴とする請求項
1または2記載の音声信号の雑音低減方法。 - 【請求項4】 上記入力音声信号の周波数成分の分布を
示す値は、高域における入力音声信号のスペクトルの平
均レベルと、低域における入力音声信号のスペクトルの
平均レベルとの比に基づいて求められることを特徴とす
る請求項3記載の音声信号の雑音低減方法。 - 【請求項5】 上記フィルタ特性は、上記変換工程にて
得られる入力信号スペクトルと、上記入力信号スペクト
ル中に含まれる推定雑音スペクトルとの比に基づいて求
められる第一の値と、上記入力信号スペクトルの信号レ
ベルと推定雑音レベルとの比の最大値、推定雑音レベル
及び子音検出結果を示す子音効果因子に基づいて求めら
れる第二の値とで制御されることを特徴とする請求項2
記載の音声信号の雑音低減方法。 - 【請求項6】 入力音声信号から雑音除去することで雑
音抑圧を行うと共に、雑音低減量が制御信号に応じて可
変である雑音低減処理部と、 上記入力音声信号に含まれる子音部分を検出する子音部
分検出手段と、 上記子音部分検出手段にて得られる子音検出結果に応じ
て上記雑音低減量を抑える制御を行う制御手段とを有し
て成ることを特徴とする音声信号の雑音低減装置。 - 【請求項7】 上記入力音声信号を周波数軸の信号に変
換する変換手段を設けて、 上記子音部分検出手段は、上記変換手段にて得られる入
力信号スペクトルから子音検出を行うことを特徴とする
請求項6記載の音声信号の雑音低減装置。 - 【請求項8】 上記制御手段は、上記雑音低減量を決定
するフィルタ特性を、上記子音検出結果に応じて可変制
御することを特徴とする請求項6または7記載の音声信
号の雑音低減装置。 - 【請求項9】 上記フィルタ特性は、上記入力信号スペ
クトルと、上記入力信号スペクトル中に含まれる推定雑
音スペクトルとの比に基づいて求められる第一の値と、
上記入力信号スペクトルの信号レベルと推定雑音レベル
との比の最大値、推定雑音レベル及び子音検出結果を示
す子音効果因子に基づいて求められる第二の値とで制御
されることを特徴とする請求項8記載の音声信号の雑音
低減装置。 - 【請求項10】 上記子音部分検出手段は、上記入力音
声信号の短区間でのエネルギの変化と、上記入力音声信
号の周波数成分の分布を示す値と、上記入力音声信号中
のゼロクロスの数との少なくとも1つを用いて、上記入
力音声信号中において検出される音声信号部分の近傍で
子音検出を行うことを特徴とする請求項6または7記載
の音声信号の雑音低減装置。 - 【請求項11】 上記入力音声信号の周波数成分の分布
を示す値は、高域における入力音声信号のスペクトルの
平均レベルと、低域における入力音声信号のスペクトル
の平均レベルとの比に基づいて求められることを特徴と
する請求項10記載の音声信号の雑音低減装置。
Priority Applications (17)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02933795A JP3453898B2 (ja) | 1995-02-17 | 1995-02-17 | 音声信号の雑音低減方法及び装置 |
US08/600,226 US5752226A (en) | 1995-02-17 | 1996-02-12 | Method and apparatus for reducing noise in speech signal |
AU44445/96A AU695585B2 (en) | 1995-02-17 | 1996-02-12 | Method and apparatus for reducing noise in speech signal |
CA002169422A CA2169422C (en) | 1995-02-17 | 1996-02-13 | Method and apparatus for reducing noise in speech signal |
SG1996001463A SG52257A1 (en) | 1995-02-17 | 1996-02-13 | Method and apparatus for reducing noise in speech signal |
MYPI96000628A MY114695A (en) | 1995-02-17 | 1996-02-16 | Method and apparatus for reducing noise in speech signal |
KR1019960003843A KR100394759B1 (ko) | 1995-02-17 | 1996-02-16 | 음성신호에서노이즈를저감시키는방법과장치 |
TR96/00131A TR199600131A2 (tr) | 1995-02-17 | 1996-02-16 | Konusma seslerindeki gürültüleri azaltan yöntem ve cihaz. |
PL96312846A PL312846A1 (en) | 1995-02-17 | 1996-02-16 | Method of and apparatus for reducing interference in voice signals |
RU96102854/09A RU2121719C1 (ru) | 1995-02-17 | 1996-02-16 | Способ и устройство ослабления шума в речевом сигнале |
BR9600762A BR9600762A (pt) | 1995-02-17 | 1996-02-16 | Processo e aparelho para reduzir o ruído em si em um sinal de voz de entrada |
ES96301058T ES2158992T3 (es) | 1995-02-17 | 1996-02-16 | Metodo y aparato para reducir el ruido en una señal de voz. |
EP96301058A EP0727768B1 (en) | 1995-02-17 | 1996-02-16 | Method of and apparatus for reducing noise in speech signal |
AT96301058T ATE201276T1 (de) | 1995-02-17 | 1996-02-16 | Verfahren und vorrichtung zur verminderung von rauschen bei sprachsignalen |
DE69612770T DE69612770T2 (de) | 1995-02-17 | 1996-02-16 | Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen |
CN96105920A CN1083183C (zh) | 1995-02-17 | 1996-02-17 | 用来降低语音信号中噪声的方法和装置 |
TW085105682A TW291556B (ja) | 1995-02-17 | 1996-05-14 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02933795A JP3453898B2 (ja) | 1995-02-17 | 1995-02-17 | 音声信号の雑音低減方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08221094A true JPH08221094A (ja) | 1996-08-30 |
JP3453898B2 JP3453898B2 (ja) | 2003-10-06 |
Family
ID=12273430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02933795A Expired - Lifetime JP3453898B2 (ja) | 1995-02-17 | 1995-02-17 | 音声信号の雑音低減方法及び装置 |
Country Status (17)
Country | Link |
---|---|
US (1) | US5752226A (ja) |
EP (1) | EP0727768B1 (ja) |
JP (1) | JP3453898B2 (ja) |
KR (1) | KR100394759B1 (ja) |
CN (1) | CN1083183C (ja) |
AT (1) | ATE201276T1 (ja) |
AU (1) | AU695585B2 (ja) |
BR (1) | BR9600762A (ja) |
CA (1) | CA2169422C (ja) |
DE (1) | DE69612770T2 (ja) |
ES (1) | ES2158992T3 (ja) |
MY (1) | MY114695A (ja) |
PL (1) | PL312846A1 (ja) |
RU (1) | RU2121719C1 (ja) |
SG (1) | SG52257A1 (ja) |
TR (1) | TR199600131A2 (ja) |
TW (1) | TW291556B (ja) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100250561B1 (ko) * | 1996-08-29 | 2000-04-01 | 니시무로 타이죠 | 잡음소거기 및 이 잡음소거기를 사용한 통신장치 |
TW384434B (en) * | 1997-03-31 | 2000-03-11 | Sony Corp | Encoding method, device therefor, decoding method, device therefor and recording medium |
FR2765715B1 (fr) * | 1997-07-04 | 1999-09-17 | Sextant Avionique | Procede de recherche d'un modele de bruit dans des signaux sonores bruites |
US6327564B1 (en) * | 1999-03-05 | 2001-12-04 | Matsushita Electric Corporation Of America | Speech detection using stochastic confidence measures on the frequency spectrum |
US7706525B2 (en) * | 2001-10-01 | 2010-04-27 | Kyocera Wireless Corp. | Systems and methods for side-tone noise suppression |
US7096184B1 (en) * | 2001-12-18 | 2006-08-22 | The United States Of America As Represented By The Secretary Of The Army | Calibrating audiometry stimuli |
US7149684B1 (en) | 2001-12-18 | 2006-12-12 | The United States Of America As Represented By The Secretary Of The Army | Determining speech reception threshold |
US7016651B1 (en) * | 2002-12-17 | 2006-03-21 | Marvell International Ltd. | Apparatus and method for measuring signal quality of a wireless communications link |
US7895036B2 (en) * | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US7725315B2 (en) * | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US7885420B2 (en) * | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8073689B2 (en) * | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7499686B2 (en) * | 2004-02-24 | 2009-03-03 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement on a mobile device |
CN101091412B (zh) * | 2004-09-07 | 2012-12-26 | 森塞尔有限公司 | 用于声音增强的装置和方法 |
US8509703B2 (en) * | 2004-12-22 | 2013-08-13 | Broadcom Corporation | Wireless telephone with multiple microphones and multiple description transmission |
US20060133621A1 (en) * | 2004-12-22 | 2006-06-22 | Broadcom Corporation | Wireless telephone having multiple microphones |
US7983720B2 (en) * | 2004-12-22 | 2011-07-19 | Broadcom Corporation | Wireless telephone with adaptive microphone array |
US20070116300A1 (en) * | 2004-12-22 | 2007-05-24 | Broadcom Corporation | Channel decoding for wireless telephones with multiple microphones and multiple description transmission |
KR100657948B1 (ko) * | 2005-02-03 | 2006-12-14 | 삼성전자주식회사 | 음성향상장치 및 방법 |
KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
WO2009025142A1 (ja) * | 2007-08-22 | 2009-02-26 | Nec Corporation | 話者速度変換システムおよびその方法ならびに速度変換装置 |
US8428661B2 (en) * | 2007-10-30 | 2013-04-23 | Broadcom Corporation | Speech intelligibility in telephones with multiple microphones |
KR101460059B1 (ko) | 2007-12-17 | 2014-11-12 | 삼성전자주식회사 | 잡음 검출 방법 및 장치 |
US9575715B2 (en) * | 2008-05-16 | 2017-02-21 | Adobe Systems Incorporated | Leveling audio signals |
GB2466668A (en) * | 2009-01-06 | 2010-07-07 | Skype Ltd | Speech filtering |
CN101859568B (zh) * | 2009-04-10 | 2012-05-30 | 比亚迪股份有限公司 | 一种语音背景噪声的消除方法和装置 |
FR2948484B1 (fr) * | 2009-07-23 | 2011-07-29 | Parrot | Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile |
TWI413112B (zh) * | 2010-09-06 | 2013-10-21 | Byd Co Ltd | Method and apparatus for eliminating noise background noise (1) |
KR101247652B1 (ko) * | 2011-08-30 | 2013-04-01 | 광주과학기술원 | 잡음 제거 장치 및 방법 |
KR101491911B1 (ko) | 2013-06-27 | 2015-02-12 | 고려대학교 산학협력단 | 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템 |
CN104036777A (zh) * | 2014-05-22 | 2014-09-10 | 哈尔滨理工大学 | 一种语音活动检测方法及装置 |
RU2580796C1 (ru) * | 2015-03-02 | 2016-04-10 | Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) | Способ (варианты) фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки |
TWI662544B (zh) * | 2018-05-28 | 2019-06-11 | 塞席爾商元鼎音訊股份有限公司 | 偵測環境噪音以改變播放語音頻率之方法及其聲音播放裝置 |
CN110570875A (zh) * | 2018-06-05 | 2019-12-13 | 塞舌尔商元鼎音讯股份有限公司 | 检测环境噪音以改变播放语音频率的方法及声音播放装置 |
TWI662545B (zh) * | 2018-06-22 | 2019-06-11 | 塞席爾商元鼎音訊股份有限公司 | 調整語音頻率之方法及其聲音播放裝置 |
CN112201272A (zh) * | 2020-09-29 | 2021-01-08 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频数据降噪的方法、装置、设备及存储介质 |
CN114724571B (zh) * | 2022-03-29 | 2024-05-03 | 大连理工大学 | 一种鲁棒的分布式说话人噪声消除系统 |
CN114511474B (zh) * | 2022-04-20 | 2022-07-05 | 天津恒宇医疗科技有限公司 | 血管内超声图像的降噪方法、系统、电子设备及存储介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
IL84948A0 (en) * | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
US5175793A (en) * | 1989-02-01 | 1992-12-29 | Sharp Kabushiki Kaisha | Recognition apparatus using articulation positions for recognizing a voice |
GB2239971B (en) * | 1989-12-06 | 1993-09-29 | Ca Nat Research Council | System for separating speech from background noise |
JP2959792B2 (ja) * | 1990-02-13 | 1999-10-06 | 松下電器産業株式会社 | 音声信号処理装置 |
DE69121312T2 (de) * | 1990-05-28 | 1997-01-02 | Matsushita Electric Ind Co Ltd | Geräuschsignalvorhersagevorrichtung |
JPH087596B2 (ja) * | 1990-07-26 | 1996-01-29 | 国際電気株式会社 | 雑音抑圧型音声検出器 |
JPH04235600A (ja) * | 1991-01-11 | 1992-08-24 | Clarion Co Ltd | 適応型フィルタを用いた雑音除去装置 |
FR2679690B1 (fr) * | 1991-07-23 | 1996-10-25 | Thomson Csf | Procede et dispositif de reconnaissance de la parole en temps reel. |
JP3010864B2 (ja) * | 1991-12-12 | 2000-02-21 | 松下電器産業株式会社 | 雑音抑圧装置 |
JPH05259928A (ja) * | 1992-03-09 | 1993-10-08 | Oki Electric Ind Co Ltd | 適応制御ノイズキャンセラ装置及び適応制御ノイズキャンセル方法 |
FR2695750B1 (fr) * | 1992-09-17 | 1994-11-10 | Frank Lefevre | Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif. |
US5432859A (en) * | 1993-02-23 | 1995-07-11 | Novatel Communications Ltd. | Noise-reduction system |
WO1995002288A1 (en) * | 1993-07-07 | 1995-01-19 | Picturetel Corporation | Reduction of background noise for speech enhancement |
IT1272653B (it) * | 1993-09-20 | 1997-06-26 | Alcatel Italia | Metodo di riduzione del rumore, in particolare per riconoscimento automatico del parlato, e filtro atto ad implementare lo stesso |
US5485522A (en) * | 1993-09-29 | 1996-01-16 | Ericsson Ge Mobile Communications, Inc. | System for adaptively reducing noise in speech signals |
DE69420705T2 (de) * | 1993-12-06 | 2000-07-06 | Koninkl Philips Electronics Nv | System und vorrichtung zur rauschunterdrückung sowie mobilfunkgerät |
JP3484757B2 (ja) * | 1994-05-13 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び雑音区間検出方法 |
-
1995
- 1995-02-17 JP JP02933795A patent/JP3453898B2/ja not_active Expired - Lifetime
-
1996
- 1996-02-12 AU AU44445/96A patent/AU695585B2/en not_active Expired
- 1996-02-12 US US08/600,226 patent/US5752226A/en not_active Expired - Lifetime
- 1996-02-13 SG SG1996001463A patent/SG52257A1/en unknown
- 1996-02-13 CA CA002169422A patent/CA2169422C/en not_active Expired - Lifetime
- 1996-02-16 BR BR9600762A patent/BR9600762A/pt not_active IP Right Cessation
- 1996-02-16 PL PL96312846A patent/PL312846A1/xx unknown
- 1996-02-16 EP EP96301058A patent/EP0727768B1/en not_active Expired - Lifetime
- 1996-02-16 RU RU96102854/09A patent/RU2121719C1/ru not_active IP Right Cessation
- 1996-02-16 ES ES96301058T patent/ES2158992T3/es not_active Expired - Lifetime
- 1996-02-16 DE DE69612770T patent/DE69612770T2/de not_active Expired - Lifetime
- 1996-02-16 AT AT96301058T patent/ATE201276T1/de not_active IP Right Cessation
- 1996-02-16 MY MYPI96000628A patent/MY114695A/en unknown
- 1996-02-16 KR KR1019960003843A patent/KR100394759B1/ko not_active IP Right Cessation
- 1996-02-16 TR TR96/00131A patent/TR199600131A2/xx unknown
- 1996-02-17 CN CN96105920A patent/CN1083183C/zh not_active Expired - Lifetime
- 1996-05-14 TW TW085105682A patent/TW291556B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
PL312846A1 (en) | 1996-08-19 |
DE69612770T2 (de) | 2001-11-29 |
KR100394759B1 (ko) | 2004-02-11 |
ATE201276T1 (de) | 2001-06-15 |
CA2169422A1 (en) | 1996-08-18 |
MY114695A (en) | 2002-12-31 |
TW291556B (ja) | 1996-11-21 |
AU4444596A (en) | 1996-08-29 |
ES2158992T3 (es) | 2001-09-16 |
CN1141548A (zh) | 1997-01-29 |
US5752226A (en) | 1998-05-12 |
EP0727768B1 (en) | 2001-05-16 |
EP0727768A1 (en) | 1996-08-21 |
DE69612770D1 (de) | 2001-06-21 |
KR960032293A (ko) | 1996-09-17 |
JP3453898B2 (ja) | 2003-10-06 |
TR199600131A2 (tr) | 1996-10-21 |
BR9600762A (pt) | 1997-12-23 |
SG52257A1 (en) | 1998-09-28 |
CN1083183C (zh) | 2002-04-17 |
CA2169422C (en) | 2005-07-26 |
AU695585B2 (en) | 1998-08-20 |
RU2121719C1 (ru) | 1998-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3453898B2 (ja) | 音声信号の雑音低減方法及び装置 | |
JP3484801B2 (ja) | 音声信号の雑音低減方法及び装置 | |
JP3484757B2 (ja) | 音声信号の雑音低減方法及び雑音区間検出方法 | |
US11056130B2 (en) | Speech enhancement method and apparatus, device and storage medium | |
JP3591068B2 (ja) | 音声信号の雑音低減方法 | |
US6487257B1 (en) | Signal noise reduction by time-domain spectral subtraction using fixed filters | |
WO2008121436A1 (en) | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate | |
CN101142623A (zh) | 用于语音编码和语音识别的噪音抑制器 | |
WO2001031631A1 (en) | Mel-frequency domain based audible noise filter and method | |
JP2000330597A (ja) | 雑音抑圧装置 | |
KR101295727B1 (ko) | 적응적 잡음추정 장치 및 방법 | |
US6507623B1 (en) | Signal noise reduction by time-domain spectral subtraction | |
CN112289337A (zh) | 一种滤除机器学习语音增强后的残留噪声的方法及装置 | |
JP3761497B2 (ja) | 音声認識装置、音声認識方法、および、音声認識プログラム | |
CN112750447A (zh) | 一种去除风噪的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030624 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080725 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090725 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090725 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100725 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100725 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110725 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120725 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130725 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |