JP6361156B2 - 雑音推定装置、方法及びプログラム - Google Patents
雑音推定装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6361156B2 JP6361156B2 JP2014023591A JP2014023591A JP6361156B2 JP 6361156 B2 JP6361156 B2 JP 6361156B2 JP 2014023591 A JP2014023591 A JP 2014023591A JP 2014023591 A JP2014023591 A JP 2014023591A JP 6361156 B2 JP6361156 B2 JP 6361156B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- noise
- power
- posterior
- snr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 63
- 238000009499 grossing Methods 0.000 claims description 46
- 238000009826 distribution Methods 0.000 claims description 41
- 238000004364 calculation method Methods 0.000 claims description 26
- 230000003321 amplification Effects 0.000 claims description 9
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 9
- 230000003111 delayed effect Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 description 56
- 238000012545 processing Methods 0.000 description 21
- 230000001629 suppression Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 12
- 230000014509 gene expression Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 239000006185 dispersion Substances 0.000 description 5
- 238000007476 Maximum Likelihood Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Noise Elimination (AREA)
Description
第1の実施形態及び変形実施形態の説明に先立ち、各実施形態に至った考え方や、各実施形態により本発明の目的である雑音パワーを安定的に推定できる理由を説明する。
以下、本発明による雑音推定装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。
第1の実施形態の雑音推定装置は、異なる帯域入力音声が入力される帯域分割数の帯域雑音推定装置を有する。各帯域雑音推定装置は同様な機能的な構成を有する。ここで、各帯域雑音推定装置若しくは雑音推定装置は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(帯域雑音推定プログラム若しくは雑音推定プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、同様な機能ブロック図で表すことができる。
次に、第1の実施形態の雑音推定装置の動作(雑音推定方法)を説明する。
第1の実施形態によれば、定常な帯域雑音パワーを安定的に推定することができる。仮に、第1の実施形態の雑音推定装置を、雑音抑圧装置(図5及び図6参照)に組み込んだ場合には、強調音声の歪みを小さく抑えることができる。
次に、本発明による雑音推定装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
以上でも、種々の変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
Claims (15)
- 入力音声に含まれる雑音を推定する雑音推定装置において、
入力音声が帯域分割されたそれぞれの帯域入力音声毎に設けられた帯域雑音推定装置を備え、
上記各帯域雑音推定装置が、
帯域入力パワーを算出するパワー算出手段と、
雑音の定常性をモデリングした確率モデルの情報を保持している確率モデル保持手段と、
帯域入力パワーと、当該帯域雑音推定装置から出力される帯域雑音パワー推定値と、保持されている確率モデル情報とに基づいて、帯域雑音パワーの事後確率が最大となるように瞬時帯域雑音パワー推定値を算出する事後確率最大化手段とを具備し、
保持されている上記確率モデル情報は、
予測事後SNRに基づいた事後SNRに関する尤度関数と、
平均事後SNRが確定した条件の下での上記事後SNRの事前確率との情報を含む
ことを特徴とする雑音推定装置。 - 上記各帯域雑音推定装置が、上記瞬時帯域雑音パワー推定値を時間平滑化し、上記帯域雑音パワー推定値を得る平滑化手段をさらに具備することを特徴とする請求項1に記載の雑音推定装置。
- 上記事後SNRは帯域入力パワーを同時刻の帯域雑音パワー推定値で除した値であり、
上記予測事後SNRは帯域入力パワーを所定時間だけ過去の帯域雑音パワー推定値で除した値であり、
上記平均事後SNRは、少なくとも2つ以上の過去の事後SNRから算出される時間平滑化された事後SNRである
ことを特徴とする請求項1又は2に記載の雑音推定装置。 - 上記事後SNRは帯域入力パワーを同時刻の帯域雑音パワー推定値で除した値であり、
上記予測事後SNRは帯域入力パワーを所定時間だけ過去の帯域雑音パワー推定値で除した値であり、
上記平均事後SNRは、1つの所定時間過去の事後SNRである
ことを特徴とする請求項1又は2に記載の雑音推定装置。 - 上記尤度関数は、上記事後SNRと上記予測事後SNRが等しいときに最大となり、上記事後SNRと上記予測事後SNRの差が大きくなるにつれて0に収束することを特徴とする請求項1〜4のいずれかに記載の雑音推定装置。
- 上記尤度関数として正規分布若しくは一般化正規分布を適用していることを特徴とする請求項5に記載の雑音推定装置。
- 上記事前確率は、上記事後SNRが非負に限定されていて、上記事後SNRが0のときに最大となり、上記事後SNRが大きくなるにつれて0に収束することを特徴とする請求項1〜6のいずれかに記載の雑音推定装置。
- 上記事前確率として指数分布を適用していることを特徴とする請求項7に記載の雑音推定装置。
- 上記指数分布の速度パラメータは上記平均事後SNRと負の比例関係若しくは反比例関係にあることを特徴とする請求項8に記載の雑音推定装置。
- 上記事後確率最大化手段は、
上記帯域雑音パワー推定値を遅延させる帯域雑音パワー遅延部と、
上記帯域入力パワーを遅延させる帯域入力パワー遅延部と、
遅延された上記帯域雑音パワー推定値及び上記帯域入力パワーに基づいて、上記事後SNRを算出する事後SNR算出部と、
上記事後SNRを時間平滑化して平均事後SNRを算出する平滑化部と、
上記確率モデル情報と上記平均事後SNRに基づいて雑音増幅係数を決定する係数決定部と、
遅延された上記帯域雑音パワー推定値に上記雑音増幅係数を乗ずる乗算部と、
上記乗算部から出力された帯域雑音パワー暫定推定値と上記帯域入力パワーを比較して小さい方を選択する比較部とを具備する
ことを特徴とする請求項1〜9のいずれかに記載の雑音推定装置。 - 上記事後確率最大化手段は、
上記帯域雑音パワー推定値を遅延させる帯域雑音パワー遅延部と、
上記帯域入力パワーを遅延させる帯域入力パワー遅延部と、
遅延された上記帯域雑音パワー推定値及び上記帯域入力パワーに基づいて、上記事後SNRを算出する事後SNR算出部と、
上記確率モデル情報と上記事後SNRに基づいて雑音増幅係数を決定する係数決定部と、
遅延された上記帯域雑音パワー推定値に上記雑音増幅係数を乗ずる乗算部と、
上記乗算部から出力された帯域雑音パワー暫定推定値と上記帯域入力パワーを比較して小さい方を選択する比較部とを具備する
ことを特徴とする請求項1〜9のいずれかに記載の雑音推定装置。 - 入力音声に含まれる雑音を推定する雑音推定方法において、
入力音声が帯域分割されたそれぞれの帯域入力音声毎に設けられた、パワー算出手段、確率モデル保持手段及び事後確率最大化手段を有する帯域雑音推定装置を備え、
上記各帯域雑音推定装置のパワー算出手段はそれぞれ、帯域入力パワーを算出し、
上記各帯域雑音推定装置の確率モデル保持手段は、雑音の定常性をモデリングした確率モデルの情報であって、予測事後SNRに基づいた事後SNRに関する尤度関数と、平均事後SNRが確定した条件の下での上記事後SNRの事前確率との情報を含む確率モデルの情報を保持し、
上記各帯域雑音推定装置の事後確率最大化手段はそれぞれ、帯域入力パワーと、当該帯域雑音推定装置から出力される帯域雑音パワー推定値と、保持されている確率モデル情報とに基づいて、帯域雑音パワーの事後確率が最大となるように瞬時帯域雑音パワー推定値を算出する
ことを特徴とする雑音推定方法。 - 上記各帯域雑音推定装置にさらに設けられた平滑化手段が瞬時帯域雑音パワー推定値を時間平滑化することを特徴とする請求項12に記載の雑音推定方法。
- コンピュータを、
入力音声が帯域分割されたそれぞれの帯域入力音声毎に設けられた帯域雑音推定装置であって、
帯域入力パワーを算出するパワー算出手段と、
雑音の定常性をモデリングした確率モデルの情報であって、予測事後SNRに基づいた事後SNRに関する尤度関数と、平均事後SNRが確定した条件の下での上記事後SNRの事前確率との情報を含む確率モデルの情報を保持している確率モデル保持手段と、
帯域入力パワーと、当該帯域雑音推定装置から出力される帯域雑音パワー推定値と、保持されている確率モデル情報とに基づいて、帯域雑音パワーの事後確率が最大となるように瞬時帯域雑音パワー推定値を算出する事後確率最大化手段とを具備する
帯域雑音推定装置として機能させる
ことを特徴とする雑音推定プログラム。 - 上記コンピュータが機能させられる上記各帯域雑音推定装置が、上記瞬時帯域雑音パワー推定値を時間平滑化する平滑化手段をさらに具備することを特徴とする請求項14に記載の雑音推定プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014023591A JP6361156B2 (ja) | 2014-02-10 | 2014-02-10 | 雑音推定装置、方法及びプログラム |
US14/615,085 US9548064B2 (en) | 2014-02-10 | 2015-02-05 | Noise estimation apparatus of obtaining suitable estimated value about sub-band noise power and noise estimating method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014023591A JP6361156B2 (ja) | 2014-02-10 | 2014-02-10 | 雑音推定装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015152627A JP2015152627A (ja) | 2015-08-24 |
JP6361156B2 true JP6361156B2 (ja) | 2018-07-25 |
Family
ID=53776123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014023591A Active JP6361156B2 (ja) | 2014-02-10 | 2014-02-10 | 雑音推定装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9548064B2 (ja) |
JP (1) | JP6361156B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9312826B2 (en) | 2013-03-13 | 2016-04-12 | Kopin Corporation | Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction |
US10306389B2 (en) | 2013-03-13 | 2019-05-28 | Kopin Corporation | Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods |
US10141003B2 (en) * | 2014-06-09 | 2018-11-27 | Dolby Laboratories Licensing Corporation | Noise level estimation |
EP3252766B1 (en) * | 2016-05-30 | 2021-07-07 | Oticon A/s | An audio processing device and a method for estimating a signal-to-noise-ratio of a sound signal |
JP6379839B2 (ja) * | 2014-08-11 | 2018-08-29 | 沖電気工業株式会社 | 雑音抑圧装置、方法及びプログラム |
JP2016095751A (ja) * | 2014-11-17 | 2016-05-26 | 富士通株式会社 | 異常機器特定プログラム、異常機器特定方法、及び、異常機器特定装置 |
JP6536322B2 (ja) * | 2015-09-29 | 2019-07-03 | 沖電気工業株式会社 | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 |
US11631421B2 (en) * | 2015-10-18 | 2023-04-18 | Solos Technology Limited | Apparatuses and methods for enhanced speech recognition in variable environments |
CN112889110A (zh) * | 2018-10-15 | 2021-06-01 | 索尼公司 | 音频信号处理装置及噪声抑制方法 |
CN109087657B (zh) * | 2018-10-17 | 2021-09-14 | 成都天奥信息科技有限公司 | 一种应用于超短波电台的语音增强方法 |
JP7380361B2 (ja) | 2020-03-17 | 2023-11-15 | 沖電気工業株式会社 | 雑音推定装置、雑音推定プログラム、雑音推定方法、及び収音装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6604071B1 (en) * | 1999-02-09 | 2003-08-05 | At&T Corp. | Speech enhancement with gain limitations based on speech activity |
JP4282227B2 (ja) | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
WO2007026827A1 (ja) * | 2005-09-02 | 2007-03-08 | Japan Advanced Institute Of Science And Technology | マイクロホンアレイ用ポストフィルタ |
CN100499611C (zh) * | 2006-03-31 | 2009-06-10 | 东南大学 | 无线通信系统空域最大后验概率检测方法 |
FR2908003B1 (fr) * | 2006-10-26 | 2009-04-03 | Parrot Sa | Procede de reduction de l'echo acoustique residuel apres supression d'echo dans un dispositif"mains libres" |
US8352257B2 (en) * | 2007-01-04 | 2013-01-08 | Qnx Software Systems Limited | Spectro-temporal varying approach for speech enhancement |
WO2008115435A1 (en) * | 2007-03-19 | 2008-09-25 | Dolby Laboratories Licensing Corporation | Noise variance estimator for speech enhancement |
US8560320B2 (en) * | 2007-03-19 | 2013-10-15 | Dolby Laboratories Licensing Corporation | Speech enhancement employing a perceptual model |
US8989403B2 (en) * | 2010-03-09 | 2015-03-24 | Mitsubishi Electric Corporation | Noise suppression device |
JP5387459B2 (ja) * | 2010-03-11 | 2014-01-15 | 富士通株式会社 | 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム |
JP2013148724A (ja) * | 2012-01-19 | 2013-08-01 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
US8880393B2 (en) * | 2012-01-27 | 2014-11-04 | Mitsubishi Electric Research Laboratories, Inc. | Indirect model-based speech enhancement |
-
2014
- 2014-02-10 JP JP2014023591A patent/JP6361156B2/ja active Active
-
2015
- 2015-02-05 US US14/615,085 patent/US9548064B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20150230023A1 (en) | 2015-08-13 |
US9548064B2 (en) | 2017-01-17 |
JP2015152627A (ja) | 2015-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6361156B2 (ja) | 雑音推定装置、方法及びプログラム | |
KR101120679B1 (ko) | 이득-제한된 잡음 억제 | |
CN110164467B (zh) | 语音降噪的方法和装置、计算设备和计算机可读存储介质 | |
CN111899752B (zh) | 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端 | |
CA2732723C (en) | Apparatus and method for processing an audio signal for speech enhancement using a feature extraction | |
US8239196B1 (en) | System and method for multi-channel multi-feature speech/noise classification for noise suppression | |
JP4469882B2 (ja) | 音響信号処理方法及び装置 | |
WO2013118192A1 (ja) | 雑音抑圧装置 | |
CN108074582B (zh) | 一种噪声抑制信噪比估计方法和用户终端 | |
WO2015078501A1 (en) | Method of operating a hearing aid system and a hearing aid system | |
WO2022218254A1 (zh) | 语音信号增强方法、装置及电子设备 | |
Ram et al. | Performance analysis of adaptive variational mode decomposition approach for speech enhancement | |
Rosenkranz et al. | Integrating recursive minimum tracking and codebook-based noise estimation for improved reduction of non-stationary noise | |
WO2017128910A1 (zh) | 一种语音出现概率的确定方法、装置及电子设备 | |
JP6361148B2 (ja) | 雑音推定装置、方法及びプログラム | |
JP6679881B2 (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
JP6716933B2 (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
JP7139822B2 (ja) | 雑音推定装置、雑音推定プログラム、雑音推定方法、及び収音装置 | |
JP2016145944A (ja) | 雑音抑圧装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム | |
Lee et al. | Spectral difference for statistical model-based speech enhancement in speech recognition | |
JP7380361B2 (ja) | 雑音推定装置、雑音推定プログラム、雑音推定方法、及び収音装置 | |
JP6536322B2 (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
JP2022160311A (ja) | 雑音推定装置、雑音推定プログラム、雑音推定方法、収音装置、収音プログラム、及び収音方法 | |
Huang et al. | An Improved IMCRA Algorithm for Sleep Signal Denoising | |
JP6737133B2 (ja) | 雑音推定装置、プログラム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171017 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180611 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6361156 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |