JP6361148B2 - 雑音推定装置、方法及びプログラム - Google Patents
雑音推定装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6361148B2 JP6361148B2 JP2014014533A JP2014014533A JP6361148B2 JP 6361148 B2 JP6361148 B2 JP 6361148B2 JP 2014014533 A JP2014014533 A JP 2014014533A JP 2014014533 A JP2014014533 A JP 2014014533A JP 6361148 B2 JP6361148 B2 JP 6361148B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- band
- power
- estimation
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
第1の実施形態及び変形実施形態の説明に先立ち、各実施形態に至った考え方や、各実施形態により本発明の目的である雑音パワーを安定的に推定できる理由を説明する。
p(DLN)=Ndist(DLN;0,V) …(2)
次に、最大事後確率(Maximum A Posteriori:MAP)推定の枠組みを用いて、現在の帯域雑音対数パワーLNを推定することを考える。但し、現在の帯域雑音対数パワーLNは、収音環境やマイクロフォン感度によって値が増減するため、直接推定するのには適していない。そこで、過去の帯域雑音対数パワーLN′から現在の帯域雑音対数パワーLNを推定する問題を、(3)式で表される現在の事後SNRの予測値LG′から、(4)式で表される現在の事後SNRの真値LGを推定する問題へと置き換える。(3)式及び(4)式において、LXは現在の帯域入力対数パワーである。
LG=LX−LN …(4)
現在の事後SNRの予測値がLG′であるという条件下で現在の事後SNRの真値がLG(以下、変数と呼ぶことがある)となる事後確率p(LG|LG′)は、ベイズの定理より、(5)式のように展開できる。(5)式を、変数LGについて最大化するのがMAP推定であるが、分母の確率密度関数p(LG′)は、変数LGと無関係であるので、MAP推定は、(6)式で表される値Jmap(LG)を最大化することで達成される。
Jmap(LG)=p(LG′|LG)*p(LG) …(6)
次に、(6)式を具体化する。変数LGの尤度関数p(LG′|LG)は、2つの値LG及びLG′の関係式とも捉えられる。2つの値LG及びLG′には、(3)式及び(4)式から(7)式に示すようにパワー差DLNで規定される関係があり、値LG′は、現在の事後SNRの予測値であって既に計算された値であるので定数と扱って良く、そのため、パワー差DLNに関する確率密度関数p(DLN)を表す(2)式から、変数LGの尤度関数p(LG′|LG)は(8)式で表すことができる。
p(LG′|LG)=Ndist(LG′;LG,V) …(8)
現在の事後SNRの真値LGの事前分布p(LG)は、事後SNRの真値LGの潜在的な出現確率を意味している。事後SNRの真値LGの出現確率について、3つの考察を行う。第1に、事後SNRの真値LGの取り得る値の範囲について考察する。入力音声は音声と雑音の両方を含んでいるので、帯域入力対数パワーLXは帯域雑音対数パワーLNより大きくなるべきであり、従って、事後SNRの真値LGは、(4)式より非負であるとする。第2に、音声のスパース性(出現がまばらである性質)について考察する。一般に、音声の時間周波数表現はスパースであると言われており、従って、出現確率が一番高いのは事後SNRの真値LGが0(dB)のときである。第3に、帯域入力対数パワーLXの大小について考察する。音声の大きさは有限であるから帯域入力対数パワーLXも有限であり、一方で雑音は音声に比してスパース性が弱いために小さな値を取り難くなるので、事後SNRの真値LGの事前分布p(LG)は変数LGを∞にしたときに0に収束する。以上の3つの考察より、事後SNRの真値LGの事前分布p(LG)の候補の一つとして、(9)式に示す指数分布を選ぶことは自然である(但し、後述するように指数分布に限定されない)。
(8)式及び(9)式を、上述した(6)式に適用することにより、(6)式の具体的な式が定まったので、(6)式を最大化する現在の事後SNRの真値LGを計算することとする。(6)式はこのままでは扱いにくいので対数をとった後、最大値を見付けるため、右辺の導関数が0となる真値LGを計算すると、(10)式が得られる。但し、上述した第2の考察のように、真値LGは非負でなければならず、従って、(11)式を適用して真値LGを非負値に制限する。(11)式において、max(a、b)はaとbの大きい方を選択する関数である。結局、帯域雑音対数パワーLNは、(11)式に(3)式及び(4)式を代入することにより、(12)式で表すことができる。(12)式において、min(a、b)はaとbの小さい方を選択する関数である。
LG=max{LG′−λ*V,0} …(11)
LN=min{LN′−λ*V,LX} …(12)
(12)式は、次のような意味を持っている。すなわち、現在のMAP推定による帯域雑音パワー推定値は、前回の帯域雑音パワー推定値を定数倍した値であるが((12)式は対数値に関する式になっているので加減は対数をとっていない値での乗算若しくは除算に対応する)、仮に、その定数倍された値が帯域入力パワーを上回るならば帯域入力パワーを帯域雑音パワー推定値とする、ということである。
以下、本発明による雑音推定装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。
図1は、第1の実施形態の雑音推定装置の構成を示す機能ブロック図である。ここで、第1の実施形態の雑音推定装置は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(雑音推定プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
次に、第1の実施形態の雑音推定装置200の動作(雑音推定方法)を説明する。
第1の実施形態によれば、定常な帯域雑音パワーを安定的に推定することができる。仮に、第1の実施形態の雑音推定装置を、雑音抑圧装置(図5参照)に組み込んだ場合には、強調音声の歪みを小さく抑えることができる。
以上でも、種々の変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
Claims (11)
- 入力音声に含まれる雑音を推定する雑音推定装置において、
入力音声が帯域分割されたそれぞれの帯域入力音声毎に設けられた帯域雑音推定手段を備え、
上記各帯域雑音推定手段が、
帯域入力パワーを算出するパワー算出手段と、
雑音の定常性をモデリングした確率モデルの情報を保持している確率モデル保持手段と、
保持されている確率モデル情報に基づいて、事後SNRの事後確率が最大となるように瞬時帯域雑音パワー推定値を算出する事後確率最大化手段とを具備する
ことを特徴とする雑音推定装置。 - 上記各帯域雑音推定手段が、上記瞬時帯域雑音パワー推定値を時間平滑化する平滑化手段をさらに具備することを特徴とする請求項1に記載の雑音推定装置。
- 上記確率モデル情報は、現在の帯域入力パワーを所定時間過去の帯域雑音パワー推定値で除した予測事後SNRに基づいた現在の帯域入力パワーを現在の帯域雑音パワーで除した真の事後SNRに関する尤度関数と、上記真の事後SNRの事前分布を規定する確率密度関数とを含むことを特徴とする請求項1又は2に記載の雑音推定装置。
- 上記尤度関数は、平均値に対して対称な確率密度関数でモデリングされたものであることを特徴とする請求項3に記載の雑音推定装置。
- 上記尤度関数は、正規分布若しくは一般化正規分布でモデリングされたものであることを特徴とする請求項4に記載の雑音推定装置。
- 上記真の事後SNRの事前分布をモデリングした確率密度関数は、確率変数が正に限定され、確率変数が0のときに最頻値をとり、確率変数が大きくなるにつれて0に収束するものであることを特徴とする請求項3〜5のいずれかに記載の雑音推定装置。
- 上記真の事後SNRの事前分布をモデリングした確率密度関数は、指数分布若しくは片側一般化正規分布でモデリングされたものであることを特徴とする請求項6に記載の雑音推定装置。
- 入力音声に含まれる雑音を推定する雑音推定方法において、
入力音声が帯域分割されたそれぞれの帯域入力音声毎に設けられた、パワー算出手段、確率モデル保持手段及び事後確率最大化手段を有する帯域雑音推定手段を備え、
上記各帯域雑音推定手段における上記パワー算出手段は、帯域入力パワーを算出し、
上記各帯域雑音推定手段における上記確率モデル保持手段は、雑音の定常性をモデリングした確率モデルの情報を保持し、
上記各帯域雑音推定手段における上記事後確率最大化手段は、保持されている確率モデル情報に基づいて、事後SNRの事後確率が最大となるように瞬時帯域雑音パワー推定値を算出する
ことを特徴とする雑音推定方法。 - 上記各帯域雑音推定手段にさらに設けられた平滑化手段が瞬時帯域雑音パワー推定値を時間平滑化することを特徴とする請求項8に記載の雑音推定方法。
- コンピュータを、
入力音声が帯域分割されたそれぞれの帯域入力音声毎に設けられた帯域雑音推定手段であって、
帯域入力パワーを算出するパワー算出手段と、
雑音の定常性をモデリングした確率モデルの情報を保持している確率モデル保持手段と、
保持されている確率モデル情報に基づいて、事後SNRの事後確率が最大となるように瞬時帯域雑音パワー推定値を算出する事後確率最大化手段とを具備する
帯域雑音推定手段として機能させる
ことを特徴とする雑音推定プログラム。 - 上記コンピュータが機能させられる上記各帯域雑音推定手段が、上記瞬時帯域雑音パワー推定値を時間平滑化する平滑化手段をさらに具備することを特徴とする請求項10に記載の雑音推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014014533A JP6361148B2 (ja) | 2014-01-29 | 2014-01-29 | 雑音推定装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014014533A JP6361148B2 (ja) | 2014-01-29 | 2014-01-29 | 雑音推定装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015141335A JP2015141335A (ja) | 2015-08-03 |
JP6361148B2 true JP6361148B2 (ja) | 2018-07-25 |
Family
ID=53771716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014014533A Active JP6361148B2 (ja) | 2014-01-29 | 2014-01-29 | 雑音推定装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6361148B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6536322B2 (ja) * | 2015-09-29 | 2019-07-03 | 沖電気工業株式会社 | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 |
CN109616139B (zh) * | 2018-12-25 | 2023-11-03 | 平安科技(深圳)有限公司 | 语音信号噪声功率谱密度估计方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5387459B2 (ja) * | 2010-03-11 | 2014-01-15 | 富士通株式会社 | 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム |
US8880393B2 (en) * | 2012-01-27 | 2014-11-04 | Mitsubishi Electric Research Laboratories, Inc. | Indirect model-based speech enhancement |
-
2014
- 2014-01-29 JP JP2014014533A patent/JP6361148B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015141335A (ja) | 2015-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6361156B2 (ja) | 雑音推定装置、方法及びプログラム | |
CA2732723C (en) | Apparatus and method for processing an audio signal for speech enhancement using a feature extraction | |
JP4861645B2 (ja) | スピーチノイズサプレッサ、スピーチノイズ抑圧方法、および、スピーチ信号におけるノイズ抑圧方法 | |
JP2009047803A (ja) | 音響信号処理方法及び装置 | |
JP5187666B2 (ja) | 雑音抑圧装置およびプログラム | |
Martín-Doñas et al. | Dual-channel DNN-based speech enhancement for smartphones | |
US20230267947A1 (en) | Noise reduction using machine learning | |
JP6361148B2 (ja) | 雑音推定装置、方法及びプログラム | |
Schmidt et al. | Reduction of non-stationary noise using a non-negative latent variable decomposition | |
Chinaev et al. | A priori SNR Estimation Using a Generalized Decision Directed Approach. | |
Lee et al. | Minima-controlled speech presence uncertainty tracking method for speech enhancement | |
JP6716933B2 (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
JP6679881B2 (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
Chehresa et al. | MMSE speech enhancement using GMM | |
Pallavi et al. | Phase-locked Loop (PLL) Based Phase Estimation in Single Channel Speech Enhancement. | |
JP6536322B2 (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
Liu et al. | Multiresolution cochleagram speech enhancement algorithm using improved deep neural networks with skip connections | |
JP7139822B2 (ja) | 雑音推定装置、雑音推定プログラム、雑音推定方法、及び収音装置 | |
Sunnydayal et al. | Speech enhancement using β-divergence based NMF with update bases | |
Hadir et al. | A Model-Based Spectral Envelope Wiener Filter for Perceptually Motivated Speech Enhancement. | |
Yu et al. | A Single-Channel Speech Enhancement Algorithm Combined with Time-Frequency Mask | |
Ykhlef | An efficient solution to improve the spectral noise suppression rules | |
Yang | Towards a Speech Enhancement De-noising Algorithm Based on Cepstrum Smoothing Prior SNR Estimation | |
Taylan | Enhancement of the coded speech using filtering | |
JP2018031820A (ja) | 信号処理装置、信号処理方法、及び、信号処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171024 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180611 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6361148 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |