CN113838475B - 一种基于对数mmse估计器的语音信号增强方法及系统 - Google Patents
一种基于对数mmse估计器的语音信号增强方法及系统 Download PDFInfo
- Publication number
- CN113838475B CN113838475B CN202111428863.5A CN202111428863A CN113838475B CN 113838475 B CN113838475 B CN 113838475B CN 202111428863 A CN202111428863 A CN 202111428863A CN 113838475 B CN113838475 B CN 113838475B
- Authority
- CN
- China
- Prior art keywords
- signal
- noise
- frame
- gain
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000007476 Maximum Likelihood Methods 0.000 claims description 16
- 239000000126 substance Substances 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000001914 filtration Methods 0.000 claims description 7
- 230000001629 suppression Effects 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 6
- 238000004891 communication Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000000452 restraining effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 241000287196 Asthenes Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
Abstract
本发明公开了提供了一种基于对数MMSE估计器的语音信号增强方法及系统,该语音信号增强方法,采用对数MMSE估计器处理带噪信号,得到增益后的带噪信号。本发明解决了现有技术存在的因不能有效识别频带较宽且不断变化(非平稳)的噪声、不能有效进行实时更新和估计噪声从而导致的噪声抑制、语音通话效果较差等问题。
Description
技术领域
本发明涉及信号处理技术领域,具体是一种基于对数MMSE估计器的语音信号增强方法及系统。
背景技术
在语音通信中,很难避免有噪声的出现,这些噪声在很大程度上影响语音的质量和可懂性,这时就需要通过技术方法对噪声进行抑制。这些噪声中有些噪声能量比较小可以通过能量阈值去除,有些能量较大的噪声频域能量集中在较低的频段,可以通过滤波器去除,而有些噪声的频域(时域)随着对话或者环境变化而改变,且具有较宽的频带,这时这种不断变化(非平稳)的噪声抑制不能采用传统方法进行处理。
发明内容
为克服现有技术的不足,本发明提供了一种基于对数MMSE估计器的语音信号增强方法及系统,解决现有技术存在的因不能有效识别频带较宽且不断变化(非平稳)的噪声、不能有效进行实时更新和估计噪声从而导致的噪声抑制、语音通话效果较差等问题。
本发明解决上述问题所采用的技术方案是:
一种基于对数MMSE估计器的语音信号增强方法,采用对数MMSE估计器处理带噪信号,得到增益后的带噪信号。
作为一种优选的技术方案,采用两级对数MMSE估计器级联的方式处理带噪信号,得到增益后的带噪信号,两级对数MMSE估计器按带噪信号的通过先后顺序分别记为第一对数MMSE估计器、第二对数MMSE估计器。
作为一种优选的技术方案,包括以下步骤:
S1,计算带噪信号的先验信噪比和后验信噪比;
S2,将通过步骤S1处理的带噪信号输入至第一对数MMSE估计器,经第一对数MMSE估计器处理得到第一次增益后的带噪信号;
S3,计算第一次增益后的带噪信号的先验信噪比和后验信噪比;
S4,将通过步骤S3处理的带噪信号输入至第二对数MMSE估计器,经第二对数MMSE估计器处理得到第二次增益后的带噪信号。
作为一种优选的技术方案,步骤S1和/或步骤S3中,设带噪信号的当前帧为第m帧,计算带噪信号的后验信噪比采用如下公式:
带噪信号的先验信噪比采用如下公式:
作为一种优选的技术方案,步骤S1和/或步骤S3还包括以下步骤:计算最大似然比,若最大似然比>设定的阈值,更新噪声;若最大似然比≤设定的阈值,维持当前噪声;计算最大似然比公式如下:
更新噪声的公式如下:
其中,b为权重因子,0<b<1。
作为一种优选的技术方案,第一次增益后的带噪信号的频域值计算公式为:
作为一种优选的技术方案,第m帧带噪信号第一次增益后的增益函数计算公式如下:
其中,
作为一种优选的技术方案,第m帧带噪信号第二级增益后的带噪信号的频域值计算公式如下:
作为一种优选的技术方案,还包括以下步骤:
S5,将得到的第二次增益后的带噪信号进行滤波处理,得到经滤波处理后的信号。
一种基于对数MMSE估计器的语音信号增强系统,基于所述的一种基于对数MMSE估计器的语音信号增强方法,包括以下模块:
第一先验后验计算模块,用以:计算带噪信号的先验信噪比和后验信噪比,并将计算结果输入至第一对数MMSE估计器;
第一对数MMSE估计器,用以:得到第一次增益后的带噪信号,并将第一次增益后的带噪信号输入至第二先验后验计算模块;
第二先验后验计算模块,用以:计算第一次增益后的带噪信号的先验信噪比和后验信噪比,并将计算结果输入至第二对数MMSE估计器;
第二对数MMSE估计器,用以:得到第二次增益后的带噪信号。
本发明相比于现有技术,具有以下有益效果:
(1)本发明对进行带噪信号增益,便于有效识别频带较宽且不断变化(非平稳)的噪声,便于有效进行实时更新和估计噪声,从而便于提供良好的噪声抑制效果、语音通话效果;
(2)本发明采用两级对数MMSE估计器级联的方式对信号进行噪声抑制处理,并通过滤波处理去掉两级估计器带来的额外噪声;
(3)本发明适用于抑制频带宽且频谱特性不一定的噪声信号,对于带有此种特性噪声的带噪信号有很好的的抑制作用;
(4)本发明采用计算每一帧的最大似然比,并判断其是否大于设定的阈值的方式来更新噪声,便于有效保证语音通话效果,同时兼顾了处理效率。
附图说明
图1为本发明所述一种基于对数MMSE估计器的语音信号增强方法的步骤示意图;
图2为本发明所述一种基于对数MMSE估计器的语音信号增强系统的结构框图;
图3为本发明信号增益流程图;
图4为两级信号增益及去噪流程图。
具体实施方式
下面结合实施例及附图,对本发明作进一步的详细说明,但本发明的实施方式不限于此。
实施例
如图1至图4所示,本发明对具有较宽的频带且不断变化(非平稳)的噪声进行实时更新和估计,通过估计出带噪信号在频域的增益函数,从而对带噪信号的频谱进行实时增益继而得到噪声抑制后的信号。本方法能够有效抑制不平稳且频带宽的噪声,从而提高通话质量和体验。
本发明中以对数MMSE估计器(MMSE,Minimum Mean Square Error,最小均方误差)为基础估计带噪信号的增益函数,对带噪信号进行噪声抑制。同时采用两级对数MMSE估计器级联的方式,对带噪信号进行二次增益以将噪声的频域能量降到最小,再通过滤波处理滤除两级估计器带来的额外噪声。
具体的,本发明将带噪信号进行分帧,并将带噪信号的前几帧(优选的,可取前5帧)当做初始噪声,用来计算后验信噪比(后验SNR)和先验信噪比(先验SNR),再将先验信噪比和后验信噪比输入给第一对数MMSE估计器得到当前帧的增益函数,同时根据先后验信噪比判断是否需要更新初始噪声。接着将增益后的带噪信号二次计算后验信噪比和先验信噪比并输入给第二对数MMSE估计器得到二次增益后的带噪信号,最后对此时的带噪信号进行滤波处理得到处理完成的信号。
本发明具体实施方式下面具体分为两个部分,一是信号增益流程,二是两级信号增益级联流程,三是对数MMSE估计器具体流程。
一.信号增益流程具体如下:
(1)计算先验信噪比和后验信噪比;
这里先验信噪比可以看作当前帧的实际信噪比,后验信噪比可以看作当前帧的带噪信噪比。
这里设当前帧为第m帧,则后验信噪比可以由下列公式得到:
先验信噪比可以由下列公式得到:
(2)计算噪声能量;
在算先验信噪比时提到上一帧和当前帧的噪声能量,这里对噪声如何更新作补充描述。将带噪信号的前几帧频域能量作为初始值N(1),并通过判断最大似然比是否大于阈值(优选的,阈值可取0.5)来决定是否更新噪声,判断后的噪声频域能量作为第2帧的噪声能量N(2),依次类推。
最大似然比可以由下列公式得到:
当第m帧算出来的似然比大于阈值,对噪声进行更新,
其中b为权重因子,范围0<b<1。
(3)计算第一次增益后的带噪信号频域估计值。
二.两级信号增益级联流程如下:
两级级联是将增益后的信号再次进行增益计算从而得到二次估计增益后的信号,在第二次增益时,将第一次增益后的带噪信号进行分帧,计算先验信噪比和后验信噪比,计算增益函数并进行噪声抑制。这里需要说明的是第二次增益需要将第一次增益后的前几帧设置为噪声初始频域能量值,从而获得级联的效果。最后将二次增益后的带噪信号进行滤波处理。
(1)计算二次增益后的带噪信号频域估计值;
三.对数MMSE估计器流程如下:
本发明采用两级对数MMSE估计器级联的方式对信号进行噪声抑制处理,并通过滤波处理去掉两级估计器带来的额外噪声。
本发明适用于抑制频带宽且频谱特性不一定的噪声信号,对于带有此种特性噪声的带噪信号有很好的的抑制作用。
本发明采用计算每一帧的最大似然比,并判断其是否大于设定的阈值的方式来更新噪声。
本发明由于采用两级对数MMSE估计器级联的方式进行噪声抑制,所以第二次增益时的噪声的初始值设定为第一次增益后的前几帧信号,从而获得两级级联的效果。
如上所述,可较好地实现本发明。
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,依据本发明的技术实质,在本发明的精神和原则之内,对以上实施例所作的任何简单的修改、等同替换与改进等,均仍属于本发明技术方案的保护范围之内。
Claims (5)
1.一种基于对数MMSE估计器的语音信号增强方法,其特征在于,采用两级对数MMSE估计器级联的方式处理带噪信号,得到增益后的带噪信号,两级对数MMSE估计器按带噪信号的通过先后顺序分别记为第一对数MMSE估计器、第二对数MMSE估计器;
包括以下步骤:
S1,计算带噪信号的先验信噪比和后验信噪比;
S2,将通过步骤S1处理的带噪信号输入至第一对数MMSE估计器,经第一对数MMSE估计器处理得到第一次增益后的带噪信号;
S3,计算第一次增益后的带噪信号的先验信噪比和后验信噪比;
S4,将通过步骤S3处理的带噪信号输入至第二对数MMSE估计器,经第二对数MMSE估计器处理得到第二次增益后的带噪信号;
步骤S1和/或步骤S3中,设带噪信号的当前帧为第m帧,计算带噪信号的后验信噪比采用如下公式:
带噪信号的先验信噪比采用如下公式:
第一次增益后的带噪信号的频域值计算公式为:
第m帧带噪信号第一次增益后的增益函数计算公式如下:
其中,
4.根据权利要求1至3任一项所述的一种基于对数MMSE估计器的语音信号增强方法,其特征在于,还包括以下步骤:
S5,将得到的第二次增益后的带噪信号进行滤波处理,得到经滤波处理后的信号。
5.一种基于对数MMSE估计器的语音信号增强系统,其特征在于,基于权利要求1至4任一项所述的一种基于对数MMSE估计器的语音信号增强方法,包括以下模块:
第一先验后验计算模块,用以:计算带噪信号的先验信噪比和后验信噪比,并将计算结果输入至第一对数MMSE估计器;
第一对数MMSE估计器,用以:得到第一次增益后的带噪信号,并将第一次增益后的带噪信号输入至第二先验后验计算模块;
第二先验后验计算模块,用以:计算第一次增益后的带噪信号的先验信噪比和后验信噪比,并将计算结果输入至第二对数MMSE估计器;
第二对数MMSE估计器,用以:得到第二次增益后的带噪信号;
设带噪信号的当前帧为第m帧,计算带噪信号的后验信噪比采用如下公式:
带噪信号的先验信噪比采用如下公式:
第一次增益后的带噪信号的频域值计算公式为:
第m帧带噪信号第一次增益后的增益函数计算公式如下:
其中,
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111428863.5A CN113838475B (zh) | 2021-11-29 | 2021-11-29 | 一种基于对数mmse估计器的语音信号增强方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111428863.5A CN113838475B (zh) | 2021-11-29 | 2021-11-29 | 一种基于对数mmse估计器的语音信号增强方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113838475A CN113838475A (zh) | 2021-12-24 |
CN113838475B true CN113838475B (zh) | 2022-02-15 |
Family
ID=78971845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111428863.5A Active CN113838475B (zh) | 2021-11-29 | 2021-11-29 | 一种基于对数mmse估计器的语音信号增强方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113838475B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079266A (zh) * | 2006-05-23 | 2007-11-28 | 中兴通讯股份有限公司 | 基于多统计模型和最小均方误差实现背景噪声抑制的方法 |
CN101154383A (zh) * | 2006-09-29 | 2008-04-02 | 株式会社东芝 | 噪声抑制、提取语音特征、语音识别及训练语音模型的方法和装置 |
GB201322969D0 (en) * | 2013-11-07 | 2014-02-12 | Continental Automotive Systems | Externally estimated SNR based modifiers for internal MMSE calculations |
CN103632676A (zh) * | 2013-11-12 | 2014-03-12 | 广州海格通信集团股份有限公司 | 一种低信噪比语音降噪方法 |
CN103730124A (zh) * | 2013-12-31 | 2014-04-16 | 上海交通大学无锡研究院 | 一种基于似然比测试的噪声鲁棒性端点检测方法 |
CN105280193A (zh) * | 2015-07-20 | 2016-01-27 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于mmse误差准则的先验信噪比估计方法 |
CN111564162A (zh) * | 2020-03-27 | 2020-08-21 | 成都航天通信设备有限责任公司 | 基于fpga的有效呼吸声去除方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8296135B2 (en) * | 2008-04-22 | 2012-10-23 | Electronics And Telecommunications Research Institute | Noise cancellation system and method |
JP5875414B2 (ja) * | 2012-03-07 | 2016-03-02 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 雑音抑制方法、プログラム及び装置 |
US9449609B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Accurate forward SNR estimation based on MMSE speech probability presence |
CN110400570B (zh) * | 2019-06-24 | 2021-08-31 | 成都航天通信设备有限责任公司 | 一种多路数字音频混音实现方法 |
CN111564154B (zh) * | 2020-03-23 | 2023-08-08 | 北京邮电大学 | 基于语音增强算法的对抗样本攻击防御方法及装置 |
-
2021
- 2021-11-29 CN CN202111428863.5A patent/CN113838475B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079266A (zh) * | 2006-05-23 | 2007-11-28 | 中兴通讯股份有限公司 | 基于多统计模型和最小均方误差实现背景噪声抑制的方法 |
CN101154383A (zh) * | 2006-09-29 | 2008-04-02 | 株式会社东芝 | 噪声抑制、提取语音特征、语音识别及训练语音模型的方法和装置 |
GB201322969D0 (en) * | 2013-11-07 | 2014-02-12 | Continental Automotive Systems | Externally estimated SNR based modifiers for internal MMSE calculations |
CN103632676A (zh) * | 2013-11-12 | 2014-03-12 | 广州海格通信集团股份有限公司 | 一种低信噪比语音降噪方法 |
CN103730124A (zh) * | 2013-12-31 | 2014-04-16 | 上海交通大学无锡研究院 | 一种基于似然比测试的噪声鲁棒性端点检测方法 |
CN105280193A (zh) * | 2015-07-20 | 2016-01-27 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于mmse误差准则的先验信噪比估计方法 |
CN111564162A (zh) * | 2020-03-27 | 2020-08-21 | 成都航天通信设备有限责任公司 | 基于fpga的有效呼吸声去除方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113838475A (zh) | 2021-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108735213B (zh) | 一种基于相位补偿的语音增强方法及系统 | |
CN111899752B (zh) | 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端 | |
CN110634500B (zh) | 一种先验信噪比的计算方法、电子设备及存储介质 | |
US5781883A (en) | Method for real-time reduction of voice telecommunications noise not measurable at its source | |
US8010355B2 (en) | Low complexity noise reduction method | |
EP2031583B1 (en) | Fast estimation of spectral noise power density for speech signal enhancement | |
CN105280193B (zh) | 基于mmse误差准则的先验信噪比估计方法 | |
JPH08221094A (ja) | 音声信号の雑音低減方法及び装置 | |
US20180308503A1 (en) | Real-time single-channel speech enhancement in noisy and time-varying environments | |
US20080152157A1 (en) | Method and system for eliminating noises in voice signals | |
CN107731242B (zh) | 一种广义最大后验的谱幅度估计的增益函数语音增强方法 | |
CN113539285A (zh) | 音频信号降噪方法、电子装置和存储介质 | |
CN111933165A (zh) | 突变噪声快速估计方法 | |
CN107360497B (zh) | 估算混响分量的计算方法及装置 | |
Yang et al. | A noise reduction method based on LMS adaptive filter of audio signals | |
CN112602150A (zh) | 噪声估计方法、噪声估计装置、语音处理芯片以及电子设备 | |
CN112530451A (zh) | 基于去噪自编码器的语音增强方法 | |
CN109087657B (zh) | 一种应用于超短波电台的语音增强方法 | |
CN107045874B (zh) | 一种基于相关性的非线性语音增强方法 | |
KR20080075362A (ko) | 잡음 환경에서 음성 신호의 추정치를 구하는 방법 | |
CN112634927B (zh) | 一种短波信道语音增强方法 | |
CN112151060B (zh) | 单通道语音增强方法及装置、存储介质、终端 | |
CN113838475B (zh) | 一种基于对数mmse估计器的语音信号增强方法及系统 | |
CN104867498A (zh) | 一种移动通讯终端及其语音增强方法和模块 | |
CN113658605B (zh) | 一种基于深度学习辅助rls滤波处理的语音增强方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |