CN102637438A - 一种语音滤波方法 - Google Patents
一种语音滤波方法 Download PDFInfo
- Publication number
- CN102637438A CN102637438A CN2012100815060A CN201210081506A CN102637438A CN 102637438 A CN102637438 A CN 102637438A CN 2012100815060 A CN2012100815060 A CN 2012100815060A CN 201210081506 A CN201210081506 A CN 201210081506A CN 102637438 A CN102637438 A CN 102637438A
- Authority
- CN
- China
- Prior art keywords
- speech signal
- signal
- speech
- extended kalman
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000001914 filtration Methods 0.000 title claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 17
- 238000001228 spectrum Methods 0.000 claims abstract description 11
- 238000009499 grossing Methods 0.000 claims abstract description 5
- 238000011410 subtraction method Methods 0.000 claims abstract description 5
- 230000000694 effects Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 4
- 238000009795 derivation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Landscapes
- Filters That Use Time-Delay Elements (AREA)
- Noise Elimination (AREA)
Abstract
本发明涉及一种语音滤波方法,包括以下步骤:1)采集带噪声的语音信号作为输入信号;2)采用功率谱相减法对输入信号进行初步去噪处理;3)对初步去噪后的语音信号采用二阶扩展卡尔曼滤波算法进行消噪处理;4)对步骤3)处理后的语音信号采用二阶扩展卡尔曼平滑算法消去尖峰毛刺;5)判断经步骤4)处理后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则对所述的语音信号进行平方根扩展卡尔曼滤波后执行步骤6);6)判断进行平方根扩展卡尔曼滤波后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则通过增益矩阵加权的方法得到收敛的语音信号,并输出。与现有技术相比,本发明具有噪声小、信号收敛性好等优点。
Description
技术领域
本发明涉及一种语音滤波方法,尤其是涉及一种基于改进的卡尔曼滤波算法的语音滤波方法。
背景技术
语音增强算法中一个很重要的问题是噪音估计问题。基于语音活动检测(VoiceActivity Detection,VAD)和最小值统计跟踪两种噪音估计方法是都是较好的噪音估计方法,对噪声功率谱有较好的整型效果,使得增强后的语音具有较好的听觉效果。另一个重要的问题是如何有效地去除噪声信号,以得到较好的语音增强效果。扩展卡尔曼滤波算法是一种良好的非平稳噪声环境下的语音增强算法,具有良好的语音增强效果,在语音的信噪比、可懂度、舒适度方面都有所提高,同时降低语音信号的失真度。
VAD用于判断语音信号有声段和无声段,是常用的语音信号处理技术,通过与门限阈值的比较,来检测有声段和无声段。最小值统计跟踪方法相比于VAD可以较快地跟踪变化的噪音,以判断有声段与无声段,应用最小值统计跟踪方法进行参数估计可以获得较好的噪声谱估计值。
大部分的语音活动检测判决都是基于背景噪声是平稳的这种假设之上的,但在不断变化的语音和背景噪声的实际环境中,语音活动检测就很难找到一个或一系列数值作为判断有声段和无声段的门限阈值,使得这种判断方法变得复杂,也对噪声谱的估计造成了影响。在复杂度背景噪声环境下,噪声具有随机非平稳性且语音停顿阶段或者语音微弱时,带噪声语音功率谱不是噪音功率谱,在上面这种情况下,应用最小值统计跟踪方法时带噪声语音功率谱的估计值就会产生较大的误差。扩展卡尔曼滤波由于误差的影响可能出现滤波发散的问题,采用平方根卡尔曼滤波可以抑制滤波发散,但不能完全保证滤波的收敛性。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种噪声小、信号收敛性好的语音滤波方法。
本发明的目的可以通过以下技术方案来实现:
一种语音滤波方法,包括以下步骤:
1)采集带噪声的语音信号作为输入信号;
2)采用功率谱相减法对输入信号进行初步去噪处理;
3)对初步去噪后的语音信号采用二阶扩展卡尔曼滤波算法进行消噪处理;
4)对步骤3)处理后的语音信号采用二阶扩展卡尔曼平滑算法消去尖峰毛刺;
5)判断经步骤4)处理后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则对所述的语音信号进行平方根扩展卡尔曼滤波后执行步骤6);
6)判断进行平方根扩展卡尔曼滤波后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则通过增益矩阵加权的方法得到收敛的语音信号,并输出。
语音信号是否收敛的判断条件为:
εT(k)ε(k)=Tr{E[εT(k)ε(k)]}
其中,ε(k)为白噪声序列,Tr为矩阵迹,εT(k)ε(k)是新息序列的平方和,表示实际估计误差,E表示求矩估计,Tr{E[εT(k)ε(k)]}是新息序列的协方差矩阵的迹,表示理论误差。
步骤6)中增益矩阵加权递归到不满足滤波收敛的条件时,增益矩阵就保持常数不变,直到重新满足滤波收敛的条件为止。
与现有技术相比,本发明采用二阶扩展卡尔曼滤波与二阶扩展卡尔曼平滑的方法使得语音信号逼近二阶精度,在滤波发散问题上,采用平方根卡尔曼滤波算法和增益矩阵加权的方法可以使滤波具有较好的稳定性和收敛性。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例
如图1所示,一种语音滤波方法,包括以下步骤:
步骤S1:采集带噪声的语音信号作为输入信号;
步骤S2:采用功率谱相减法对输入信号进行初步去噪处理;
步骤S3:对初步去噪后的语音信号采用二阶扩展卡尔曼滤波算法进行消噪处理;
步骤S4:对步骤S3处理后的语音信号采用二阶扩展卡尔曼平滑算法消去尖峰毛刺;
步骤S5:判断经步骤S4处理后的语音信号是否收敛,若为是,则执行步骤S9输出该语音信号,若为否,则执行步骤S6:
步骤S6:对语音信号进行平方根扩展卡尔曼滤波后执行步骤S7;
步骤S7:判断进行平方根扩展卡尔曼滤波后的语音信号是否收敛,若为是,则执行步骤S9输出该语音信号,若为否,则执行步骤S8通过增益矩阵加权的方法得到收敛的语音信号,然后执行步骤S9输出语音信号。
语音信号是否收敛的判断条件为:
εT(k)ε(k)=Tr{E[εT(k)ε(k)]}
其中,k为语音样本序号,语音信号的新息序列,ε(k)为白噪声序列,Tr为取矩阵迹,εT(k)ε(k)是新息序列的平方和,E表示求期望值。
步骤6)中增益矩阵加权递归到不满足滤波收敛的条件时,增益矩阵就保持常数不变,直到重新满足滤波收敛的条件为止,对矩阵参数和收敛条件的推导基于扩展卡尔曼滤波的假设条件,推导过程如下:
E[ε(k)Tε(k)]=H(k)P(k|k-1)H(k)T+Rk
R=Rk/αzk
α2k Tr[ε(k)Tε(k)]=Tr{H(k)α2k P(k|k-1)H(k)T+R}
其中,H为观测模型,P表示增益矩阵,R为观测噪声方差,α大于1时,随着时间k的增加,Rk逐渐减小,Pk逐渐增大,这时信号估计值将发散,此时可固定Pk,使得收敛条件εT(k)ε(k)=Tr{E[εT(k)ε(k)]}得到满足,从而使得信号值收敛。
利用MATLAB对本发明进行实验仿真,并通过与已有的两种语音增强算法(功率谱相减法和扩展卡尔曼滤波算法)做比较,实验的说话人纯净语音来源于IEEE语音库,并在完全隔音的室内使用Tucker Davis Technologies(TDT)设备录制的纯净语音。噪音库包含30个IEEE语句(3名男士和3名女士),其包括6种不同的噪音类型,包括人群噪声(Babble)、机场噪声(Airport)、展览馆噪声(ExhibitionHall)、街道噪声(Street)、火车噪声(Train)、餐馆噪声(Restaurant)。将六种噪音信号以0dB,5dB,10dB,15dB四种信噪比(Signal Noises Ratio,SNR)人工加到纯净语音信号中,得到具有4种不同的信噪比的带噪声语音信号。单个输入语音是单声道编码且语音时长约为2.5秒的内容不同的语音。本文语音信号采用采样频率是8KHz,量化位数是16Bits的单通道语音信号。在预加重子模块采用的预加重因子为0.97,分帧帧宽是25ms,帧移为10ms,在预处理阶段采用汉明窗来减小语音帧的截断效应。
在不同信噪比的机场噪声(Airport)环境下,应用三种方法的分段信噪比如下表所示:
本发明使得语音信号具有较高的分段信噪比,可以较好地提高语音的音质。
Claims (3)
1.一种语音滤波方法,其特征在于,包括以下步骤:
1)采集带噪声的语音信号作为输入信号;
2)采用功率谱相减法对输入信号进行初步去噪处理;
3)对初步去噪后的语音信号采用二阶扩展卡尔曼滤波算法进行消噪处理;
4)对步骤3)处理后的语音信号采用二阶扩展卡尔曼平滑算法消去尖峰毛刺;
5)判断经步骤4)处理后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则对所述的语音信号进行平方根扩展卡尔曼滤波后执行步骤6);
6)判断进行平方根扩展卡尔曼滤波后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则通过增益矩阵加权的方法得到收敛的语音信号,并输出。
2.根据权利要求1所述的一种语音滤波方法,其特征在于,语音信号是否收敛的判断条件为:
εT(k)ε(k)=Tr{E[εT(k)ε(k)]}
其中,ε(k)为白噪声序列,Tr为矩阵迹,εT(k)ε(k)是新息序列的平方和,表示实际估计误差,E表示求期望值,Tr{E[εT(k)ε(k)]}是新息序列的协方差矩阵的迹,表示理论误差。
3.根据权利要求1所述的一种语音滤波方法,其特征在于,步骤6)中增益矩阵加权递归到不满足滤波收敛的条件时,增益矩阵就保持常数不变,直到重新满足滤波收敛的条件为止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100815060A CN102637438B (zh) | 2012-03-23 | 2012-03-23 | 一种语音滤波方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100815060A CN102637438B (zh) | 2012-03-23 | 2012-03-23 | 一种语音滤波方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102637438A true CN102637438A (zh) | 2012-08-15 |
CN102637438B CN102637438B (zh) | 2013-07-17 |
Family
ID=46621807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012100815060A Expired - Fee Related CN102637438B (zh) | 2012-03-23 | 2012-03-23 | 一种语音滤波方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102637438B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106356071A (zh) * | 2016-08-30 | 2017-01-25 | 广州市百果园网络科技有限公司 | 一种噪声检测方法,及装置 |
CN103928026B (zh) * | 2014-05-12 | 2017-04-12 | 安徽江淮汽车集团股份有限公司 | 一种汽车语音指令采集处理系统及方法 |
CN109256139A (zh) * | 2018-07-26 | 2019-01-22 | 广东工业大学 | 一种基于Triplet-Loss的说话人识别方法 |
CN109927072A (zh) * | 2019-03-05 | 2019-06-25 | 哈尔滨理工大学 | 用于厂矿医院科室查询的语音机器人头颈部装置及控制 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5007094A (en) * | 1989-04-07 | 1991-04-09 | Gte Products Corporation | Multipulse excited pole-zero filtering approach for noise reduction |
CN1210608A (zh) * | 1996-02-01 | 1999-03-10 | 艾利森电话股份有限公司 | 一种有噪语音参数增强的方法和装置 |
JP3210494B2 (ja) * | 1992-07-13 | 2001-09-17 | コマンディト セルスキャブ ヒンプ | 収斂される適応フィルタ機能を備えた聴覚補助装置、ノイズ抑制装置およびフィードバック抑制装置 |
CN1870136A (zh) * | 2006-06-29 | 2006-11-29 | 上海交通大学 | 基于语音生成模型的变分贝叶斯语音增强方法 |
-
2012
- 2012-03-23 CN CN2012100815060A patent/CN102637438B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5007094A (en) * | 1989-04-07 | 1991-04-09 | Gte Products Corporation | Multipulse excited pole-zero filtering approach for noise reduction |
JP3210494B2 (ja) * | 1992-07-13 | 2001-09-17 | コマンディト セルスキャブ ヒンプ | 収斂される適応フィルタ機能を備えた聴覚補助装置、ノイズ抑制装置およびフィードバック抑制装置 |
CN1210608A (zh) * | 1996-02-01 | 1999-03-10 | 艾利森电话股份有限公司 | 一种有噪语音参数增强的方法和装置 |
CN1870136A (zh) * | 2006-06-29 | 2006-11-29 | 上海交通大学 | 基于语音生成模型的变分贝叶斯语音增强方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103928026B (zh) * | 2014-05-12 | 2017-04-12 | 安徽江淮汽车集团股份有限公司 | 一种汽车语音指令采集处理系统及方法 |
CN106356071A (zh) * | 2016-08-30 | 2017-01-25 | 广州市百果园网络科技有限公司 | 一种噪声检测方法,及装置 |
CN106356071B (zh) * | 2016-08-30 | 2019-10-25 | 广州市百果园网络科技有限公司 | 一种噪声检测方法,及装置 |
CN109256139A (zh) * | 2018-07-26 | 2019-01-22 | 广东工业大学 | 一种基于Triplet-Loss的说话人识别方法 |
CN109927072A (zh) * | 2019-03-05 | 2019-06-25 | 哈尔滨理工大学 | 用于厂矿医院科室查询的语音机器人头颈部装置及控制 |
Also Published As
Publication number | Publication date |
---|---|
CN102637438B (zh) | 2013-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108831499B (zh) | 利用语音存在概率的语音增强方法 | |
CN103456310B (zh) | 一种基于谱估计的瞬态噪声抑制方法 | |
CN107274908A (zh) | 基于新阈值函数的小波语音去噪方法 | |
JP6793706B2 (ja) | 音声信号を検出するための方法および装置 | |
CN103578477B (zh) | 基于噪声估计的去噪方法和装置 | |
CN103854662A (zh) | 基于多域联合估计的自适应语音检测方法 | |
US9520138B2 (en) | Adaptive modulation filtering for spectral feature enhancement | |
CN103594094A (zh) | 自适应谱减法实时语音增强 | |
CN105489226A (zh) | 一种用于拾音器的多窗谱估计的维纳滤波语音增强方法 | |
EP3739582A1 (en) | Voice detection | |
CN107680609A (zh) | 一种基于噪声功率谱密度的双通道语音增强方法 | |
EP4189677B1 (en) | Noise reduction using machine learning | |
CN106558315A (zh) | 异质麦克风自动增益校准方法及系统 | |
CN102637438B (zh) | 一种语音滤波方法 | |
CN112712816B (zh) | 语音处理模型的训练方法和装置以及语音处理方法和装置 | |
CN112634926B (zh) | 一种基于卷积神经网络的短波信道语音抗衰落辅助增强方法 | |
Nian et al. | A progressive learning approach to adaptive noise and speech estimation for speech enhancement and noisy speech recognition | |
CN104157294A (zh) | 一种农产品市场要素信息采集的鲁棒性语音识别方法 | |
CN107045874A (zh) | 一种基于相关性的非线性语音增强方法 | |
US8935159B2 (en) | Noise removing system in voice communication, apparatus and method thereof | |
Rao et al. | Speech enhancement using sub-band cross-correlation compensated Wiener filter combined with harmonic regeneration | |
Lai et al. | Evaluation of generalized maximum a posteriori spectral amplitude (GMAPA) speech enhancement algorithm in hearing aids | |
CN104715761B (zh) | 一种音频有效数据检测方法和系统 | |
Venkateswarlu et al. | Speech Enhancement in terms of Objective Quality Measures Based on Wavelet Hybrid Thresholding the Multitaper Spectrum | |
Prodeus et al. | Objective estimation of the quality of radical noise suppression algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130717 Termination date: 20160323 |