CN102637438B - 一种语音滤波方法 - Google Patents

一种语音滤波方法 Download PDF

Info

Publication number
CN102637438B
CN102637438B CN2012100815060A CN201210081506A CN102637438B CN 102637438 B CN102637438 B CN 102637438B CN 2012100815060 A CN2012100815060 A CN 2012100815060A CN 201210081506 A CN201210081506 A CN 201210081506A CN 102637438 B CN102637438 B CN 102637438B
Authority
CN
China
Prior art keywords
voice signal
voice
voice signals
noise
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2012100815060A
Other languages
English (en)
Other versions
CN102637438A (zh
Inventor
罗怡桂
张晨曦
林秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN2012100815060A priority Critical patent/CN102637438B/zh
Publication of CN102637438A publication Critical patent/CN102637438A/zh
Application granted granted Critical
Publication of CN102637438B publication Critical patent/CN102637438B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Noise Elimination (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

本发明涉及一种语音滤波方法,包括以下步骤:1)采集带噪声的语音信号作为输入信号;2)采用功率谱相减法对输入信号进行初步去噪处理;3)对初步去噪后的语音信号采用二阶扩展卡尔曼滤波算法进行消噪处理;4)对步骤3)处理后的语音信号采用二阶扩展卡尔曼平滑算法消去尖峰毛刺;5)判断经步骤4)处理后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则对所述的语音信号进行平方根扩展卡尔曼滤波后执行步骤6);6)判断进行平方根扩展卡尔曼滤波后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则通过增益矩阵加权的方法得到收敛的语音信号,并输出。与现有技术相比,本发明具有噪声小、信号收敛性好等优点。

Description

一种语音滤波方法
技术领域
本发明涉及一种语音滤波方法,尤其是涉及一种基于改进的卡尔曼滤波算法的语音滤波方法。
背景技术
语音增强算法中一个很重要的问题是噪音估计问题。基于语音活动检测(VoiceActivity Detection,VAD)和最小值统计跟踪两种噪音估计方法是都是较好的噪音估计方法,对噪声功率谱有较好的整型效果,使得增强后的语音具有较好的听觉效果。另一个重要的问题是如何有效地去除噪声信号,以得到较好的语音增强效果。扩展卡尔曼滤波算法是一种良好的非平稳噪声环境下的语音增强算法,具有良好的语音增强效果,在语音的信噪比、可懂度、舒适度方面都有所提高,同时降低语音信号的失真度。
VAD用于判断语音信号有声段和无声段,是常用的语音信号处理技术,通过与门限阈值的比较,来检测有声段和无声段。最小值统计跟踪方法相比于VAD可以较快地跟踪变化的噪音,以判断有声段与无声段,应用最小值统计跟踪方法进行参数估计可以获得较好的噪声谱估计值。
大部分的语音活动检测判决都是基于背景噪声是平稳的这种假设之上的,但在不断变化的语音和背景噪声的实际环境中,语音活动检测就很难找到一个或一系列数值作为判断有声段和无声段的门限阈值,使得这种判断方法变得复杂,也对噪声谱的估计造成了影响。在复杂度背景噪声环境下,噪声具有随机非平稳性且语音停顿阶段或者语音微弱时,带噪声语音功率谱不是噪音功率谱,在上面这种情况下,应用最小值统计跟踪方法时带噪声语音功率谱的估计值就会产生较大的误差。扩展卡尔曼滤波由于误差的影响可能出现滤波发散的问题,采用平方根卡尔曼滤波可以抑制滤波发散,但不能完全保证滤波的收敛性。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种噪声小、信号收敛性好的语音滤波方法。
本发明的目的可以通过以下技术方案来实现:
一种语音滤波方法,包括以下步骤:
1)采集带噪声的语音信号作为输入信号;
2)采用功率谱相减法对输入信号进行初步去噪处理;
3)对初步去噪后的语音信号采用二阶扩展卡尔曼滤波算法进行消噪处理;
4)对步骤3)处理后的语音信号采用二阶扩展卡尔曼平滑算法消去尖峰毛刺;
5)判断经步骤4)处理后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则对所述的语音信号进行平方根扩展卡尔曼滤波后执行步骤6);
6)判断进行平方根扩展卡尔曼滤波后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则通过增益矩阵加权的方法得到收敛的语音信号,并输出。
语音信号是否收敛的判断条件为:
εT(k)ε(k)=Tr{E[εT(k)ε(k)]}
其中,ε(k)为白噪声序列,Tr为矩阵迹,εT(k)ε(k)是新息序列的平方和,表示实际估计误差,E表示求矩估计,Tr{E[εT(k)ε(k)]}是新息序列的协方差矩阵的迹,表示理论误差。
步骤6)中增益矩阵加权递归到不满足滤波收敛的条件时,增益矩阵就保持常数不变,直到重新满足滤波收敛的条件为止。
与现有技术相比,本发明采用二阶扩展卡尔曼滤波与二阶扩展卡尔曼平滑的方法使得语音信号逼近二阶精度,在滤波发散问题上,采用平方根卡尔曼滤波算法和增益矩阵加权的方法可以使滤波具有较好的稳定性和收敛性。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例
如图1所示,一种语音滤波方法,包括以下步骤:
步骤S1:采集带噪声的语音信号作为输入信号;
步骤S2:采用功率谱相减法对输入信号进行初步去噪处理;
步骤S3:对初步去噪后的语音信号采用二阶扩展卡尔曼滤波算法进行消噪处理;
步骤S4:对步骤S3处理后的语音信号采用二阶扩展卡尔曼平滑算法消去尖峰毛刺;
步骤S5:判断经步骤S4处理后的语音信号是否收敛,若为是,则执行步骤S9输出该语音信号,若为否,则执行步骤S6:
步骤S6:对语音信号进行平方根扩展卡尔曼滤波后执行步骤S7;
步骤S7:判断进行平方根扩展卡尔曼滤波后的语音信号是否收敛,若为是,则执行步骤S9输出该语音信号,若为否,则执行步骤S8通过增益矩阵加权的方法得到收敛的语音信号,然后执行步骤S9输出语音信号。
语音信号是否收敛的判断条件为:
εT(k)ε(k)=Tr{E[εT(k)ε(k)]}
其中,k为语音样本序号,语音信号的新息序列,ε(k)为白噪声序列,Tr为取矩阵迹,εT(k)ε(k)是新息序列的平方和,E表示求期望值。
步骤6)中增益矩阵加权递归到不满足滤波收敛的条件时,增益矩阵就保持常数不变,直到重新满足滤波收敛的条件为止,对矩阵参数和收敛条件的推导基于扩展卡尔曼滤波的假设条件,推导过程如下:
E[ε(k)Tε(k)]=H(k)P(k|k-1)H(k)T+Rk
Tr [ ϵ ( k ) T ϵ ( k ) ] = Tr { E [ ( ϵ ) T ϵ ( k ) ] } = Tr { [ H ( k ) P ( k | k - 1 ) H ( k ) T + R α 2 k ] }
R=Rkzk
α2k Tr[ε(k)Tε(k)]=Tr{H(k)α2k P(k|k-1)H(k)T+R}
α 2 k = Tr [ R ] Tr [ ϵ ( k ) T ϵ ( k ) ] - Tr { H ( k ) P ( k | k - 1 ) H ( k ) T
其中,H为观测模型,P表示增益矩阵,R为观测噪声方差,α大于1时,随着时间k的增加,Rk逐渐减小,Pk逐渐增大,这时信号估计值将发散,此时可固定Pk,使得收敛条件εT(k)ε(k)=Tr{E[εT(k)ε(k)]}得到满足,从而使得信号值收敛。
利用MATLAB对本发明进行实验仿真,并通过与已有的两种语音增强算法(功率谱相减法和扩展卡尔曼滤波算法)做比较,实验的说话人纯净语音来源于IEEE语音库,并在完全隔音的室内使用Tucker Davis Technologies(TDT)设备录制的纯净语音。噪音库包含30个IEEE语句(3名男士和3名女士),其包括6种不同的噪音类型,包括人群噪声(Babble)、机场噪声(Airport)、展览馆噪声(ExhibitionHall)、街道噪声(Street)、火车噪声(Train)、餐馆噪声(Restaurant)。将六种噪音信号以0dB,5dB,10dB,15dB四种信噪比(Signal Noises Ratio,SNR)人工加到纯净语音信号中,得到具有4种不同的信噪比的带噪声语音信号。单个输入语音是单声道编码且语音时长约为2.5秒的内容不同的语音。本文语音信号采用采样频率是8KHz,量化位数是16Bits的单通道语音信号。在预加重子模块采用的预加重因子为0.97,分帧帧宽是25ms,帧移为10ms,在预处理阶段采用汉明窗来减小语音帧的截断效应。
在不同信噪比的机场噪声(Airport)环境下,应用三种方法的分段信噪比如下表所示:
Figure BDA0000146571680000041
本发明使得语音信号具有较高的分段信噪比,可以较好地提高语音的音质。

Claims (3)

1.一种语音滤波方法,其特征在于,包括以下步骤:
1)采集带噪声的语音信号作为输入信号;
2)采用功率谱相减法对输入信号进行初步去噪处理;
3)对初步去噪后的语音信号采用二阶扩展卡尔曼滤波算法进行消噪处理;
4)对步骤3)处理后的语音信号采用二阶扩展卡尔曼平滑算法消去尖峰毛刺;
5)判断经步骤4)处理后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则对所述的语音信号进行平方根扩展卡尔曼滤波后执行步骤6);
6)判断进行平方根扩展卡尔曼滤波后的语音信号是否收敛,若为是,则输出该语音信号,若为否,则通过增益矩阵加权的方法得到收敛的语音信号,并输出。
2.根据权利要求1所述的一种语音滤波方法,其特征在于,语音信号是否收敛的判断条件为:
εT(k)ε(k)=Tr{E[εT(k)ε(k)]}
其中,ε(k)为白噪声序列,Tr为矩阵迹,εT(k)ε(k)是新息序列的平方和,表示实际估计误差,E表示求期望值,Tr{E[εT(k)ε(k)]}是新息序列的协方差矩阵的迹,表示理论误差,若上述等式成立,则语音信号收敛。
3.根据权利要求1所述的一种语音滤波方法,其特征在于,步骤6)中增益矩阵加权递归到不满足滤波收敛的条件时,增益矩阵就保持常数不变,直到重新满足滤波收敛的条件为止。
CN2012100815060A 2012-03-23 2012-03-23 一种语音滤波方法 Expired - Fee Related CN102637438B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100815060A CN102637438B (zh) 2012-03-23 2012-03-23 一种语音滤波方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100815060A CN102637438B (zh) 2012-03-23 2012-03-23 一种语音滤波方法

Publications (2)

Publication Number Publication Date
CN102637438A CN102637438A (zh) 2012-08-15
CN102637438B true CN102637438B (zh) 2013-07-17

Family

ID=46621807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100815060A Expired - Fee Related CN102637438B (zh) 2012-03-23 2012-03-23 一种语音滤波方法

Country Status (1)

Country Link
CN (1) CN102637438B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103928026B (zh) * 2014-05-12 2017-04-12 安徽江淮汽车集团股份有限公司 一种汽车语音指令采集处理系统及方法
CN106356071B (zh) * 2016-08-30 2019-10-25 广州市百果园网络科技有限公司 一种噪声检测方法,及装置
CN109256139A (zh) * 2018-07-26 2019-01-22 广东工业大学 一种基于Triplet-Loss的说话人识别方法
CN109927072A (zh) * 2019-03-05 2019-06-25 哈尔滨理工大学 用于厂矿医院科室查询的语音机器人头颈部装置及控制

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5007094A (en) * 1989-04-07 1991-04-09 Gte Products Corporation Multipulse excited pole-zero filtering approach for noise reduction
CN1210608A (zh) * 1996-02-01 1999-03-10 艾利森电话股份有限公司 一种有噪语音参数增强的方法和装置
JP3210494B2 (ja) * 1992-07-13 2001-09-17 コマンディト セルスキャブ ヒンプ 収斂される適応フィルタ機能を備えた聴覚補助装置、ノイズ抑制装置およびフィードバック抑制装置
CN1870136A (zh) * 2006-06-29 2006-11-29 上海交通大学 基于语音生成模型的变分贝叶斯语音增强方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5007094A (en) * 1989-04-07 1991-04-09 Gte Products Corporation Multipulse excited pole-zero filtering approach for noise reduction
JP3210494B2 (ja) * 1992-07-13 2001-09-17 コマンディト セルスキャブ ヒンプ 収斂される適応フィルタ機能を備えた聴覚補助装置、ノイズ抑制装置およびフィードバック抑制装置
CN1210608A (zh) * 1996-02-01 1999-03-10 艾利森电话股份有限公司 一种有噪语音参数增强的方法和装置
CN1870136A (zh) * 2006-06-29 2006-11-29 上海交通大学 基于语音生成模型的变分贝叶斯语音增强方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP特许第3210494号B2 2001.09.17

Also Published As

Publication number Publication date
CN102637438A (zh) 2012-08-15

Similar Documents

Publication Publication Date Title
CN105023580B (zh) 基于可分离深度自动编码技术的无监督噪声估计和语音增强方法
CN102915742B (zh) 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法
Chen et al. Speech enhancement by sparse, low-rank, and dictionary spectrogram decomposition
CN103578477B (zh) 基于噪声估计的去噪方法和装置
CN103117067B (zh) 一种低信噪比下语音端点检测方法
CN104505100B (zh) 一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法
CN103531204A (zh) 语音增强方法
CN103544961B (zh) 语音信号处理方法及装置
CN105489226A (zh) 一种用于拾音器的多窗谱估计的维纳滤波语音增强方法
CN109378013A (zh) 一种语音降噪方法
CN102637438B (zh) 一种语音滤波方法
CN103594093A (zh) 基于信噪比软掩蔽语音增强方法
CN103400578B (zh) 谱减与动态时间规整算法联合处理的抗噪声声纹识别装置
CN104240717A (zh) 基于稀疏编码和理想二进制掩膜相结合的语音增强方法
Meduri et al. A survey and evaluation of voice activity detection algorithms
Wei et al. A novel prewhitening subspace method for enhancing speech corrupted by colored noise
Sun et al. An eigenvalue filtering based subspace approach for speech enhancement
Lai et al. Evaluation of generalized maximum a posteriori spectral amplitude (GMAPA) speech enhancement algorithm in hearing aids
Chen et al. Speech enhancement by low-rank and convolutive dictionary spectrogram decomposition
Han et al. Perceptual improvement of deep neural networks for monaural speech enhancement
Khalil et al. Enhancement of speech signals using multiple statistical models
Cao et al. Study on speech endpoint detection algorithm based on wavelet energy entropy
Pardede et al. Q-Gaussian based spectral subtraction for robust speech recognition
Ou et al. Soft decision based Laplacian model factor estimation for noisy speech enhancement
Shi et al. A speech endpoint detection algorithm based on BP neural network and multiple features

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130717

Termination date: 20160323