CN104810023B - 一种用于语音信号增强的谱减法 - Google Patents
一种用于语音信号增强的谱减法 Download PDFInfo
- Publication number
- CN104810023B CN104810023B CN201510268387.3A CN201510268387A CN104810023B CN 104810023 B CN104810023 B CN 104810023B CN 201510268387 A CN201510268387 A CN 201510268387A CN 104810023 B CN104810023 B CN 104810023B
- Authority
- CN
- China
- Prior art keywords
- spectrum
- signal
- noise
- subtraction
- snr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
本发明一种用于语音信号增强的谱减法,涉及语音增强技术领域,步骤是:被减项加权值处理;功率谱修正处理;得出基于修正参数的改进谱减法公式;自动控制最优参数选择;平滑处理。本发明是一种基于参数自适应的改进谱减法,克服了采用现有的谱减法增强处理后的信号会残留比较多的噪声的缺陷。
Description
技术领域
本发明的技术方案涉及语音增强技术领域,具体地说是一种用于语音信号增强的谱减法。
背景技术
语音信号无法避免地会受到来自周遭环境和传输媒介带来的噪声,通信设备内部的电噪声,甚至说话人自身的干扰。所以,必须在语音信号应用系统前端加入语音增强环节,对信号进行去噪预处理,从而增强系统的抗干扰能力。
语音增强技术是语音信号处理中的核心技术之一。语音增强,就是通过消除背景噪声从而提高信噪比,进而可以提高语音信号的清晰度、可懂度以及舒适度。
语音增强的目的是提高语音质量,这就需要在降噪和语音失真之间找到一个最好的权衡点。许多学者提出了语音增强的方法。EMD算法是把信号分解为基本模式分量之和,当满足终止条件时,分解结束,达到了一定的增强效果。但是由于IMF定义十分严格,导致分解次数增多从而分解复杂度大幅度提升。2013年,Hadi Veisi和Hossein Sameti将HMM应用在Mel频域来增强语音,提出了平行的倒谱和谱模型来改善语音从频域到Mel频域引起的失真,该方法对非平稳噪声干扰下的语音增强效果很好,但是该方法复杂度较高。
在语音增强领域,基本谱减法是一经典方法,计算量小,容易实现且便于实时处理。基本谱减法最初由美国学者Steven Boll于提出,主要思想是利用人耳对于信号相位的不敏感特点,用带噪语音的相位代替纯净语音相位。通过用带噪语音信号的频谱减去噪声的频谱,将两者相减的结果当成是增强后的信号频谱,然后与带噪语音信号的相位结合,最终得到增强后的信号。基本原理如下:
其中,Y(ω)代表带噪语音信号,λn(ω)代表噪声段的统计平均值,代表增强后语音信号。
基本谱减法的基本原理是假设加性噪声信号和语音信号独立性的前提下,将带噪语音的频谱与噪声信号的频谱作差,最终获得增强后语音信号的频谱。谱减法突出的优点是算法计算量比较小,运算量比较低,计算复杂度很低,并且适用于实时处理的场景。但是,现有的谱减法技术仍然存在如下的不足:采用现有的谱减法增强处理后的信号会残留比较多的噪声,因为有一定的节奏感,所以又称为“音乐噪声”。在估计噪声谱的过程中,信息估计是有误差的,这是产生音乐噪声的主要原因。产生“音乐噪声”的元音与噪声信号的特点有关,因为其符合高斯分布,幅度随机变化的范围较宽。所以当引用无语音期间噪声统计方差表示噪声时,会残留一部分较大的噪声,在频谱上表现为随机凸起。
发明内容
本发明所要解决的技术问题是:提供一种用于语音信号增强的谱减法,是一种基于参数自适应的改进谱减法,克服了采用现有的谱减法增强处理后的信号会残留比较多的噪声的缺陷。
本发明解决该技术问题所采用的技术方案是:一种用于语音信号增强的谱减法,步骤如下:
第一步,被减项加权值处理:
在进行噪声谱相减时,减去β|λn(ω)|2,β>1,经过如此被减项加权值处理得到改进后的谱减法公式如下:
其中,代表增强后语音信号,Y(ω)代表带噪语音信号,λn(ω)代表噪声段的统计平均值,β代表谱减噪声系数,β>1;
第二步,功率谱修正处理:
结合功率谱减法中频谱的平方计算与幅度谱减法中频谱的一次方计算,将其改进为由系数灵活控制的|·|α以及|·|1/α,经过如此功率谱修正处理得出修正后的功率谱为:
其中,代表增强后语音信号,Y(ω)代表带噪语音信号,λn(ω)代表噪声段的统计平均值,α代表谱减功率修正系数;
第三步,得出基于修正参数的改进谱减法公式:
结合以上第一步的被减项加权值处理和第二步的功率谱修正处理方法,得出基于修正参数的改进谱减法公式如下:
其中,代表增强后语音信号,Y(ω)代表带噪语音信号,λn(ω)代表噪声段的统计平均值,α表示谱减功率修正系数,β代表谱减噪声系数;
第四步,自动控制最优参数选择:
在不同的带噪信号输入信噪比SNRi条件下,首先以增强后语音信号的信噪比SNRo为输出,以变化的谱减功率修正系数α和谱减噪声系数β为输入,改变输入参数值,自动控制选择使得输出达到增强后语音信号的信噪比的最优值SNRoB时的输入最优参数为αB和βB,并且将选择的最优参数αB和βB与此时的带噪语音输入信噪比SNRi相匹配,应用时,则通过计算带噪信号的输入信噪比SNRi,控制语音增强系统中最优参数αB和βB的选择,自动控制最优参数选择的系统公式如下:
其中,αB表示最优谱减功率修正系数,βB表示最优谱减噪声系数,SNRi表示与最优参数匹配的输入信噪比,SNRo表示增强后的输出信噪比;
第五步,平滑处理:
通过对比原始语音波形,带噪语音波形以及增强语音波形,发现增强语音波形虽然已经十分接近纯净语音波形,进一步通过对增强后的语音进行时域内的平滑处理,选取五点三次的平滑处理方法如下:
五点三次平滑处理结合所求点周围采样点的幅度值对所求点幅度进行加权修正,最终实现信号波形的平滑去噪,平滑处理公式表示:
式中,y表示平滑处理后数据,x表示原采样数据,m表示数据点数,N表示平均的点数,h表示权值因子,其中加权平均因子满足:
五点三次的平滑处理方法是通过运用最小二乘法原理对采样数据进行三次最小二乘多项式平滑处理,五点三次平滑法的公式如下:
式中:i=3,4,…,m-2,
通过上述对增强后的语音进行时域内的平滑处理,使得增强后的语音与纯净语音具有更进一步的相似性;
上述步骤中所用到的硬件设备包括供电设备、麦克风、数据采集卡和PC上位机。
上述一种用于语音信号增强的谱减法,所述以增强后语音信号的信噪比SNRo为输出,以变化的谱减功率修正系数α和谱减噪声系数β为输入,改变输入参数值,自动控制选择使得输出达到增强后语音信号的信噪比的最优值SNRoB时的输入最优参数为αB和βB的过程,是通过绘制输出信噪比SNRo、谱减功率修正系数α和谱减噪声系数β的三维曲线图,从中寻找最大值的坐标值实现的,具体方法如下:
带噪信输入信噪比SNRi取值范围-15dB-20dB,当谱减功率修正系数α和谱减噪声系数β变化时,增强后语音信号的信噪比SNRo随之变化,其中,x轴、y轴和z轴分别代表谱减功率修正系数α、谱减噪声系数β以及增强后的输出信噪比SNRo,由所作的三维曲线图可得,当α和β变化时,存在一组αB和βB,使得SNRo取得最大值SNRoB,此αB和βB即为最优参数。
本发明的有益效果是:与现有的谱减法相比,本发明具有的突出的实质性特点和显著进步如下:
(1)本发明在基本谱减法原理基础上,提出了基于参数自适应的改进谱减法,引进被减项权值处理与功率谱修正处理,以增强后语音信号的信噪比为输出,以变化的谱减功率系数和谱减噪声系数为输入,自动控制选择最优参数,并且将其与带噪语音输入信噪比相匹配。对信号进行语音增强时,通过计算其输入信噪比,利用最优参数曲线得到最优参数值,然后结合平滑处理的过程实现语音增强最大化。这种处理使得改进后的谱减法具有了更好的适应性。
(2)通过参数自适应的方法,引入最优参数的控制,实现了谱减功率修正系数和谱减噪声系数的优化,如此的改进方式,首先能够更好地显现语音信号谱,并且抑制背景噪声,提高增强算法的降噪性能;其次,在语音信号谱中宽带噪声残留变少,在人耳感知上能够更好的掩蔽背景噪声,克服了采用现有的谱减法增强处理后的信号会残留比较多的噪声的缺陷。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1为本发明谱减法步骤示意框图。
图2为本发明谱减法所用硬件设备连接图。
图3为本发明谱减法中的输出信噪比SNRo、谱减功率修正系数α和谱减噪声系数β的参数选择三维曲线图。
图4为本发明谱减法中的最优参数拟合曲线图。
图5(a)为原始的带噪语音波形图。
图5(b)为采用幅度谱减法增强后语音波形图。
图5(c)为采用功率谱减法增强后语音波形图。
图5(d)为采用本发明谱减法增强后语音波形图。
图6(a)为原始的带噪语音语谱图。
图6(b)为采用幅度谱减法增强后语音语谱图。
图6(c)为采用功率谱减法增强后语音语谱图。
图6(d)为采用本发明谱减法增强后语音语谱图。
图7为三种谱减法输出信噪比的变化曲线图。
图中,1.供电设备,2.麦克风,3.数据采集卡,4.PC上位机。
具体实施方式
图1所示实施例表明,本发明谱减法步骤是:被减项加权值处理→功率谱修正处理→得出基于修正参数的改进谱减法公式→自动控制最优参数选择→平滑处理。
图2所示实施例表明,本发明谱减法所用到的硬件设备主要包括以下几个部分:供电设备1为MC104、麦克风2为北京声望声电技术有限公司生产的MPA201传声器,其直径是1.27cm,数据采集卡3为北京声望声电技术有限公司生产的NI9215A数据采集卡,PC上位机4为2.6GHz酷睿i5平台。所用到的硬件设备之间的连接方式是:供电设备1向其他设备提供电能,麦克风2采集的语音信号经数据采集卡3传递给PC上位机4进行处理。
图3所示实施例显示了本发明谱减法中的输出信噪比SNRo、谱减功率修正系数α和谱减噪声系数β的参数选择三维曲线。该曲线表明带噪信号输入信噪比SNRi=5dB,当谱减功率修正系数α,谱减噪声系数β变化时,增强后语音信号的信噪比SNRo随之变化。其中,x轴,y轴,z轴分别代表谱减功率修正系数α,谱减噪声系数β以及增强后的输出信噪比SNRo。由图3可得,当α,β变化时,存在一组αB和βB,使得SNRo取得最大值SNRoB。
本实施例选择的带噪信号输入信噪比SNRi取值范围-15dB-20dB,范围足够大。经过大量的实验仿真,得到当带噪信号输入信噪比SNRi变化时,最优参数αB和βB的数据变化。表1为最优参数αB,βB与输入信噪比SNRi的匹配表,其中给出部分数据。
表1.最优参数αB,βB与输入信噪比SNRi的匹配表
由上表可得,当输入信噪比发生变化时,最优参数αB和βB呈现出一定的规律变化,但是无法用简单的关系式来表达输入信噪比SNRi与最优谱减功率修正系数αB,以及输入信噪比与最优谱减噪声系数βB之间的关系。
图4所示实施例显示了本发明谱减法中的最优参数拟合曲线。采用曲线拟合,建立输入信噪比SNRi与最优参数αB和βB的关系式。根据对各种数学模型拟合后的性能分析,综合考虑误差平方和SSE以及应用时计算量大小,最终采用四阶多项式作为输入信噪比与最优参数α的数学关系式。
四阶多项式曲线拟合模型为:
f(x)=p1x4+p2x3+p3x2+p4x+p5
上式中p1,p2,p3,p4,p5为多项式系数,通过对多项式系数的调整,选择最优的数学模型。
得到输入信噪比SNRi与最优参数αB的函数关系表示:
αB=-1.747*10-6s4+6.703*10-5s3-5.266*10-4s2-1.155*10-2s+2.026
上式中,αB表示最优谱减功率修正系数,s表示带噪语音信号输入信噪比SNRi。
同理,得到输入信噪比SNRi与最优谱减噪声系数βB的函数关系为:
βB=-9.924*10-7s4+1.313*10-4s3-1.829*10-3s2-6.771*10-2s+2.877
上式中,βB表示最优谱减噪声系数,s表示带噪语音信号输入信噪比SNRi。
基于四阶多项式曲线拟合模型拟合之后的最优谱减功率修正系数αB曲线,以及最优谱减噪声系数βB曲线如图4所示,由图4可以看出,拟合效果比较理想,可以准确表征参数的特征。
图5(a)显示在采样点采集的原始带噪语音波形图,在SNRi=0dB噪声条件下,信号音节的端点位置不易辨认。
图5(b)显示原始带噪语音经过幅度谱减法处理之后,残留着一定量的噪声,影响语音质量。
图5(c)显示原始带噪语音经过功率谱减法处理之后,仍有许多波形上的凸起,残留较多噪声。
图5(d)显示,相对于幅度谱减法和功率谱减法而言,原始带噪语音经过本发明谱减法去噪效果最为显著,对语音信号的损失最小,基本恢复了原语音信号。
图6(a)显示在采样点采集的原始带噪语音语谱图,在SNRi=0dB时带噪语音信号噪声分布在各个频段,导致语音特征被大幅度淹没。
图6(b)显示原始带噪语音经过幅度谱减法处理之后,仍然残留较大噪声频谱分量。
图6(c)显示原始带噪语音经过功率谱减法处理之后,语音信号仍然不能和噪声很好得分离。
图6(d)显示,相对于幅度谱减法和功率谱减法而言,原始带噪语音经过本发明谱减法处理之后,对于信号性能恢复能力最强,噪声残留最少,语音增强性能最优。
图7显示了三种谱减法输出信噪比的变化曲线图。由图7可以看出,随着输入信噪比的增大,增强算法的输出信噪比随之增大,其中,功率谱减法增强效果最小,幅度谱减法相对较好,本发明谱减法增强效果最好。
本实施例选取的带噪信号输入信噪比全局变化范围为:-15dB~20dB。在不同输入信噪比情况下,用大量仿真实验测试样本语音信号使用基本谱减法和本发明改进后的基于最优参数选择的谱减法的语音增强效果。预处理时,对语音信号加汉明窗,窗长选择winsize=256,帧间重叠inc=128。语音数据为录制的语音“河工大”,采样频率fs=44100Hz。
针对语音增强算法的定性比较之后,下面给出定量分析。表2列出了SNRi=0dB,5dB,,10dB,15dB不同信噪比情况下,采用不同增强算法的输出信噪比SNRo。
表2.不同SNRi条件下,各种增强算法输出信噪比
实施例
本实施例的一种用于语音信号增强的谱减法步骤如下:
第一步,被减项加权值处理:
在进行噪声谱相减时,减去β|λn(ω)|2,β>1,经过如此被减项加权值处理得到改进后的谱减法公式如下:
其中,代表增强后语音信号,Y(ω)代表带噪语音信号,λn(ω)代表噪声段的统计平均值,β代表谱减噪声系数,β>1;
第二步,功率谱修正处理:
结合功率谱减法中频谱的平方计算与幅度谱减法中频谱的一次方计算,将其改进为由系数灵活控制的|·|α以及|·|1/α,经过如此功率谱修正处理得出修正后的功率谱为:
其中,代表增强后语音信号,Y(ω)代表带噪语音信号,λn(ω)代表噪声段的统计平均值,α代表谱减功率修正系数;
第三步,得出基于修正参数的改进谱减法公式:
结合以上第一步的被减项加权值处理和第二步的功率谱修正处理方法,得出基于修正参数的改进谱减法公式如下:
其中,代表增强后语音信号,Y(ω)代表带噪语音信号,λn(ω)代表噪声段的统计平均值,α表示谱减功率修正系数,β代表谱减噪声系数;
第四步,自动控制最优参数选择:
在不同的带噪信号输入信噪比SNRi条件下,首先以增强后语音信号的信噪比SNRo为输出,以变化的谱减功率修正系数α和谱减噪声系数β为输入,改变输入参数值,自动控制选择使得输出达到增强后语音信号的信噪比的最优值SNRoB时的输入最优参数为αB和βB,并且将选择的最优参数αB和βB与此时的带噪语音输入信噪比SNRi相匹配,应用时,则通过计算带噪信号的输入信噪比SNRi,控制语音增强系统中最优参数αB和βB的选择,自动控制最优参数选择的系统公式如下:
其中,αB表示最优谱减功率修正系数,βB表示最优谱减噪声系数,SNRi表示与最优参数匹配的输入信噪比,SNRo表示增强后的输出信噪比;
第五步,平滑处理:
通过对比原始语音波形,带噪语音波形以及增强语音波形,发现增强语音波形虽然已经十分接近纯净语音波形,进一步通过对增强后的语音进行时域内的平滑处理,选取五点三次的平滑处理方法如下:
五点三次平滑处理结合所求点周围采样点的幅度值对所求点幅度进行加权修正,最终实现信号波形的平滑去噪,平滑处理公式表示:
式中,y表示平滑处理后数据,x表示原采样数据,m表示数据点数,N表示平均的点数,h表示权值因子,其中加权平均因子满足:
五点三次的平滑处理方法是通过运用最小二乘法原理对采样数据进行三次最小二乘多项式平滑处理,五点三次平滑法的公式如下:
式中:i=3,4,…,m-2,
通过上述对增强后的语音进行时域内的平滑处理,使得增强后的语音与纯净语音具有更进一步的相似性;
本实施例谱减法所用到的硬件设备主要包括以下几个部分:供电设备1为MC104、麦克风2为北京声望声电技术有限公司生产的MPA201传声器,其直径是1.27cm,数据采集卡3为北京声望声电技术有限公司生产的NI9215A数据采集卡,PC上位机4为2.6GHz酷睿i5平台。所用到的硬件设备之间的连接方式是:供电设备1向其他设备提供电能,麦克风2采集的语音信号经数据采集卡3传递给PC上位机4进行处理。
本实施例一种用于语音信号增强的谱减法,所述以增强后语音信号的信噪比SNRo为输出,以变化的谱减功率修正系数α和谱减噪声系数β为输入,改变输入参数值,自动控制选择使得输出达到增强后语音信号的信噪比的最优值SNRoB时的输入最优参数为αB和βB的过程如上述图3所示实施例。
Claims (2)
1.一种用于语音信号增强的谱减法,其特征在于步骤如下:
第一步,被减项加权值处理:
在进行噪声谱相减时,减去β|λn(ω)|2,β>1,经过如此被减项加权值处理得到改进后的谱减法公式如下:
其中,代表增强后语音信号,Y(ω)代表带噪语音信号,λn(ω)代表噪声段的统计平均值,β代表谱减噪声系数,β>1;
第二步,功率谱修正处理:
结合功率谱减法中频谱的平方计算与幅度谱减法中频谱的一次方计算,将其改进为由系数灵活控制的|·|α以及|·|1/α,经过如此功率谱修正处理得出修正后的功率谱为:
其中,代表增强后语音信号,Y(ω)代表带噪语音信号,λn(ω)代表噪声段的统计平均值,α代表谱减功率修正系数;
第三步,得出基于修正参数的改进谱减法公式:
结合以上第一步的被减项加权值处理和第二步的功率谱修正处理方法,得出基于修正参数的改进谱减法公式如下:
其中,代表增强后语音信号,Y(ω)代表带噪语音信号,λn(ω)代表噪声段的统计平均值,α表示谱减功率修正系数,β代表谱减噪声系数;
第四步,自动控制最优参数选择:
在不同的带噪信号输入信噪比SNRi条件下,首先以增强后语音信号的信噪比SNRo为输出,以变化的谱减功率修正系数α和谱减噪声系数β为输入,改变输入参数值,自动控制选择使得输出达到增强后语音信号的信噪比的最优值SNRoB时的输入最优参数为αB和βB,并且将选择的最优参数αB和βB与此时的带噪语音输入信噪比SNRi相匹配,应用时,则通过计算带噪信号的输入信噪比SNRi,控制语音增强系统中最优参数αB和βB的选择,自动控制最优参数选择的系统公式如下:
其中,αB表示最优谱减功率修正系数,βB表示最优谱减噪声系数,SNRi表示与最优参数匹配的输入信噪比,SNRo表示增强后的输出信噪比;
第五步,平滑处理:
通过对比原始语音波形,带噪语音波形以及增强语音波形,发现增强语音波形虽然已经十分接近纯净语音波形,进一步通过对增强后的语音进行时域内的平滑处理,选取五点三次的平滑处理方法如下:
五点三次平滑处理结合所求点周围采样点的幅度值对所求点幅度进行加权修正,最终实现信号波形的平滑去噪,平滑处理公式表示:
式中,y表示平滑处理后数据,x表示原采样数据,m表示数据点数,N表示平均的点数,h表示权值因子,其中加权平均因子满足:
五点三次的平滑处理方法是通过运用最小二乘法原理对采样数据进行三次最小二乘多项式平滑处理,五点三次平滑法的公式如下:
式中:i=3,4,…,m-2,
通过上述对增强后的语音进行时域内的平滑处理,使得增强后的语音与纯净语音具有更进一步的相似性;
上述步骤中所用到的硬件设备包括供电设备、麦克风、数据采集卡和PC上位机。
2.根据权利要求1所述一种用于语音信号增强的谱减法,其特征在于:所述以增强后语音信号的信噪比SNRo为输出,以变化的谱减功率修正系数α和谱减噪声系数β为输入,改变输入参数值,自动控制选择使得输出达到增强后语音信号的信噪比的最优值SNRoB时的输入最优参数为αB和βB的过程,是通过绘制输出信噪比SNRo、谱减功率修正系数α和谱减噪声系数β的三维曲线图,从中寻找最大值的坐标值实现的,具体方法如下:
带噪信号输入信噪比SNRi取值范围-15dB-20dB,当谱减功率修正系数α和谱减噪声系数β变化时,增强后语音信号的信噪比SNRo随之变化,其中,x轴、y轴和z轴分别代表谱减功率修正系数α、谱减噪声系数β以及增强后的输出信噪比SNRo,由所作的三维曲线图可得,当α和β变化时,存在一组αB和βB,使得SNRo取得最大值SNRoB,此αB和βB即为最优参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510268387.3A CN104810023B (zh) | 2015-05-25 | 2015-05-25 | 一种用于语音信号增强的谱减法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510268387.3A CN104810023B (zh) | 2015-05-25 | 2015-05-25 | 一种用于语音信号增强的谱减法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104810023A CN104810023A (zh) | 2015-07-29 |
CN104810023B true CN104810023B (zh) | 2018-06-19 |
Family
ID=53694810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510268387.3A Active CN104810023B (zh) | 2015-05-25 | 2015-05-25 | 一种用于语音信号增强的谱减法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104810023B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108899052B (zh) * | 2018-07-10 | 2020-12-01 | 南京邮电大学 | 一种基于多带谱减法的帕金森语音增强方法 |
CN113257262A (zh) * | 2021-05-11 | 2021-08-13 | 广东电网有限责任公司清远供电局 | 一种语音信号处理方法、装置、设备及存储介质 |
CN117711419B (zh) * | 2024-02-05 | 2024-04-26 | 卓世智星(成都)科技有限公司 | 用于数据中台的数据智能清洗方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101980336A (zh) * | 2010-10-18 | 2011-02-23 | 福州星网视易信息系统有限公司 | 一种基于隐马尔可夫模型的汽车声音识别方法 |
CN103440869A (zh) * | 2013-09-03 | 2013-12-11 | 大连理工大学 | 一种音频混响的抑制装置及其抑制方法 |
CN103594094A (zh) * | 2012-08-15 | 2014-02-19 | 王景芳 | 自适应谱减法实时语音增强 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100640865B1 (ko) * | 2004-09-07 | 2006-11-02 | 엘지전자 주식회사 | 음성 품질 향상 방법 및 장치 |
EP1878012A1 (en) * | 2005-04-26 | 2008-01-16 | Aalborg Universitet | Efficient initialization of iterative parameter estimation |
-
2015
- 2015-05-25 CN CN201510268387.3A patent/CN104810023B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101980336A (zh) * | 2010-10-18 | 2011-02-23 | 福州星网视易信息系统有限公司 | 一种基于隐马尔可夫模型的汽车声音识别方法 |
CN103594094A (zh) * | 2012-08-15 | 2014-02-19 | 王景芳 | 自适应谱减法实时语音增强 |
CN103440869A (zh) * | 2013-09-03 | 2013-12-11 | 大连理工大学 | 一种音频混响的抑制装置及其抑制方法 |
Non-Patent Citations (2)
Title |
---|
平滑处理在频谱分析中的应用研究与实现;钟文峰 等;《智能计算机与应用》;20130630;第3卷(第3期);第72-74页 * |
振动信号预处理方法研究及其MATLAB实现;肖立波 等;《计算机仿真》;20100831;第27卷(第8期);第330-333、337页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104810023A (zh) | 2015-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110619885B (zh) | 基于深度完全卷积神经网络的生成对抗网络语音增强方法 | |
CN103827965B (zh) | 自适应语音可理解性处理器 | |
CN103650040B (zh) | 使用多特征建模分析语音/噪声可能性的噪声抑制方法和装置 | |
CN108831499A (zh) | 利用语音存在概率的语音增强方法 | |
CN103578477B (zh) | 基于噪声估计的去噪方法和装置 | |
Verteletskaya et al. | Noise reduction based on modified spectral subtraction method | |
CN103700375B (zh) | 语音降噪方法及其装置 | |
CN104810023B (zh) | 一种用于语音信号增强的谱减法 | |
CN110136709A (zh) | 语音识别方法及基于语音识别的视频会议系统 | |
CN110808057A (zh) | 一种基于约束朴素生成对抗网络的语音增强方法 | |
Luo et al. | Supervised monaural speech enhancement using complementary joint sparse representations | |
CN102314883B (zh) | 一种判断音乐噪声的方法以及语音消噪方法 | |
CN102637438B (zh) | 一种语音滤波方法 | |
CN103971697B (zh) | 基于非局部均值滤波的语音增强方法 | |
Rao et al. | Speech enhancement using sub-band cross-correlation compensated Wiener filter combined with harmonic regeneration | |
Goel et al. | Developments in spectral subtraction for speech enhancement | |
CN113066483B (zh) | 一种基于稀疏连续约束的生成对抗网络语音增强方法 | |
Jameel et al. | Noise robust formant frequency estimation method based on spectral model of repeated autocorrelation of speech | |
Jia et al. | Speech enhancement using modified mmse-lsa and phase reconstruction in voiced and unvoiced speech | |
Liu et al. | Speech enhancement based on the integration of fully convolutional network, temporal lowpass filtering and spectrogram masking | |
Li et al. | Robust log-energy estimation and its dynamic change enhancement for in-car speech recognition | |
Baek et al. | Mean normalization of power function based cepstral coefficients for robust speech recognition in noisy environment | |
CN110415729A (zh) | 语音活动检测方法、装置、介质和系统 | |
Wu et al. | Robust speech recognition by selecting mel-filter banks | |
Mao et al. | An improved iterative wiener filtering algorithm for speech enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |