CN104240717A - 基于稀疏编码和理想二进制掩膜相结合的语音增强方法 - Google Patents

基于稀疏编码和理想二进制掩膜相结合的语音增强方法 Download PDF

Info

Publication number
CN104240717A
CN104240717A CN201410476932.3A CN201410476932A CN104240717A CN 104240717 A CN104240717 A CN 104240717A CN 201410476932 A CN201410476932 A CN 201410476932A CN 104240717 A CN104240717 A CN 104240717A
Authority
CN
China
Prior art keywords
signal
voice signal
dictionary
mask
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410476932.3A
Other languages
English (en)
Other versions
CN104240717B (zh
Inventor
汤一彬
王小凡
孙娟
蒋爱民
徐宁
殷澄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Campus of Hohai University
Original Assignee
Changzhou Campus of Hohai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Campus of Hohai University filed Critical Changzhou Campus of Hohai University
Priority to CN201410476932.3A priority Critical patent/CN104240717B/zh
Publication of CN104240717A publication Critical patent/CN104240717A/zh
Application granted granted Critical
Publication of CN104240717B publication Critical patent/CN104240717B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种基于稀疏编码和理想二进制掩膜相结合的语音增强方法,其是针对于传统的理想二进制掩膜算法存在噪声残留和语音成分丢失的缺陷进行改进的算法。本发明首先利用短时傅里叶变换将时域语音信号转换到频域信号,在频域中,采用理想二进制掩膜方法对语音信号进行初步降噪处理;然后采用稀疏编码理论对初步降噪后的语音信号做进一步降噪处理,同时从被认为是干扰信号中提取有效的语音成分,从而达到语音增强的效果。与相关技术相比,本发明具有去噪性能好,语音的可理解性高等优点。

Description

基于稀疏编码和理想二进制掩膜相结合的语音增强方法
技术领域
本发明涉及一种稀疏编码和理想二进制掩膜的语音增强方法,具体涉及到基于理想二进制掩膜算法和字典学习的信号稀疏表示的语音处理技术。
背景技术
语音增强技术,简单的说就是一种当纯净的语音信号被各种各样的噪声干扰、甚至淹没后,抑制、降低噪声干扰,从噪声背景中提取有用的语音信号的技术。这些噪声主要包括背景噪声、混响、其他人说话声等干扰信号,它不仅会降低语音的质量和可懂度,而且会导致语音信号在其他应用中的退化。因而,有效的进行语音增强是非常有必要的。
具有代表性的传统的语音增强算法包括谱减法、理想二进制掩膜法(IBM)、维纳滤波法、最小误差估计法等等,但这些典型的算法也存在一些缺陷。例如,谱减法虽然复杂度比较低,易于实现,但增强后的语音信号往往存在着影响听觉效果的音乐噪声;理想二进制掩膜算法(IBM)虽然可以在一定程度上去除噪声,但其存在语音信号丢失和残留部分噪声等问题。
在信号处理方面,信号稀疏表示和重构理论是近几年出现的新兴的信号表示手段,目前已有效用于图像处理、语音信号处理等方面。语音信号处理方面包括语音分割、语音降噪和语音识别等。信号稀疏表示和重构理论不要求精确的恢复原始数据,而是在一定的基集(字典)空间中依照某种准则寻找最少个数的稀疏系数在最大程度上逼近原始数据,实现数据重构。
发明内容
发明目的:为了克服现有技术IBM算法存在的不足,本发明提供一种基于稀疏编码和理想二进制掩膜相结合的语音增强方法。即针对传统的理想二进制掩膜(IBM)存在语音信号丢失和残留部分噪声等缺陷,本发明将信号稀疏编码理论和理想二进制掩膜算法相结合来获得可理解性更高的语音信号。主要体现在:一是将IBM处理后的语音信号Sr中包含的噪声进一步剔除;二是从干扰信号Vr中提取有效的语音成分,从而达到语音增强的效果,提高语音信号的可理解性。
技术方案:为实现上述目的,本发明采用的技术方案为:
基于稀疏编码和理想二进制掩膜算法相结合的语音增强方法,针对传统的理想二进制掩膜(IBM)算法的缺陷,首先利用理想的二进制掩膜算法(IBM)对信号功率谱进行初步降噪处理;其次通过稀疏编码对初步处理后的信号做进一步处理,从而实现语音增强的效果;具体包含以下步骤:
(1)将时域信号转换为频域信号;
(2)采用理想二进制掩膜算法(IBM)对语音信号功率谱进行初步降噪处理;
(3)利用稀疏编码理论对初步处理后的信号作进一步降噪处理,同时从被认为是干扰信号中提取有效的语音成分;
(4)由于人耳对相位信息不敏感的特性,因而采用语音信号的初始相位信息恢复出频域信号,进而对其进行反傅里叶变换,得到增强后的目标语音信号。
所述步骤(1)中的域变换的工作过程包括如下步骤:
(a1)对语音信号进行较短的固定时长的分帧;
(a2)对每一帧作快速傅里叶变换(FFT),并保存初始相位。
所述步骤(2)的工作过程包括如下步骤:
(b1)根据语音信号受污染的程度,选定一个阈值;
(b2)计算出每一个时频点的信噪比,若该时频点的信噪比大于选定的阈值,则掩膜中相应位置的元素为1;反之,该元素为0;
(b3)将时频信号和掩膜进行点乘,即可得到经过理想二进制掩膜算法初步处理后的语音信号Sr
(b4)将时频信号和掩膜的逻辑逆矩阵进行点乘,即可得到在IBM算法中被认为是噪声的干扰信号Vr
所述步骤(3)的工作过程包括如下步骤:
(c1)根据稀疏理论,将步骤(b3)中初步处理后的语音信号Sr作训练样本,采用K-SVD算法训练出语音信号字典Ds以及相对应的稀疏系数Xe
(c2)根据稀疏理论,将步骤(b4)中的干扰信号Vr作训练样本,同样采用K-SVD算法训练出干扰信号字典Dv以及采用正交匹配算法(OMP)计算出该字典相应的稀疏系数Xv
(c3)由于(c2)中的训练样本Vr主要是干扰信号,所以我们将用(c2)训练出的字典Dv表示步骤(2)中语音信号Sr
(c4)依据原子表示语音信号的比例,将字典Dv中的原子进行排序;
(c5)将前5%的原子组成一个新的字典D′v,该字典组要用于提取干扰信号Vr中包含的语音信号;字典Dv中其余原子组成字典D′v
(c6)由于在稀疏理论中,字典都是冗余的,故字典D′s与字典D′v表示的空间存在重叠。因而,字典D′s与字典D′v进行正交,正交后的字典标记为D″s
所述步骤(4)的工作过程包括如下步骤:
(d1)按照字典D″s、D′v的原子位置,将稀疏系数Xv中相应的系数组成新的稀疏系数并标记为Xe和Xv,进而进行语音信号重构;
(d2)由于人耳对相位信息的不敏感特性,我们采用步骤(2)获取的语音信号相位作为目标语音信号相位,进而合成出语音信号;
(d3)将(d2)中的语音信号作反离散傅里叶变换(IFFT),将分帧的信号合成目标语音信号。
本发明所达到的有益效果:
本发明提供的基于稀疏编码和理想二进制掩膜算法相结合的语音增强方法,针对理想二进制掩膜算法存在的理论缺陷,充分利用稀疏编码理论的学习特性,从两个方面来提高语音信号的可理解性。一方面采用稀疏编码对理想二进制掩膜算法处理后的语音信号进一步降噪;另一方面采用稀疏编码从IBM算法初步获取的干扰信号中提取出语音信号成分。从而最终能够有效提高目标语音信号质量,达到语音增强的效果。
附图说明
图1是本发明语音增强编码框架图;
图2是本发明语音信号采用理想二进制掩膜算法(IBM)进行初步处理阶段编码框架图;
图3是本发明信号采用稀疏编码与重构理论精细处理阶段编码框架图;
图4是对男声语音增强进行语谱比较图;
图5是对女声语音增强进行语谱比较图。
具体实施方式
下面结合附图,对本发明的稀疏编码和理想二进制掩膜算法相结合的语音增强方法作进一步阐述。
本发明设计的语音增强编码框架如图1所示,语音信号首先通过理想二进制掩膜算法(IBM)作初步去噪处理,随后通过稀疏理论进行精细语音提取和精细去噪处理,最终实现重构目标语音信号。
参见图2、图3分别提供了本发明所述的理想二进制掩膜算法处理和稀疏编码处理结构示意图。
图2的理想二进制掩膜算法处理框图中语音信号(8kHz采样率)首先以32ms为一帧进行分帧,帧间重叠75%,然后进行离散傅里叶变换(FFT)计算求解功率谱,本文用512点的FFT求解其功率谱,并保存其相位。然后根据语音强度选定阈值,并计算出功率谱上每一个时频点的信噪比SNR,根据选定的阈值进行判断,即对信噪比SNR大于选定的阈值时,该时频点的信号被认为是语音信号;反之,则认为是干扰信号。公式表示为:
M c , n = 1 , if | S c , n | > | V c , n | 0 , otherwise - - - ( 1 )
S c , n r = S c , n + V c , n , if M c , n = 1 0 , otherwise - - - ( 2 )
V c , n r = 0 , if M c , n = 1 S c , n + V c , n , otherwise - - - ( 3 )
式(1)中,Mc,n为IBM的掩膜矩阵M在时间c和频率n处元素值,Sc,n和Vc,n分别为在该时频点处实际包含的语音信号和干扰信号,分别表示该时频点处,经过理想二进制掩膜算法处理所获得的语音信号和干扰信号。从式(2)中可知,在一个时频点上,若此时的语音信号大于噪声信号,即Mc,n=1,则在该点上的信号将被认为是语音信号而保留,但此时的信号并不全是语音信号,其中包含一定噪声信号;同理,从式(3)中可知,若此时的语音信号不大于噪声信号,即Mc,n=0,此时在该点上信号则被当作噪声信号而丢弃,但丢弃的信号中包含一定的语音信号成分。
图3的稀疏编码框架图中对语音信号Sr和干扰信号Vr进行稀疏分解,可以采用K-SVD算法训练字典和OMP算法计算出字典相应稀疏系数,一般可由下式表示:
( D s , X n e ) = arg min Σ n ( | | S n r - M n ⊗ D s X n e | | 2 + α | | X n e | | 0 ) - - - ( 4 )
( D v , X n v ) = arg min Σ n ( | | V n r - M ‾ n ⊗ D v X n v | | 2 + α | | X n v | | 0 ) - - - ( 5 )
式(4)和式(5)中,所有符号下标n表示该符号所表示的矩阵的第n列,||·||2和||·||0分别为l2范数和l0范数,Ds和Dv为Sr和Vr训练出的字典,分别为字典Ds和Dv相应的稀疏系数,为点乘符号,α为拉格朗日乘子,Mn为掩膜矩阵M的第n列向量,是Mn的逻辑逆向量。其次,对于语音信号Sr中频率为n的精确的语音成分可通过下式进行重构:
S n e = M n ⊗ D s X n e - - - ( 6 )
在式(5)中,由于字典Dv是样本Vr训练出来的,但Vr主要信号为噪声,即其中部分原子也可以用来表示噪声。为尽可能提取出的信号为语音信号成分,字典Dv被用来表示语音信号Sr,公式表示为:
X ~ n e = arg min | | S n e - M n ⊗ D v X ~ n e | | 2 + α | | X ~ n e | | 0 - - - ( 7 )
式(7)中为用字典Dv表示语音信号相对应的稀疏系数。Dv中能够最大化表示语音信号Sr的前百分之五的原子组成新的字典D′s,其余原子组成字典D′v。由于字典Dv是冗余的,即字典D′v与D′s所表示的空间存在重叠,字典D′s与D′v进行正交化后被标记为D″s。因此,字典Dv能够表示为Dv=[D″sD′v]。综上所述,从干扰信号Vr中提取语音信号的公式可表示为:
( X n e ′ , X n v ′ ) = arg min | | V n r - M ‾ n ⊗ D s ′ ′ D v ′ X n e ′ X n v ′ | | 2 + α | | X n e ′ | | 0 + α | | X n v ′ | | 0 - - - ( 8 )
式(8)中,为字典D″s和D′v相应的稀疏系数。干扰信号Vr中的语音信号重构可表示为:
S n e = M ‾ n ⊗ D s ″ X n e ′ - - - ( 9 )
根据上述方法从Sr和Vr提取出的语音信号为,可将理想二进制掩膜算法(IBM)公式修正为:
S n e = M n ⊗ D s X n e , if M c , n = 1 M ‾ ⊗ D s ′ ′ X n e ′ , otherwise - - - ( 10 )
本发明的效果可以通过以下实验进一步说明:
1)实验条件
本实验采用TIMIT语音库中语音作为实验数据,语音采样速率为8kHz,语音帧长为32ms,帧移位8ms,频谱分析采用512点的快速傅里叶变换。采用Matlab R2011b作为仿真工具,计算机配置为Intel酷睿i3-2350/2G。
2)实验内容
利用传统的理想二进制掩膜算法(IBM)和稀疏编码理论相结合对语音进行去噪,从而来提高语音的可理解度。首先,将语音信号从时域转换到频域;然后利用传统的理想二进制掩膜算法对含噪语音信号进行初步去噪;进而再利用稀疏编码进一步去噪和提取在理想二进制掩膜算法丢失的语音成分;最后合成目标语音信号。
首先,分别对男女声语音增强进行语谱图比较,结果如图4、图5所示。其中图4(a)为男生的干净语音信号,图4(b)是受到白噪声污染的语音信号,信噪比为10dB,图4(c)为经过IBM算法处理后的语音信号,图4(d)是经本发明处理后的语音信号。语音质量的评定采用语音感受质量评估(PESQ)为客观评价指标,经过IBM处理后的语音信号的PESQ值为3.459,而经过本发明增强后的语音信号的PESQ值为3.664。图5(a)为来自女生的干净的语音信号,图5(b)是受到嘈杂噪声污染的语音信号,信噪比为0dB,图5(c)为经过IBM算法增强后的语音信号,图5(d)是经本发明处理后的语音信号。此时经IBM处理后的语音信号的PESQ值为3.256,而经过本发明增强后的语音信号的PESQ值为3.689。
为进一步验证本发明的有效性,分别用白噪声、工厂噪声、嘈杂噪声、粉红噪声四种噪声进行测试,即1000秒的干净语音信号分别受到不同信噪比(0dB、5dB、10dB、15dB)的四种噪声的污染。与此同时,分别采用传统的维纳滤波、理想二进制掩膜算法以及本发明所提算法进行处理。经统计得出上述三种算法的增强效果如表1。
表1三种算法的增强效果
3)实验结果分析
从图4和图5中可见,在干净语音受到信噪比为10dB和0dB的白噪声和嘈杂噪声污染时,相对于传统的理想二进制掩膜算法,本发明能够更加完整的提取语音成分和去除噪声,从而达到更好的语音增强效果。而从表1的统计结果可知,相对于前两种算法,本发明对白噪声、工厂噪声、嘈杂噪声、粉红噪声等在不同强度的噪声环境下都具有更好的增强效果,PESQ的值都有一定程度的提高。从表1中还可知,四种噪声相比较而言,本发明对于白噪声能够取得相对比较好的增强效果,这主要是由于白噪声在频域中具有的相同的功率分布,即白噪声不能进行有效的稀疏表示;对粉红噪声的增强效果稍差,其原因在于粉红噪声在低频段具有较高能量,相对集中的能量分布,也即意味着该噪声在频域具有一定的稀疏性,从而对本发明的算法性能具有一定的干扰。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (5)

1.一种基于稀疏编码和理想二进制掩膜相结合的语音增强方法,其特征在于:首先利用理想的二进制掩膜算法对信号功率谱进行初步降噪处理;其次通过稀疏编码对处理后的信号做进一步处理,从而实现语音增强的效果,具体包含以下步骤:
(1)将时域信号转换为频域信号;
(2)采用理想二进制掩膜算法对语音信号功率谱进行初步降噪处理;
(3)利用稀疏编码理论对初步处理后的信号作进一步降噪处理,同时从被认为是干扰信号中提取有效的语音成分;
(4)采用语音信号的初始相位信息恢复出频域信号,进而对其进行反傅里叶变换,得到增强后的目标语音信号。
2.根据权利要求1所述的基于稀疏编码和理想二进制掩膜相结合的语音增强方法,其特征在于:所述步骤(1)中的过程包括如下步骤:
(a1)对语音信号进行固定时长的分帧;
(a2)进行快速傅里叶变换,并保存其初始相位信息。
3.根据权利要求1所述的基于稀疏编码和理想二进制掩膜相结合的语音增强方法,其特征在于:所述步骤(2)中的过程包括如下步骤:
(b1)根据语音信号受污染的程度,选定一个阈值;
(b2)计算出每一个时频点的信噪比,若该时频点的信噪比大于选定的阈值,则掩膜中相应位置的元素为1;反之,该元素为0;
(b3)将时频信号和掩膜进行点乘,即可得到经过理想二进制掩膜算法初步处理后的语音信号Sr
(b4)将时频信号和掩膜的逻辑逆矩阵进行点乘,即可得到在IBM算法中被认为是噪声的干扰信号Vr
4.根据权利要求1所述的基于稀疏编码和理想二进制掩膜相结合的语音增强方法,其特征在于:所述步骤(3)的工作过程包括如下步骤:
(c1)根据稀疏理论,将步骤(b3)中初步处理后的语音信号Sr作训练样本,采用K-SVD算法训练出语音信号字典Ds以及相对应的稀疏系数Xe
(c2)根据稀疏理论,将步骤(b4)中的干扰信号Vr作训练样本,同样采用K-SVD算法训练出干扰信号字典Dv以及采用正交匹配算法计算出该字典相应的稀疏系数Xv
(c3)由于步骤(c2)中的训练样本Vr主要是干扰信号,所以用步骤(c2)训练出的字典Dv表示步骤(2)中语音信号Sr
(c4)依据原子表示语音信号的比例,将字典Dv中的原子进行排序;
(c5)将前5%的原子组成一个新的字典D′s,该字典组要用于提取干扰信号Vr中包含的语音信号;字典Dv中其余原子组成字典D′v
(c6)字典D′s与字典D′v进行正交,正交后的字典标记为D″s
5.根据权利要求1所述的基于稀疏编码和理想二进制掩膜相结合的语音增强方法,其特征在于:所述步骤(4)的工作过程包括如下步骤:
(d1)按照字典D″s、D′v的原子位置,将稀疏系数Xv中相应的系数组成新的稀疏系数并标记为Xe和Xv,进而进行语音信号重构;
(d2)采用步骤(2)获取的语音信号相位作为目标语音信号相位,进而合成出语音信号;
(d3)将(d2)中的语音信号作反离散傅里叶变换(IFFT),将分帧的信号合成目标语音信号。
CN201410476932.3A 2014-09-17 2014-09-17 基于稀疏编码和理想二进制掩膜相结合的语音增强方法 Expired - Fee Related CN104240717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410476932.3A CN104240717B (zh) 2014-09-17 2014-09-17 基于稀疏编码和理想二进制掩膜相结合的语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410476932.3A CN104240717B (zh) 2014-09-17 2014-09-17 基于稀疏编码和理想二进制掩膜相结合的语音增强方法

Publications (2)

Publication Number Publication Date
CN104240717A true CN104240717A (zh) 2014-12-24
CN104240717B CN104240717B (zh) 2017-04-26

Family

ID=52228670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410476932.3A Expired - Fee Related CN104240717B (zh) 2014-09-17 2014-09-17 基于稀疏编码和理想二进制掩膜相结合的语音增强方法

Country Status (1)

Country Link
CN (1) CN104240717B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108615535A (zh) * 2018-05-07 2018-10-02 腾讯科技(深圳)有限公司 语音增强方法、装置、智能语音设备和计算机设备
CN110222781A (zh) * 2019-06-12 2019-09-10 成都嗨翻屋科技有限公司 音频去噪方法、装置、用户终端及存储介质
CN112700786A (zh) * 2020-12-29 2021-04-23 西安讯飞超脑信息科技有限公司 语音增强方法、装置、电子设备和存储介质
CN113470684A (zh) * 2021-07-23 2021-10-01 平安科技(深圳)有限公司 音频降噪方法、装置、设备及存储介质
CN115359782A (zh) * 2022-08-18 2022-11-18 天津大学 一种基于质量和韵律特征融合的古诗词朗读评估方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110046948A1 (en) * 2009-08-24 2011-02-24 Michael Syskind Pedersen Automatic sound recognition based on binary time frequency units
CN103176946A (zh) * 2013-04-02 2013-06-26 哈尔滨工业大学 一种面向块稀疏信号的稀疏分解去噪方法
CN103345920A (zh) * 2013-05-29 2013-10-09 河海大学常州校区 基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法
CN103594093A (zh) * 2012-08-15 2014-02-19 王景芳 基于信噪比软掩蔽语音增强方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110046948A1 (en) * 2009-08-24 2011-02-24 Michael Syskind Pedersen Automatic sound recognition based on binary time frequency units
CN103594093A (zh) * 2012-08-15 2014-02-19 王景芳 基于信噪比软掩蔽语音增强方法
CN103176946A (zh) * 2013-04-02 2013-06-26 哈尔滨工业大学 一种面向块稀疏信号的稀疏分解去噪方法
CN103345920A (zh) * 2013-05-29 2013-10-09 河海大学常州校区 基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
凌洁 等: "基于稀疏编码的语音增强方法研究", 《电路与系统学报》 *
杜军: "基于稀疏编码的语音增强方法", 《青岛大学学报(自然科学版)》 *
蒋毅 等: "低信噪比下二值掩蔽算法性能分析", 《低信噪比下二值掩蔽算法性能分析 *
黄建军 等: "时域字典学习的单通道语音增强算法", 《声学学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108615535A (zh) * 2018-05-07 2018-10-02 腾讯科技(深圳)有限公司 语音增强方法、装置、智能语音设备和计算机设备
CN108615535B (zh) * 2018-05-07 2020-08-11 腾讯科技(深圳)有限公司 语音增强方法、装置、智能语音设备和计算机设备
CN110222781A (zh) * 2019-06-12 2019-09-10 成都嗨翻屋科技有限公司 音频去噪方法、装置、用户终端及存储介质
CN112700786A (zh) * 2020-12-29 2021-04-23 西安讯飞超脑信息科技有限公司 语音增强方法、装置、电子设备和存储介质
CN112700786B (zh) * 2020-12-29 2024-03-12 西安讯飞超脑信息科技有限公司 语音增强方法、装置、电子设备和存储介质
CN113470684A (zh) * 2021-07-23 2021-10-01 平安科技(深圳)有限公司 音频降噪方法、装置、设备及存储介质
CN113470684B (zh) * 2021-07-23 2024-01-12 平安科技(深圳)有限公司 音频降噪方法、装置、设备及存储介质
CN115359782A (zh) * 2022-08-18 2022-11-18 天津大学 一种基于质量和韵律特征融合的古诗词朗读评估方法
CN115359782B (zh) * 2022-08-18 2024-05-14 天津大学 一种基于质量和韵律特征融合的古诗词朗读评估方法

Also Published As

Publication number Publication date
CN104240717B (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
CN102915742B (zh) 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法
CN111081268A (zh) 一种相位相关的共享深度卷积神经网络语音增强方法
Xia et al. Speech enhancement with weighted denoising auto-encoder.
CN104505100B (zh) 一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法
CN104240717A (zh) 基于稀疏编码和理想二进制掩膜相结合的语音增强方法
CN107316648A (zh) 一种基于有色噪声的语音增强方法
CN104375973A (zh) 一种基于集合经验模态分解的盲源信号去噪方法
CN106340292A (zh) 一种基于连续噪声估计的语音增强方法
CN105023580A (zh) 基于可分离深度自动编码技术的无监督噪声估计和语音增强方法
CN111508518B (zh) 一种基于联合字典学习和稀疏表示的单通道语音增强方法
Xu et al. Global variance equalization for improving deep neural network based speech enhancement
CN104217730B (zh) 一种基于k‑svd的人工语音带宽扩展方法及装置
CN103345920B (zh) 基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法
Wang et al. Joint noise and mask aware training for DNN-based speech enhancement with sub-band features
CN114495973A (zh) 一种基于双路径自注意力机制的特定人语音分离方法
Saleem et al. On improvement of speech intelligibility and quality: A survey of unsupervised single channel speech enhancement algorithms
Thomas et al. Acoustic and data-driven features for robust speech activity detection
CN114360571A (zh) 基于参考的语音增强方法
CN103971697B (zh) 基于非局部均值滤波的语音增强方法
CN113593590A (zh) 一种语音中瞬态噪声的抑制方法
CN102637438B (zh) 一种语音滤波方法
CN114613384B (zh) 一种基于深度学习多输入语音信号波束形成信息互补方法
CN110070887B (zh) 一种语音特征重建方法及装置
CN114401168B (zh) 适用复杂强噪声环境下短波莫尔斯信号的语音增强方法
Rao et al. Speech enhancement using sub-band cross-correlation compensated Wiener filter combined with harmonic regeneration

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Tang Yibin

Inventor after: Tan Yawen

Inventor after: Li Xufei

Inventor after: Jiang Aimin

Inventor after: Xu Ning

Inventor after: Yin Cheng

Inventor before: Tang Yibin

Inventor before: Wang Xiaofan

Inventor before: Sun Juan

Inventor before: Jiang Aimin

Inventor before: Xu Ning

Inventor before: Yin Cheng

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170426

Termination date: 20190917