CN1412742A - 基于波形相关法的语音信号基音周期检测方法 - Google Patents
基于波形相关法的语音信号基音周期检测方法 Download PDFInfo
- Publication number
- CN1412742A CN1412742A CN02156678A CN02156678A CN1412742A CN 1412742 A CN1412742 A CN 1412742A CN 02156678 A CN02156678 A CN 02156678A CN 02156678 A CN02156678 A CN 02156678A CN 1412742 A CN1412742 A CN 1412742A
- Authority
- CN
- China
- Prior art keywords
- sigma
- voice signal
- max
- tau
- numerical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000001914 filtration Methods 0.000 claims description 20
- 101100129500 Caenorhabditis elegans max-2 gene Proteins 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 7
- 238000006073 displacement reaction Methods 0.000 claims description 5
- 101100083446 Danio rerio plekhh1 gene Proteins 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 3
- 208000035126 Facies Diseases 0.000 claims description 2
- 238000013461 design Methods 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 238000012805 post-processing Methods 0.000 claims description 2
- 238000011426 transformation method Methods 0.000 claims description 2
- 238000002203 pretreatment Methods 0.000 claims 1
- 230000002596 correlated effect Effects 0.000 abstract description 2
- 238000001228 spectrum Methods 0.000 description 11
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 244000141353 Prunus domestica Species 0.000 description 1
- 206010038743 Restlessness Diseases 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
基于波形相关法的语音信号基音周期检测方法,属于语音信号处理领域。本发明是由语音采集系统将所需检测的语音信号输入计算机,在计算机处理器中完成对语音信号基音周期的检测,主要方法是在时域内,根据数字语音信号的准周期特性,通过比较原始信号和它的移位后的信号之间的相关性来确定基音周期。特征在于,是利用过去的语音信号样值,来减少传统波形相关估计的延时,同时在基音检测主过程的前端和末端加入了有效的预处理和后处理技术,进行基音周期检测。基音检测方法主要包括四个步骤,第一步为预处理,第二步为语音信号相关系数估计,第三步为后处理,第四步为清音/浊音判决。该方法使得在一般背景噪声环境下,基音周期估计的准确率达到99%。
Description
技术领域
基于波形相关法的语音信号基音周期检测方法,属于语音信号处理,可应用于低速率语音编码、语音合成和语音识别系统中。
背景技术
表征人类声带震动频率的基音检测问题是语音信号处理研究领域的难点课题。其中基音是指人类发浊音时声带振动所引起的周期性,基音周期值是声带振动频率的倒数。它的检测和估计是语音处理中一个非常重要的问题。迄今为止找到一个完善的适用于不同的讲话者、不同要求和环境、准确和可靠地检测语音信号基音的方法还是极其困难的。原因归结为:第一,语音信号波形的周期是时变的;第二,声道的共振峰对声门波形结构有重要影响;第三,准确判别浊音语音段每个基音周期的准确开始和结束位置是非常困难的;第四,清音语音和低电平浊音语音段的区分是困难的;第五,背景噪声的干扰;第六,基音周期变化范围大。
目前人们主要利用语音信号的时域波形相关和频域谱相关特性进行进行基音检测。本发明基于时域波形相关法。在时域中,周期信号的最明显特征就是波形的相关性。基于时域波形相关法的基音检测方法的主要原理是通过比较原始信号和它的移位后的信号之间的类似性来确定基音周期。如果移位距离等于基音周期,那么,两个信号具有最大类似性(或者说是互相关最大)。时域波形相关法的关键性问题是如何定义类似性量度。目前人们大多采用平方代价函数最小原理,这是因为平方代价函数在数学上易于实现。
高性能的基音检测方法对保障低速率语音编码器的质量,起到了关键性作用。传统基音检测方法还存在这样或那样的一些缺陷,如应用范围受限、正确估计率低、延时大和算法复杂等。
发明内容
本发明的目的在于克服以上不足,根据时域波形相关方法开发了基于波形相关法的基音周期检测方法。
本发明的技术方案主要流程如图5所示。是由语音采集系统将所需检测的语音信号输入计算机,在计算机处理器中完成对语音信号基音周期的检测,主要方法是在时域内,根据数字语音信号的准周期特性,通过比较原始信号和它的移位后的信号之间的相关性来确定基音周期,本发明的特征在于:利用过去的语音信号样值,即数字语音信号的历史,来减少传统波形相关估计的延时,同时在语音信号相关估计的前后加入了预处理和后处理技术,进行基音周期检测。减少了低频噪声、声道共振峰和基音增倍/减半产生的影响,使基音估计变得可靠和准确。
该基音周期检测方法在时域内进行,主要包括四个步骤,第一步为预处理,第二步为相关系数估计,第三步为后处理,第四步为清音/浊音判决。其步骤为:
第一步进行语音的预处理,包括去均值、低通滤波和数值滤波三部分,各部分分述如下:(1)去均值方法:
当数字语音信号s(n)在分析窗里有非零均值或有非常低的低频噪声出现时,相关系数ρ(τ)在所要求的所有延迟上均产生高的相关,这对于依赖ρ(τ)进行清/浊分类的安静段语音或低幅度清音语音段尤其麻烦。鉴于此,我们在计算ρ(τ)时首先从分析窗数据中减掉均值,减去均值的信号为
s′(n)=s(n)-μ其中 式中N为数字语音信号分析帧长。(2)低通滤波方法:
为了减少高频共振峰和外来高频造声的影响,对去均值的语音信号进行800Hz低通滤波,去除了第三和第四个高频共振峰及高频噪声的影响,这个低通滤波器可以去除大部分共振峰的影响,又可以当基音频率为最高500Hz时,仍能保留其一二次谐波。依据双线性变换法设计的一个五阶椭圆低通滤波器传递函数为: 式中的滤波器系数Ai和Bj分别为:{Ai}={0.008233,-0.004879,0.007632,0.007632,-0.004879,0.008233}{Bi}={1.0000,-3.6868,5.8926,-5.0085,2.2518,-0.4271}(3)数值滤波方法:
经过800Hz低通滤波的语音信号,主要去除了第三和第四个高频共振峰及高频噪声的影响,但第一和第二个共振峰有时依然存在,使得浊音段语音信号的周期性模糊,产生了错误基音估计。本发明在800Hz低通滤波器之后级联一个数值滤波器可有效去除这一影响,突出了浊音语音信号的周期性,使基音估计可靠。
本发明中,数值滤波器的传递函数定义为: 式中p为数值滤波器阶数,
为数值滤波器系数。在时域里数值滤波器的输入x(n)和输出y(n)之间的关系为 一般数值滤波的阶数通常选取为1,3,5,7…等,本发明经大量实验发现,当数值滤波器的阶数p=9,滤波器系数θi=1/9时,可有效减少或去除第一和第二个共振峰对基音检测的影响。图2给出了该数值滤波器的幅频特性曲线。
第二步进行语音信号相关系数估计,并以其作为基音检测的依据,具体步骤如下:令
为预处理后的数字语音信号,则
和其移位后的信号之间的平方误差为 式中β为增益因子,τ为介于20和120个样点之间的整数延时,当n-τ<0时,将用到过去的语音信号样值,即语音信号的历史,这样做不需要未来的语音信号样值,避免了传统方法中用作为移位信号而产生的额外延时。使E(τ)最小的τ值即为当前帧语音信号的基音周期初估值。令
可以得到这个最小的E(τ)为: 使E(τ)最小等价于使相关系数 最大,使ρ(τ)最大的τ值即为当前帧语音信号的基音周期初估值。如果延迟τ等于语音信号的实际基音周期或等于实际基音周期的整数倍,则ρ值趋于1,说明该段语音信号具有明显的周期性;相反,如果ρ值比1小很多,则该段信号具有非周期特征,所以,真正的基音周期为对应于最大ρ值的τ,这个τ称为最佳延迟。
第三步和第四步为进行后处理和利用ρ(τ)进行语音的清音/浊音判决,具体步骤如下:(1)利用下式求预处理后的语音信号
的对数能量E(dB): 式中ε是一个很小的正常数,为的是防止计算时溢出。当E小于给定门限Eth=30dB时,语音能量太小,判决为清音,当E大于Eth,且在允许的基频范围内时,判为浊音。(2)对E大于Eth的基音周期进行后处理,措施为:首先,在三个基音区域内计算ρ(τ),分别得到各自区域内的最大ρ(τ)值及对应的延迟,记为ρmax1,ρmax2和ρmax3、τ1,τ2,和τ3,这三个区域分别为80~120,40~79和20~39,其次,按如下逻辑确定最优基音延迟τopt:
τopt=τ1
ρmax =ρmax1
if ρmax2≥cρmax
ρmax=ρmax2
τopt=τ2
end
if ρmax3≥cρmax
ρmax=ρmax3
τopt=τ3
end这里c=0.96为经验因子;(3)确定周期性水平量Zp,设ρ的最大峰值为ρmax(后处理后的),ρ的前三个峰的平均值为: 则周期性水平量Zp计算为:
Zp=ρmax+ρavr当Zp小于给定的门限Zth=0.62时,说明周期性不强,判决为清音,当Zp大于给定的门限Zth时,且在允许的基频范围内时,判为浊音,并输出对应的优化基音延迟τopt。
本发明的突出效果是使用了一个9阶数值滤波器,有效地去除了第一个和第二个共振峰对基音检测的影响。图3给出了一典型帧语音波形的比较,其中图3(a)为原始语音波形,图3(b)为800Hz低通滤波后的语音波形,图3(c)为800Hz低通滤波和数值滤波后的语音波形。从波形中可以看到,原始语音波形有一定的周期性,但不明显,经800Hz低通滤波后的语音波形几乎看不出周期性,而经数值滤波后的语音波形则显现出了非常强的周期性。
图4给出了对应图3的FFT谱和LPA(线性预测分析)谱,其中图4(a)为原始语音的FFT谱和LPA谱,图4(b)为800Hz低通滤波后的语音的FFT谱和LPA谱,图4(c)为800Hz低通滤波和数值滤波后的语音的FFT谱和LPA谱。从图4(a)可以看出,该段语音有四个共振峰,其中第一和第二共振峰相距很近,经800Hz低通滤波后,衰减掉了第二、第三和第四共振峰,但第一共振峰仍存在,且幅度很大。再经数值滤波后,第一共振峰幅度已衰减到小于一二次谐波幅度,因而完全去除了共振峰的影响。
实验发现,对于上述示例,采用数值滤波前,基音估计值为20个样点,从原语音波形可以看出,这是一个完全错误的估计。而加入数值滤波后,基音估计值为57个样点,从原语音波形可以看出结果是正确的。
本发明的方法具有好的通用性和高的准确率,特别适用于低速率语音编码,同时也可用于语音合成和语音识别中的音调检测。实验证明,该方法的基音周期检测准确率达到99%。
附图说明图1800Hz5阶椭圆低通滤波器幅度响应;图29阶数值滤波器幅度响应;图3基音检测预处理前后语音波形比较;图4.基音检测预处理前后语音FFT谱和LPA谱比较;图5基于波形相关法的基音检测方法流程图;图6汉语“大家都说普通话”的语音波形;图7汉语“大家都说普通话”的基音轮廓。
具体实施方式
按照图5所示本发明的方法流程,用于基音检测的语音为汉语语音,来源于三名男性和三名女性的讲话记录,其中一男和一女为播音员,讲话内容为11句标准汉语语音实验句子,内容分别为:“中国科学院声学研究所”,“大家都说普通话”,“奥林匹克运动会”,“他去无锡市,我到黑龙江”,“沈阳旅大市,广州内蒙古”,“天安门广场,人民大会堂”,“沉舟侧畔千帆过,病树前头万木春”,“塞翁失马,焉知非福”,“拐弯抹角”,“穷则思变”;“迎刃而解”。这些语音记录经100~3400带通滤波,以8kHz采样率数字化,每个样值用16bit线性码表示。为了防止计算溢出,将数字化的语音信号s(n)幅度缩小到-2048~2048。基音检测在200个样点的帧内进行,共958帧。
第一,初始化输入参数。给定低通滤波器系数Ai和Bj、数值滤波器系数θi、能量判决门限Eth、周期度判决门限Zth,将低通滤波器、数值滤波器和波形相关器的历史置为零。
第二,进行预处理。包括去均值、低通滤波和数值滤波三部分。在包含200个样点的帧内按如下公式计算均值: 去除均值的数字语音信号s′(n)如下获得:
s′(n)=s(n)-μ,n=0,1,2,…,199将s′(n)通过低通滤波器Hlpf(z)得到输出信号为s″(n):
s″(n)=0.008233s′(n)-0.004879s′(n-1)+0.007632s′(n-2)+0.007632s′(n-3)
-0.004879s′(n-4)+0.008233s′(n-5)+3.6868s″(n-1)-5.8926s″(n-2)
+5.0085s″(n-3)-2.2518s″(n-4)+0.4271s″(n-5)
第三,按下式计算信号
的对数能量E(dB): 并将E与能量门限Eth=30dB进行比较,如果E>30dB,则转向第四步,否则,判决该帧语音为清音,输出基音周期为0,并判断分帧是否结束,若分帧结束,则退出程序,否则更新低通滤波器、数值滤波器和波形相关器历史,返回到预处理级。
第四,按下式在τ=20~120内计算波形相关系数ρ(τ): 得到101个相关系数值,并在80~120,40~79和20~39三个基音区域内按排序法分别得到各自区域内的最大相关系数值及对应的延迟,记为ρmax1,ρmax2和ρmax3、τ1,τ2,和τ3。
第五,按如下逻辑确定最优基音延迟τopt:
τopt=τ1
ρmax=ρmax1
if ρmax2≥0.96ρmax
ρmax=ρmax2
τopt=τ2
end
if ρmax3≥0.96ρmax
ρmax=ρmax3
τopt=τ3
end
第六,按下式计算周期性水平量Zp:
Zp=ρmax+0.333333(ρmax1+ρmax2+ρmax3)并将Zp与周期性水平量门限Zth=0.62进行比较,如果Zp>0.62,则转入第七步,否则,判决该帧语音为清音,输出基音周期为0,并判断分帧是否结束,若分帧结束,则退出程序,否则更新低通滤波器、数值滤波器和波形相关器历史,返回到预处理级。
第七,判断经过后处理的最优延迟τopt是否在给定的范围内,如果20<τopt<120,则判断该帧语音为浊音,输出基音周期为τopt,同时判断分帧是否结束,若分帧结束,则退出程序,否则更新低通滤波器、数值滤波器和波形相关器历史,返回到预处理级;如果τopt不满足20<τopt<120,判决该帧语音为清音,输出基音周期为0,同时判断分帧是否结束,若分帧结束,则退出程序,否则更新低通滤波器、数值滤波器和波形相关器历史,返回到预处理级。实验效果为:
由于语音基频的时变性,基频的真值很难确定,这就限制了用一个客观的误差测度准则来衡量某一个基音检测系统的优劣。本例采用逐帧波形分析的方法来确定基频估计与清/浊判决,波形分析表明,基于波形相关法的语音信号基音周期检测方法,对上面给出的958帧语音测试句子,基音检测与清/浊判决的正确率为99.4%。
图6分别给出了内容为“大家都说普通话”的一男一女的语音波形,图7为与之对应的基音轮廓曲线,从图7可以看出,基音轮廓趋于平滑,没有基音加倍和减倍现象,清音、浊音段区别明显,男性基音周期明显高于女性。
Claims (2)
1、基于波形相关法的语音信号基音周期检测方法,是由语音采集系统将所需检测的语音信号输入计算机,在计算机处理器中完成对语音信号基音周期的检测,主要方法是在时域内,根据数字语音信号的准周期特性,通过比较原始信号和它的移位后的信号之间的相关性来确定基音周期,本发明的特征在于:利用过去的语音信号样值,来减少传统波形相关估计的延时,同时在语音信号相关估计的前后加入了预处理和后处理技术,进行基音周期检测;
该基音检测方法主要包括四个步骤,第一步为预处理,第二步为语音信号相关系数估计,第三步为后处理,第四步为清音/浊音判决,其步骤为:
第一步进行语音的预处理,包括去均值、低通滤波和数值滤波三部分,各部分分述如下:(1)去均值方法为:对于初始输入的数字语音信号s(n),通常其均值μ不为零或附带有低频噪声,在计算相关函数时,首先要减掉均值μ,去均值的信号s′(n)为
s′(n)=s(n)-μ其中 式中N为数字语音信号分析帧长;(2)低通滤波方法为:对去均值的语音信号进行800Hz低通滤波,去除了第三和第四个高频共振峰及高频噪声的影响,低通滤波器是依据双线性变换法设计的一个五阶椭圆低通滤波器,其传递函数为: 式中的滤波器系数Ai和Bj分别为:{Ai}={0.008233,-0.004879,0.007632,0.007632,-0.004879,0.008233}{Bi}={1.0000,-3.6868,5.8926,-5.0085,2.2518,-0.4271}(3)数值滤波方法为:在低通滤波器之后级联一个数值滤波器去除了声道第一和第二个共振峰的影响;该数值滤波器的传递函数为: 式中p为数值滤波器阶数,
为数值滤波器系数;
第二步进行语音信号相关系估计,并以其作为基音检测的依据,具体步骤如下:
令
为预处理后的数字语音信号,则
和其移位后的信号
之间的平方误差为 式中β为增益因子,τ为介于20和120个样点之间的整数延时,当n-τ<0时,将用到过去的语音信号样值,使E(τ)最小的τ值即为当前帧语音信号的基音周期初估值;令 可以得到这个最小的E(τ)为: 使E(τ)最小等价于使相关系数 最大,使ρ(τ)最大的τ值即为当前帧语音信号的基音周期初估值;
第三步和第四步为进行后处理和利用ρ(τ)进行语音信号的清音/浊音判决,具体步骤如下:(1)利用下式求预处理后的语音信号
的对数能量E(dB): 式中ε是一个很小的正常数,当E小于给定门限Eth时,语音能量太小,判决为清音,当E大于Eth,且在允许的基频范围内时,判为浊音;(2)对E大于Eth的基音周期进行后处理,措施为:首先,在三个基音区域内计算ρ(τ),分别得到各自区域内的最大ρ(τ)值及对应的延迟,记为ρmax1,ρmax2和ρmax3、τ1,τ2,和τ3,这三个区域分别为80~120,40~79和20~39,其次,按如下逻辑确定最优基音延迟τopt:
τopt=τ1
ρmax=ρmax1
if ρmax2≥cρmax
ρmax=ρmax2
τopt=τ2
end
if ρmax3≥cρmax
ρmax=ρmax3
τopt=τ3
end这里c=0.96为经验因子;(3)确定周期性水平量Zp,设ρ的最大峰值为ρmax(后处理后的),ρ的前三个峰的平均值为: 则周期性水平量Zp计算为:
Zp=ρmax+ρavr当Zp小于给定的门限Zth时,说明周期性不强,判决为清音,当Zp大于给定的门限Zth时,且在允许的基频范围内时,判为浊音,并输出对应的优化基音延迟τopt。
2、根据权利要求1所述的语音信号基音周期检测方法,特征在于:预处理步骤中,使用了去除第一和第二共振峰的数值滤波器,该数值滤波器的传递函数为: 式中p为数值滤波器阶数,
为数值滤波器系数;在时域里数值滤波器的输入x(n)和输出y(n)之间的关系为 数值滤波器的最佳阶数为p=9,滤波器系数θi=1/9。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN02156678A CN1412742A (zh) | 2002-12-19 | 2002-12-19 | 基于波形相关法的语音信号基音周期检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN02156678A CN1412742A (zh) | 2002-12-19 | 2002-12-19 | 基于波形相关法的语音信号基音周期检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1412742A true CN1412742A (zh) | 2003-04-23 |
Family
ID=4752796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN02156678A Pending CN1412742A (zh) | 2002-12-19 | 2002-12-19 | 基于波形相关法的语音信号基音周期检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1412742A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010091554A1 (zh) * | 2009-02-13 | 2010-08-19 | 华为技术有限公司 | 一种基音周期检测方法和装置 |
CN1971707B (zh) * | 2006-12-13 | 2010-09-29 | 北京中星微电子有限公司 | 一种进行基音周期估计和清浊判决的方法及装置 |
WO2010108315A1 (zh) * | 2009-03-24 | 2010-09-30 | 华为技术有限公司 | 信号延时切换的方法和装置 |
CN1810002B (zh) * | 2003-04-24 | 2010-11-10 | 高通股份有限公司 | 组合式数模转换器和信号滤波器 |
CN101030375B (zh) * | 2007-04-13 | 2011-01-26 | 清华大学 | 一种基于动态规划的基音周期提取方法 |
CN101030374B (zh) * | 2007-03-26 | 2011-02-16 | 北京中星微电子有限公司 | 基音周期提取方法及装置 |
CN101572089B (zh) * | 2009-05-21 | 2012-01-25 | 华为技术有限公司 | 信号周期检测方法及其装置 |
CN101221757B (zh) * | 2008-01-24 | 2012-02-29 | 中兴通讯股份有限公司 | 高频杂音处理方法及分析方法 |
CN101887723B (zh) * | 2007-06-14 | 2012-04-25 | 华为终端有限公司 | 一种对基音周期进行微调的方法和装置 |
US8600738B2 (en) | 2007-06-14 | 2013-12-03 | Huawei Technologies Co., Ltd. | Method, system, and device for performing packet loss concealment by superposing data |
CN107799122A (zh) * | 2017-09-08 | 2018-03-13 | 中国科学院深圳先进技术研究院 | 一种高生物拟真性语音处理滤波器与语音识别设备 |
CN107919130A (zh) * | 2017-11-06 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 基于云端的语音处理方法和装置 |
CN108831509A (zh) * | 2018-06-13 | 2018-11-16 | 西安蜂语信息科技有限公司 | 基音周期的确定方法、装置、计算机设备和存储介质 |
CN109308894A (zh) * | 2018-09-26 | 2019-02-05 | 中国人民解放军陆军工程大学 | 一种基于Bloomfield’s模型的语音建模方法 |
CN109346105A (zh) * | 2018-07-27 | 2019-02-15 | 南京理工大学 | 直接显示基音周期轨迹的基音周期谱图方法 |
CN109389988A (zh) * | 2017-08-08 | 2019-02-26 | 腾讯科技(深圳)有限公司 | 音效调整控制方法和装置、存储介质及电子装置 |
CN111508512A (zh) * | 2019-01-31 | 2020-08-07 | 哈曼贝克自动系统股份有限公司 | 语音信号中的摩擦音检测 |
-
2002
- 2002-12-19 CN CN02156678A patent/CN1412742A/zh active Pending
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1810002B (zh) * | 2003-04-24 | 2010-11-10 | 高通股份有限公司 | 组合式数模转换器和信号滤波器 |
CN1971707B (zh) * | 2006-12-13 | 2010-09-29 | 北京中星微电子有限公司 | 一种进行基音周期估计和清浊判决的方法及装置 |
CN101030374B (zh) * | 2007-03-26 | 2011-02-16 | 北京中星微电子有限公司 | 基音周期提取方法及装置 |
CN101030375B (zh) * | 2007-04-13 | 2011-01-26 | 清华大学 | 一种基于动态规划的基音周期提取方法 |
US8600738B2 (en) | 2007-06-14 | 2013-12-03 | Huawei Technologies Co., Ltd. | Method, system, and device for performing packet loss concealment by superposing data |
CN101887723B (zh) * | 2007-06-14 | 2012-04-25 | 华为终端有限公司 | 一种对基音周期进行微调的方法和装置 |
CN101221757B (zh) * | 2008-01-24 | 2012-02-29 | 中兴通讯股份有限公司 | 高频杂音处理方法及分析方法 |
WO2010091554A1 (zh) * | 2009-02-13 | 2010-08-19 | 华为技术有限公司 | 一种基音周期检测方法和装置 |
US9153245B2 (en) | 2009-02-13 | 2015-10-06 | Huawei Technologies Co., Ltd. | Pitch detection method and apparatus |
WO2010108315A1 (zh) * | 2009-03-24 | 2010-09-30 | 华为技术有限公司 | 信号延时切换的方法和装置 |
CN102265338A (zh) * | 2009-03-24 | 2011-11-30 | 华为技术有限公司 | 信号延时切换的方法和装置 |
CN101572089B (zh) * | 2009-05-21 | 2012-01-25 | 华为技术有限公司 | 信号周期检测方法及其装置 |
CN109389988A (zh) * | 2017-08-08 | 2019-02-26 | 腾讯科技(深圳)有限公司 | 音效调整控制方法和装置、存储介质及电子装置 |
CN109389988B (zh) * | 2017-08-08 | 2022-12-20 | 腾讯科技(深圳)有限公司 | 音效调整控制方法和装置、存储介质及电子装置 |
CN107799122A (zh) * | 2017-09-08 | 2018-03-13 | 中国科学院深圳先进技术研究院 | 一种高生物拟真性语音处理滤波器与语音识别设备 |
CN107919130A (zh) * | 2017-11-06 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 基于云端的语音处理方法和装置 |
US11024332B2 (en) | 2017-11-06 | 2021-06-01 | Baidu Online Network Technology (Beijing) Co., Ltd. | Cloud-based speech processing method and apparatus |
CN108831509A (zh) * | 2018-06-13 | 2018-11-16 | 西安蜂语信息科技有限公司 | 基音周期的确定方法、装置、计算机设备和存储介质 |
CN108831509B (zh) * | 2018-06-13 | 2020-12-04 | 西安蜂语信息科技有限公司 | 基音周期的确定方法、装置、计算机设备和存储介质 |
CN109346105A (zh) * | 2018-07-27 | 2019-02-15 | 南京理工大学 | 直接显示基音周期轨迹的基音周期谱图方法 |
CN109346105B (zh) * | 2018-07-27 | 2022-04-15 | 南京理工大学 | 直接显示基音周期轨迹的基音周期谱图方法 |
CN109308894A (zh) * | 2018-09-26 | 2019-02-05 | 中国人民解放军陆军工程大学 | 一种基于Bloomfield’s模型的语音建模方法 |
CN111508512A (zh) * | 2019-01-31 | 2020-08-07 | 哈曼贝克自动系统股份有限公司 | 语音信号中的摩擦音检测 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1412742A (zh) | 基于波形相关法的语音信号基音周期检测方法 | |
EP1309964B1 (en) | Fast frequency-domain pitch estimation | |
CN108896878B (zh) | 一种基于超声波的局部放电检测方法 | |
US7567900B2 (en) | Harmonic structure based acoustic speech interval detection method and device | |
US7337107B2 (en) | Perceptual harmonic cepstral coefficients as the front-end for speech recognition | |
KR101327895B1 (ko) | 오디오 신호 분류를 위한 방법 및 장치 | |
CN1151490C (zh) | 用于语音识别的高精度高分辨率基频提取方法 | |
US20030093265A1 (en) | Method and system of chinese speech pitch extraction | |
CN108305639B (zh) | 语音情感识别方法、计算机可读存储介质、终端 | |
CN108682432B (zh) | 语音情感识别装置 | |
KR100827153B1 (ko) | 음성 신호의 유성음화 비율 검출 장치 및 방법 | |
CN112133322A (zh) | 一种基于噪声分类优化imcra算法的语音增强方法 | |
CN105679312A (zh) | 一种噪声环境下声纹识别的语音特征处理方法 | |
Ealey et al. | Harmonic tunnelling: tracking non-stationary noises during speech. | |
CN116434739A (zh) | 构建识别心力衰竭不同分期的分类模型的装置及相关组件 | |
Wu et al. | Voice activity detection based on auto-correlation function using wavelet transform and teager energy operator | |
US8103512B2 (en) | Method and system for aligning windows to extract peak feature from a voice signal | |
Sorin et al. | The ETSI extended distributed speech recognition (DSR) standards: client side processing and tonal language recognition evaluation | |
CN1754204A (zh) | 低频带噪声检测 | |
CN106782550A (zh) | 一种基于dsp芯片的自动语音识别系统 | |
CN110610724A (zh) | 基于非均匀子带分离方差的语音端点检测方法及装置 | |
Ben Messaoud et al. | An efficient method for fundamental frequency determination of noisy speech | |
CN117711419B (zh) | 用于数据中台的数据智能清洗方法 | |
CN109346106B (zh) | 一种基于子带信噪比加权的倒谱域基音周期估计方法 | |
Vini | Voice Activity Detection Techniques-A Review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |