CN103310800A - 一种抗噪声干扰的浊语音检测方法及系统 - Google Patents
一种抗噪声干扰的浊语音检测方法及系统 Download PDFInfo
- Publication number
- CN103310800A CN103310800A CN201210056627XA CN201210056627A CN103310800A CN 103310800 A CN103310800 A CN 103310800A CN 201210056627X A CN201210056627X A CN 201210056627XA CN 201210056627 A CN201210056627 A CN 201210056627A CN 103310800 A CN103310800 A CN 103310800A
- Authority
- CN
- China
- Prior art keywords
- template
- harmonic
- frequency
- energy
- frame signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 47
- 238000004458 analytical method Methods 0.000 claims description 27
- 238000001228 spectrum Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004321 preservation Methods 0.000 claims description 6
- 230000005236 sound signal Effects 0.000 description 4
- 206010038743 Restlessness Diseases 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Images
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种抗噪声干扰的浊语音检测方法及系统,该方法基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述方法包含:步骤101)针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;步骤102)基于上步骤的模板,每帧信号与模板的匹配过程均包括若干次能量范围选择,使某受到干扰的频率范围得到忽略;步骤103)利用多帧信号基音频率的连续性,进行浊语音存在性的最终判决。本发明针对人类语音的基音频率范围,利用了基音频率按对数尺度变化的谐波模板,能够只用较少的模板获得良好的匹配结果,从而保证了检测过程的快速准确。
Description
技术领域
本发明涉及一种浊语音检测方法。更具体地说,本发明提出了一种抗噪声干扰的浊语音检测方法及系统。
背景技术
随着语音信号处理系统的应用日益广泛,背景噪声干扰问题变得越来越严重。对语音信号和背景噪声进行区别,并将噪声拒绝在语音信号处理系统之外,是减少背景噪声干扰的最直接和有效手段。由于语音信号是由清音和浊音共同组成的,其中浊音信号在时长和能量方面占据了绝对的优势,所以,一般可以通过检测浊音信号实现语音/噪声的初步判决。
浊音是由周期性的声门脉冲激励声道而产生的,其中声门脉冲的振动频率即基音频率。因此,浊音信号在基音频率和基音的整数倍频上都具有较高的能量,而在其它频率上的能量则明显较低。由于基音频率是连续缓变的,所以如果对浊音进行短时频谱分析,则相邻帧之间的基音频率和谐波频率都比较接近,并可连接为类似梳状的一系列连续谐波谱线,这就是浊音信号特有的谐波结构。
浊语音的检测方法主要包括基于基频周期性和基于谐波特性两类。其中,基于周期性的方法主要通过信号自相关判断信号是否具有周期性,基于谐波特性的方法则利用信号在频域上均匀分布的能量极值点作为检测依据,如谐波能量和、最小二乘周期估计(LSPE)等。但是,这些方法利用的是全频带或固定频带的信息,而实际噪声的频谱能量分布往往是时变的,所以这些方法不适合用于实际环境中的浊语音检测。
发明内容
本发明的目的在于,为克服现有浊语音的检测方法的诸多缺陷,提供一种抗噪声干扰的浊语音检测方法及系统。
为实现上述目的,本发明提供了一种抗噪声干扰的浊语音检测方法,该方法基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述方法包含:
步骤101)针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;
步骤102)基于上步骤的模板,每帧信号与模板的匹配过程均包括若干次能量范围选择,使某受到干扰的频率范围得到忽略;
步骤103)利用多帧信号基音频率的连续性,进行浊语音存在性判决,从而最终确定一段信号中是否包含浊语音。
上述技术方案中,所述步骤101)进一步包含如下子步骤:
步骤201)对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
步骤202)根据人类语音的基音频率范围,及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对;其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类,且M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小。
所述步骤102)对每一帧输入信号的离散频谱能量,用M个模板与之相比对,每一个模板的比对方法如下,以第j个模板进行说明,其中j=1..M:
301)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
302)对第j个模板,设定一个比例因子α1,根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值,
其中,[]表示取整运算,将谐波平均能量和非谐波平均能量的比值记为R1;0<α1<0.3;
303)按照步骤302)的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk,上述的k个参数αi取值范围都在0到0.3之间,i=1..k,且两两不相等;
304)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj;
305)对每一帧信号,都可利用步骤301)到步骤304)获得M个模板的匹配结果Q1~QM,并将其保存作为检测谐波结构的依据。
所述步骤103)进一步包含如下步骤:
401)将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前L帧信号与第j个模板的匹配结果Wj;
402)在当前L帧信号与M个模板匹配获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的估计值,并设定阈值λ,如果当前分析单元的浊音存在性估计值大于设定λ,则判断当前L帧信号中的每一帧都含有浊音;
403)将长度为L的分析窗向后移动1帧,采用上述步骤判断其是否包含浊语音。
所述步骤403)进一步包含:由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
基于上述方法,本发明还提供了一种抗噪声干扰的浊语音检测系统,该系统基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述系统包含:
谐波模板生成模块,用于针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;
信号与谐波模板匹配模块,用于完成每帧信号与谐波模板的匹配过程,其中每次匹配过程均包括若干次能量范围选择;和
浊语音存在性判决模块,利用多帧信号基音频率的连续性,最终确定一段信号中是否包含浊语音。
上述技术方案中,所述谐波模板生成模块进一步包含如下子模块:
处理子模块,用于对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
谐波模板生成子模块,用于根据人类语音的基音频率范围,及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对;其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类,且M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小。
上述技术方案中,所述信号与谐波模板匹配模块对每一帧输入信号的离散频谱能量,用M个模板与之相比对,每一个模板的比对方法如下,以第j个模板进行说明,其中j=1..M:
301)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
302)对第j个模板,设定一个比例因子α1,根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值,
其中,[]表示取整运算,将谐波平均能量和非谐波平均能量的比值记为R1;0<α1<0.3;
303)按照步骤302)的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk,上述的k个参数αi取值范围都在0到0.3之间,i=1..k,且两两不相等;
304)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj;
305)对每一帧信号,都可利用步骤301)到步骤304)获得M个模板的匹配结果Q1~QM,并将其保存作为检测谐波结构的依据。
上述技术方案中,所述浊语音存在性判决模块进一步包含如下子模块:
获取所有谐波模板的匹配结果的子模块,用于将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前L帧信号与第j个模板的匹配结果Wj;和
判决子模块,用于依据获取所有谐波模板的匹配结果的子模块获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的估计值,并设定阈值λ,如果当前分析单元的浊音存在性估计值大于设定λ,则判断当前L帧信号中的每一帧都含有浊音。
上述技术方案中,所述系统还包含:移动及进一步抉择模块,用于将长度为L的分析窗向后移动1帧,由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
与现有技术相比,本发明的优点在于:
本发明的浊语音检测方法,针对人类语音的基音频率范围,利用了基音频率按对数尺度变化的谐波模板,能够只用较少的模板获得良好的匹配结果(步骤2),从而保证了检测过程的快速准确。在此基础上,由于每帧信号与模板的匹配过程都包括几次能量范围选择,即使某些频率范围因受到信道影响或噪声干扰使得谐波结构不够清晰,这些受到干扰的频率范围也都会得到忽略,所以被干扰的浊语音信号也能被可靠的检测出来(步骤3)。最后,由于利用了多帧信号基音频率的连续性,浊语音的检测过程不易受到瞬态干扰的影响,不易把背景噪音误当作浊语音(步骤4-5)。
附图说明
图1是本发明实施例的一帧信号与谐波模板的匹配流程图;
图2是本发明提供的抗噪声干扰的浊语音检测方法的总流程图。
具体实施方式
下面结合具体实施例和附图对本发明进行详细描述。
本发明通过新的浊音检测方法,减小时变噪声对浊音检测的影响,提高检测的准确率。
为了达到上述目的,本发明提供了一种检测浊语音的方法,其框架是基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带。具体包括以下步骤:
1)对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
2)根据人类语音的基音频率范围(60-450Hz),以及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对。其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率。通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类。M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小;
3)对每一帧输入信号的离散频谱能量,用M个模板与之相比对。每一个模板的比对方法如步骤3-1至步骤3-4,以第j个模板为例进行说明,其中j=1..M;
3-1)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
3-2)对第j个模板,设定一个比例因子α1,其中0<α1<0.3。根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值。其中,[]表示取整运算。将谐波平均能量和非谐波平均能量的比值记为R1;
3-3)按照步骤3-2的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk。上述的k个参数αi(i=1..k)取值范围都在0到0.3之间,且两两不相等;
3-4)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj;
3-5)对每一帧信号,都可利用步骤3-1到步骤3-4获得M个模板的匹配结果Q1~QM,并将其保存下来作为检测谐波结构的依据;
4)将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前L帧信号与第j个模板的匹配结果Wj;
5)在当前L帧信号与M个模板匹配获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的度量。设定阈值λ,如果当前分析单元的浊音存在性估计值大于λ,则判断当前L帧信号中的每一帧都含有浊音;
6)将长度为L的分析窗向后移动1帧,并根据步骤1-5判断其是否包含浊语音。由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
实施例1
如图2所示,本发明提供的浊语音方法,包括以下步骤:
1)对输入的单通道声音信号分帧并加窗后,用2N点快速傅里叶变换(FFT)计算其短时谱,并获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
2)根据人类语音的基音频率范围(60-450Hz),以及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对。其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,这些频率值都舍入到最近的离散频率点上。这样,每个模板都把N个离散频率点按谐波和非谐波进行了二元分类。M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小;
3)对每一帧输入信号的离散频谱能量,用M个模板与之相比对。每一个模板的比对方法如步骤3-1至步骤3-4,以第j个模板为例进行说明,其中j=1..M;如图1所示:
3-1)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
3-2)对第j个模板,设定一个比例因子α1,其中0<α1<0.3。根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值。其中,[]表示取整运算。将谐波平均能量和非谐波平均能量的比值记为R1;
3-3)按照步骤3-2的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk。上述的k个参数αi(i=1..k)取值范围都在0到0.3之间,且两两不相等;
3-4)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj;
3-5)对每一帧信号,利用步骤3-1)到步骤3-4)得到M个模板的匹配结果Q1~QM,并将其保存下来作为检测谐波结构的依据;
4)将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前分析单元与第j个模板的匹配结果Wj;
5)在当前分析单元与M个模板匹配获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的度量。设定阈值λ,如果当前分析单元的浊音存在性估计值大于λ,则判断当前分析单元中的每帧信号都含有浊音;
6)将长度为L的分析窗向后移动1帧,并根据步骤1-5判断其是否包含浊语音。由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
最后应说明,此处所描述的实例仅用于解释本发明,本发明并不限定具体业务类别、用户终端类别以及支付系统类别,对以上内容所做的变换也落在本发明的保护范围之内。
Claims (10)
1.一种抗噪声干扰的浊语音检测方法,该方法基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述方法包含:
步骤101)针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;
步骤102)基于上步骤的模板,每帧信号与模板的匹配过程均包括若干次能量范围选择,使某受到干扰的频率范围得到忽略;
步骤103)利用多帧信号基音频率的连续性,进行浊语音存在性判决,从而最终确定一段信号中是否包含浊语音。
2.根据权利要求1所述的抗噪声干扰的浊语音检测方法,其特征在于,所述步骤101)进一步包含如下子步骤:
步骤201)对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
步骤202)根据人类语音的基音频率范围,及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对;其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类,且M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小。
3.根据权利要求2所述的抗噪声干扰的浊语音检测方法,其特征在于,所述步骤102)对每一帧输入信号的离散频谱能量,用M个模板与之相比对,每一个模板的比对方法如下,以第j个模板进行说明,其中j=1..M:
301)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
302)对第j个模板,设定一个比例因子α1,根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值,
其中,[]表示取整运算,将谐波平均能量和非谐波平均能量的比值记为R1;0<α1<0.3;
303)按照步骤302)的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk,上述的k个参数αi取值范围都在0到0.3之间,i=1..k,且两两不相等;
304)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj;
305)对每一帧信号,都可利用步骤301)到步骤304)获得M个模板的匹配结果Q1~QM,并将其保存作为检测谐波结构的依据。
4.根据权利要求3所述的抗噪声干扰的浊语音检测方法,其特征在于,所述步骤103)进一步包含如下步骤:
401)将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前L帧信号与第j个模板的匹配结果Wj;
402)在当前L帧信号与M个模板匹配获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的估计值,并设定阈值λ,如果当前分析单元的浊音存在性估计值大于设定λ,则判断当前L帧信号中的每一帧都含有浊音;
403)将长度为L的分析窗向后移动1帧,采用上述步骤判断其是否包含浊语音。
5.根据权利要求4所述的抗噪声干扰的浊语音检测方法,其特征在于,所述步骤403)进一步包含:由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
6.一种抗噪声干扰的浊语音检测系统,该系统基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述系统包含:
谐波模板生成模块,用于针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;
信号与谐波模板匹配模块,用于完成每帧信号与谐波模板的匹配过程,其中每次匹配过程均包括若干次能量范围选择;和
浊语音存在性判决模块,利用多帧信号基音频率的连续性,最终确定一段信号中是否包含浊语音。
7.根据权利要求6所述的抗噪声干扰的浊语音检测系统,其特征在于,所述谐波模板生成模块进一步包含如下子模块:
处理子模块,用于对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
谐波模板生成子模块,用于根据人类语音的基音频率范围,及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对;其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类,且M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小。
8.根据权利要求7所述的抗噪声干扰的浊语音检测系统,其特征在于,所述信号与谐波模板匹配模块对每一帧输入信号的离散频谱能量,用M个模板与之相比对,每一个模板的比对方法如下,以第j个模板进行说明,其中j=1..M:
301)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
302)对第j个模板,设定一个比例因子α1,根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值,
其中,[]表示取整运算,将谐波平均能量和非谐波平均能量的比值记为R1;0<α1<0.3;
303)按照步骤302)的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk,上述的k个参数αi取值范围都在0到0.3之间,i=1..k,且两两不相等;
304)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj;
305)对每一帧信号,都可利用步骤301)到步骤304)获得M个模板的匹配结果Q1~QM,并将其保存作为检测谐波结构的依据。
9.根据权利要求8所述的抗噪声干扰的浊语音检测系统,其特征在于,所述浊语音存在性判决模块进一步包含如下子模块:
获取所有谐波模板的匹配结果的子模块,用于将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前L帧信号与第j个模板的匹配结果Wj;和
判决子模块,用于依据获取所有谐波模板的匹配结果的子模块获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的估计值,并设定阈值λ,如果当前分析单元的浊音存在性估计值大于设定λ,则判断当前L帧信号中的每一帧都含有浊音。
10.根据权利要求9所述的抗噪声干扰的浊语音检测系统,其特征在于,所述系统还包含:移动及进一步抉择模块,用于将长度为L的分析窗向后移动1帧,由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210056627.XA CN103310800B (zh) | 2012-03-06 | 2012-03-06 | 一种抗噪声干扰的浊语音检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210056627.XA CN103310800B (zh) | 2012-03-06 | 2012-03-06 | 一种抗噪声干扰的浊语音检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103310800A true CN103310800A (zh) | 2013-09-18 |
CN103310800B CN103310800B (zh) | 2015-10-07 |
Family
ID=49135939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210056627.XA Expired - Fee Related CN103310800B (zh) | 2012-03-06 | 2012-03-06 | 一种抗噪声干扰的浊语音检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103310800B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106356076A (zh) * | 2016-09-09 | 2017-01-25 | 北京百度网讯科技有限公司 | 基于人工智能的语音活动性检测方法和装置 |
CN109489747A (zh) * | 2018-12-24 | 2019-03-19 | 合肥工业大学 | 一种基于谐波分析的电磁流量计信号处理方法 |
CN110189765A (zh) * | 2019-04-25 | 2019-08-30 | 武汉大晟极科技有限公司 | 基于频谱形状的语音特征估计方法 |
CN110648686A (zh) * | 2018-06-27 | 2020-01-03 | 塞舌尔商元鼎音讯股份有限公司 | 调整语音频率的方法及其声音播放装置 |
CN115954012A (zh) * | 2023-03-03 | 2023-04-11 | 成都启英泰伦科技有限公司 | 一种周期性瞬态干扰事件检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1912992A (zh) * | 2005-08-08 | 2007-02-14 | 中国科学院声学研究所 | 一种基于谐波特征的浊音检测方法 |
CN1912993A (zh) * | 2005-08-08 | 2007-02-14 | 中国科学院声学研究所 | 基于能量及谐波的语音端点检测方法 |
JP2009294537A (ja) * | 2008-06-06 | 2009-12-17 | Raytron:Kk | 音声区間検出装置および音声区間検出方法 |
-
2012
- 2012-03-06 CN CN201210056627.XA patent/CN103310800B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1912992A (zh) * | 2005-08-08 | 2007-02-14 | 中国科学院声学研究所 | 一种基于谐波特征的浊音检测方法 |
CN1912993A (zh) * | 2005-08-08 | 2007-02-14 | 中国科学院声学研究所 | 基于能量及谐波的语音端点检测方法 |
JP2009294537A (ja) * | 2008-06-06 | 2009-12-17 | Raytron:Kk | 音声区間検出装置および音声区間検出方法 |
Non-Patent Citations (2)
Title |
---|
国雁萌; 盛任农; 牟英良;: "基于能量和浊音特性的语音端点检测", 《计算机工程与应用》 * |
安茂波; 国雁萌; 付强; 颜永红: "行驶汽车环境中的话音活动检测研究", 《应用声学》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106356076A (zh) * | 2016-09-09 | 2017-01-25 | 北京百度网讯科技有限公司 | 基于人工智能的语音活动性检测方法和装置 |
CN106356076B (zh) * | 2016-09-09 | 2019-11-05 | 北京百度网讯科技有限公司 | 基于人工智能的语音活动性检测方法和装置 |
CN110648686A (zh) * | 2018-06-27 | 2020-01-03 | 塞舌尔商元鼎音讯股份有限公司 | 调整语音频率的方法及其声音播放装置 |
CN109489747A (zh) * | 2018-12-24 | 2019-03-19 | 合肥工业大学 | 一种基于谐波分析的电磁流量计信号处理方法 |
CN109489747B (zh) * | 2018-12-24 | 2020-03-20 | 合肥工业大学 | 一种基于谐波分析的电磁流量计信号处理方法 |
CN110189765A (zh) * | 2019-04-25 | 2019-08-30 | 武汉大晟极科技有限公司 | 基于频谱形状的语音特征估计方法 |
CN110189765B (zh) * | 2019-04-25 | 2021-08-20 | 武汉大晟极科技有限公司 | 基于频谱形状的语音特征估计方法 |
CN115954012A (zh) * | 2023-03-03 | 2023-04-11 | 成都启英泰伦科技有限公司 | 一种周期性瞬态干扰事件检测方法 |
CN115954012B (zh) * | 2023-03-03 | 2023-05-09 | 成都启英泰伦科技有限公司 | 一种周期性瞬态干扰事件检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103310800B (zh) | 2015-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9047878B2 (en) | Speech determination apparatus and speech determination method | |
US11430461B2 (en) | Method and apparatus for detecting a voice activity in an input audio signal | |
US6427134B1 (en) | Voice activity detector for calculating spectral irregularity measure on the basis of spectral difference measurements | |
EP2828856B1 (en) | Audio classification using harmonicity estimation | |
CN109545188A (zh) | 一种实时语音端点检测方法及装置 | |
CN105118522B (zh) | 噪声检测方法及装置 | |
CN103310800B (zh) | 一种抗噪声干扰的浊语音检测方法及系统 | |
CN110706693B (zh) | 语音端点的确定方法及装置、存储介质、电子装置 | |
CN108053842B (zh) | 基于图像识别的短波语音端点检测方法 | |
CN104464722A (zh) | 基于时域和频域的语音活性检测方法和设备 | |
JP6493889B2 (ja) | 音声信号を検出するための方法および装置 | |
WO2014094242A1 (en) | Method and apparatus for mitigating feedback in a digital radio receiver | |
KR20090076683A (ko) | 신호 검출 방법, 장치 및 그 방법을 실행하는 프로그램이기록된 기록매체 | |
KR101762723B1 (ko) | 피치 주기의 정확도를 검출하는 방법 및 장치 | |
CN105810201A (zh) | 语音活动检测方法及其系统 | |
US20130255473A1 (en) | Tonal component detection method, tonal component detection apparatus, and program | |
CN111312291B (zh) | 信噪比检测方法、系统、移动终端及存储介质 | |
CN104575513A (zh) | 突发噪声的处理系统、突发噪声的检测及抑制方法与装置 | |
KR100930061B1 (ko) | 신호 검출 방법 및 장치 | |
CN111477246B (zh) | 语音处理方法、装置及智能终端 | |
CN101308651A (zh) | 音频暂态信号的检测方法 | |
CN103337245B (zh) | 基于子带信号的信噪比曲线的噪声抑制方法及装置 | |
CN104900227A (zh) | 语音特征信息的提取方法及电子设备 | |
CN105429657B (zh) | 一种短波接收机及其去噪方法 | |
WO2020039598A1 (ja) | 信号処理装置、信号処理方法および信号処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151007 |