CN103310800B - 一种抗噪声干扰的浊语音检测方法及系统 - Google Patents

一种抗噪声干扰的浊语音检测方法及系统 Download PDF

Info

Publication number
CN103310800B
CN103310800B CN201210056627.XA CN201210056627A CN103310800B CN 103310800 B CN103310800 B CN 103310800B CN 201210056627 A CN201210056627 A CN 201210056627A CN 103310800 B CN103310800 B CN 103310800B
Authority
CN
China
Prior art keywords
template
harmonic
frequency
energy
frame signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210056627.XA
Other languages
English (en)
Other versions
CN103310800A (zh
Inventor
国雁萌
李凯
姜开宇
付强
颜永红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Beijing Kexin Technology Co Ltd
Original Assignee
Institute of Acoustics CAS
Beijing Kexin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS, Beijing Kexin Technology Co Ltd filed Critical Institute of Acoustics CAS
Priority to CN201210056627.XA priority Critical patent/CN103310800B/zh
Publication of CN103310800A publication Critical patent/CN103310800A/zh
Application granted granted Critical
Publication of CN103310800B publication Critical patent/CN103310800B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种抗噪声干扰的浊语音检测方法及系统,该方法基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述方法包含:步骤101)针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;步骤102)基于上步骤的模板,每帧信号与模板的匹配过程均包括若干次能量范围选择,使某受到干扰的频率范围得到忽略;步骤103)利用多帧信号基音频率的连续性,进行浊语音存在性的最终判决。本发明针对人类语音的基音频率范围,利用了基音频率按对数尺度变化的谐波模板,能够只用较少的模板获得良好的匹配结果,从而保证了检测过程的快速准确。

Description

一种抗噪声干扰的浊语音检测方法及系统
技术领域
本发明涉及一种浊语音检测方法。更具体地说,本发明提出了一种抗噪声干扰的浊语音检测方法及系统。
背景技术
随着语音信号处理系统的应用日益广泛,背景噪声干扰问题变得越来越严重。对语音信号和背景噪声进行区别,并将噪声拒绝在语音信号处理系统之外,是减少背景噪声干扰的最直接和有效手段。由于语音信号是由清音和浊音共同组成的,其中浊音信号在时长和能量方面占据了绝对的优势,所以,一般可以通过检测浊音信号实现语音/噪声的初步判决。
浊音是由周期性的声门脉冲激励声道而产生的,其中声门脉冲的振动频率即基音频率。因此,浊音信号在基音频率和基音的整数倍频上都具有较高的能量,而在其它频率上的能量则明显较低。由于基音频率是连续缓变的,所以如果对浊音进行短时频谱分析,则相邻帧之间的基音频率和谐波频率都比较接近,并可连接为类似梳状的一系列连续谐波谱线,这就是浊音信号特有的谐波结构。
浊语音的检测方法主要包括基于基频周期性和基于谐波特性两类。其中,基于周期性的方法主要通过信号自相关判断信号是否具有周期性,基于谐波特性的方法则利用信号在频域上均匀分布的能量极值点作为检测依据,如谐波能量和、最小二乘周期估计(LSPE)等。但是,这些方法利用的是全频带或固定频带的信息,而实际噪声的频谱能量分布往往是时变的,所以这些方法不适合用于实际环境中的浊语音检测。
发明内容
本发明的目的在于,为克服现有浊语音的检测方法的诸多缺陷,提供一种抗噪声干扰的浊语音检测方法及系统。
为实现上述目的,本发明提供了一种抗噪声干扰的浊语音检测方法,该方法基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述方法包含:
步骤101)针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;
步骤102)基于上步骤的模板,每帧信号与模板的匹配过程均包括若干次能量范围选择,使某受到干扰的频率范围得到忽略;
步骤103)利用多帧信号基音频率的连续性,进行浊语音存在性判决,从而最终确定一段信号中是否包含浊语音。
上述技术方案中,所述步骤101)进一步包含如下子步骤:
步骤201)对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
步骤202)根据人类语音的基音频率范围,及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对;其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类,且M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小。
所述步骤102)对每一帧输入信号的离散频谱能量,用M个模板与之相比对,每一个模板的比对方法如下,以第j个模板进行说明,其中j=1..M:
301)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
302)对第j个模板,设定一个比例因子α1,根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值,
其中,[]表示取整运算,将谐波平均能量和非谐波平均能量的比值记为R1;0<α1<0.3;
303)按照步骤302)的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk,上述的k个参数αi取值范围都在0到0.3之间,i=1..k,且两两不相等;
304)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj
305)对每一帧信号,都可利用步骤301)到步骤304)获得M个模板的匹配结果Q1~QM,并将其保存作为检测谐波结构的依据。
所述步骤103)进一步包含如下步骤:
401)将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前L帧信号与第j个模板的匹配结果Wj
402)在当前L帧信号与M个模板匹配获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的估计值,并设定阈值λ,如果当前分析单元的浊音存在性估计值大于设定λ,则判断当前L帧信号中的每一帧都含有浊音;
403)将长度为L的分析窗向后移动1帧,采用上述步骤判断其是否包含浊语音。
所述步骤403)进一步包含:由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
基于上述方法,本发明还提供了一种抗噪声干扰的浊语音检测系统,该系统基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述系统包含:
谐波模板生成模块,用于针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;
信号与谐波模板匹配模块,用于完成每帧信号与谐波模板的匹配过程,其中每次匹配过程均包括若干次能量范围选择;和
浊语音存在性判决模块,利用多帧信号基音频率的连续性,最终确定一段信号中是否包含浊语音。
上述技术方案中,所述谐波模板生成模块进一步包含如下子模块:
处理子模块,用于对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
谐波模板生成子模块,用于根据人类语音的基音频率范围,及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对;其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类,且M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小。
上述技术方案中,所述信号与谐波模板匹配模块对每一帧输入信号的离散频谱能量,用M个模板与之相比对,每一个模板的比对方法如下,以第j个模板进行说明,其中j=1..M:
301)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
302)对第j个模板,设定一个比例因子α1,根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值,
其中,[]表示取整运算,将谐波平均能量和非谐波平均能量的比值记为R1;0<α1<0.3;
303)按照步骤302)的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk,上述的k个参数αi取值范围都在0到0.3之间,i=1..k,且两两不相等;
304)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj
305)对每一帧信号,都可利用步骤301)到步骤304)获得M个模板的匹配结果Q1~QM,并将其保存作为检测谐波结构的依据。
上述技术方案中,所述浊语音存在性判决模块进一步包含如下子模块:
获取所有谐波模板的匹配结果的子模块,用于将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前L帧信号与第j个模板的匹配结果Wj;和
判决子模块,用于依据获取所有谐波模板的匹配结果的子模块获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的估计值,并设定阈值λ,如果当前分析单元的浊音存在性估计值大于设定λ,则判断当前L帧信号中的每一帧都含有浊音。
上述技术方案中,所述系统还包含:移动及进一步抉择模块,用于将长度为L的分析窗向后移动1帧,由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
与现有技术相比,本发明的优点在于:
本发明的浊语音检测方法,针对人类语音的基音频率范围,利用了基音频率按对数尺度变化的谐波模板,能够只用较少的模板获得良好的匹配结果(步骤2),从而保证了检测过程的快速准确。在此基础上,由于每帧信号与模板的匹配过程都包括几次能量范围选择,即使某些频率范围因受到信道影响或噪声干扰使得谐波结构不够清晰,这些受到干扰的频率范围也都会得到忽略,所以被干扰的浊语音信号也能被可靠的检测出来(步骤3)。最后,由于利用了多帧信号基音频率的连续性,浊语音的检测过程不易受到瞬态干扰的影响,不易把背景噪音误当作浊语音(步骤4-5)。
附图说明
图1是本发明实施例的一帧信号与谐波模板的匹配流程图;
图2是本发明提供的抗噪声干扰的浊语音检测方法的总流程图。
具体实施方式
下面结合具体实施例和附图对本发明进行详细描述。
本发明通过新的浊音检测方法,减小时变噪声对浊音检测的影响,提高检测的准确率。
为了达到上述目的,本发明提供了一种检测浊语音的方法,其框架是基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带。具体包括以下步骤:
1)对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
2)根据人类语音的基音频率范围(60-450Hz),以及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对。其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率。通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类。M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小;
3)对每一帧输入信号的离散频谱能量,用M个模板与之相比对。每一个模板的比对方法如步骤3-1至步骤3-4,以第j个模板为例进行说明,其中j=1..M;
3-1)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
3-2)对第j个模板,设定一个比例因子α1,其中0<α1<0.3。根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值。其中,[]表示取整运算。将谐波平均能量和非谐波平均能量的比值记为R1
3-3)按照步骤3-2的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk。上述的k个参数αi(i=1..k)取值范围都在0到0.3之间,且两两不相等;
3-4)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj
3-5)对每一帧信号,都可利用步骤3-1到步骤3-4获得M个模板的匹配结果Q1~QM,并将其保存下来作为检测谐波结构的依据;
4)将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前L帧信号与第j个模板的匹配结果Wj
5)在当前L帧信号与M个模板匹配获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的度量。设定阈值λ,如果当前分析单元的浊音存在性估计值大于λ,则判断当前L帧信号中的每一帧都含有浊音;
6)将长度为L的分析窗向后移动1帧,并根据步骤1-5判断其是否包含浊语音。由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
实施例1
如图2所示,本发明提供的浊语音方法,包括以下步骤:
1)对输入的单通道声音信号分帧并加窗后,用2N点快速傅里叶变换(FFT)计算其短时谱,并获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
2)根据人类语音的基音频率范围(60-450Hz),以及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对。其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,这些频率值都舍入到最近的离散频率点上。这样,每个模板都把N个离散频率点按谐波和非谐波进行了二元分类。M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小;
3)对每一帧输入信号的离散频谱能量,用M个模板与之相比对。每一个模板的比对方法如步骤3-1至步骤3-4,以第j个模板为例进行说明,其中j=1..M;如图1所示:
3-1)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
3-2)对第j个模板,设定一个比例因子α1,其中0<α1<0.3。根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值。其中,[]表示取整运算。将谐波平均能量和非谐波平均能量的比值记为R1
3-3)按照步骤3-2的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk。上述的k个参数αi(i=1..k)取值范围都在0到0.3之间,且两两不相等;
3-4)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj
3-5)对每一帧信号,利用步骤3-1)到步骤3-4)得到M个模板的匹配结果Q1~QM,并将其保存下来作为检测谐波结构的依据;
4)将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前分析单元与第j个模板的匹配结果Wj
5)在当前分析单元与M个模板匹配获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的度量。设定阈值λ,如果当前分析单元的浊音存在性估计值大于λ,则判断当前分析单元中的每帧信号都含有浊音;
6)将长度为L的分析窗向后移动1帧,并根据步骤1-5判断其是否包含浊语音。由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
最后应说明,此处所描述的实例仅用于解释本发明,本发明并不限定具体业务类别、用户终端类别以及支付系统类别,对以上内容所做的变换也落在本发明的保护范围之内。

Claims (8)

1.一种抗噪声干扰的浊语音检测方法,该方法基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述方法包含:
步骤101)针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;
步骤102)基于上步骤的模板,每帧信号与模板的匹配过程均包括若干次能量范围选择,使某受到干扰的频率范围得到忽略;
步骤103)利用多帧信号基音频率的连续性,进行浊语音存在性判决,从而最终确定一段信号中是否包含浊语音;
其中,所述步骤101)进一步包含如下子步骤:
步骤201)对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
步骤202)根据人类语音的基音频率范围,及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对;其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类,且M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小。
2.根据权利要求1所述的抗噪声干扰的浊语音检测方法,其特征在于,所述步骤102)对每一帧输入信号的离散频谱能量,用M个模板与之相比对,每一个模板的比对方法如下,以第j个模板进行说明,其中j=1..M:
301)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
302)对第j个模板,设定一个比例因子α1,根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值,
其中,[]表示取整运算,将谐波平均能量和非谐波平均能量的比值记为R1;0<α1<0.3;
303)按照步骤302)的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk,上述的k个参数αi取值范围都在0到0.3之间,i=1..k,且两两不相等;
304)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj
305)对每一帧信号,都可利用步骤301)到步骤304)获得M个模板的匹配结果Q1~QM,并将其保存作为检测谐波结构的依据。
3.根据权利要求2所述的抗噪声干扰的浊语音检测方法,其特征在于,所述步骤103)进一步包含如下步骤:
401)将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前L帧信号与第j个模板的匹配结果Wj
402)在当前L帧信号与M个模板匹配获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的估计值,并设定阈值λ,如果当前分析单元的浊音存在性估计值大于设定λ,则判断当前L帧信号中的每一帧都含有浊音;
403)将长度为L的分析窗向后移动1帧,采用上述步骤判断其是否包含浊语音。
4.根据权利要求3所述的抗噪声干扰的浊语音检测方法,其特征在于,所述步骤403)进一步包含:由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
5.一种抗噪声干扰的浊语音检测系统,该系统基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述系统包含:
谐波模板生成模块,用于针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;
信号与谐波模板匹配模块,用于完成每帧信号与谐波模板的匹配过程,其中每次匹配过程均包括若干次能量范围选择;和
浊语音存在性判决模块,利用多帧信号基音频率的连续性,最终确定一段信号中是否包含浊语音;
其中,所述谐波模板生成模块进一步包含如下子模块:
处理子模块,用于对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
谐波模板生成子模块,用于根据人类语音的基音频率范围,及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对;其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类,且M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小。
6.根据权利要求5所述的抗噪声干扰的浊语音检测系统,其特征在于,所述信号与谐波模板匹配模块对每一帧输入信号的离散频谱能量,用M个模板与之相比对,每一个模板的比对方法如下,以第j个模板进行说明,其中j=1..M:
301)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
302)对第j个模板,设定一个比例因子α1,根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值,
其中,[]表示取整运算,将谐波平均能量和非谐波平均能量的比值记为R1;0<α1<0.3;
303)按照步骤302)的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk,上述的k个参数αi取值范围都在0到0.3之间,i=1..k,且两两不相等;
304)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj
305)对每一帧信号,都可利用步骤301)到步骤304)获得M个模板的匹配结果Q1~QM,并将其保存作为检测谐波结构的依据。
7.根据权利要求6所述的抗噪声干扰的浊语音检测系统,其特征在于,所述浊语音存在性判决模块进一步包含如下子模块:
获取所有谐波模板的匹配结果的子模块,用于将总时间长度为80~150毫秒的连续L帧信号作为一个分析单元,计算它与M个模板的匹配结果,计算方法是:对第j个指定模板,其中j=1..M,将每帧信号对应与该模板的匹配值Qj相加,其总和即作为当前L帧信号与第j个模板的匹配结果Wj;和
判决子模块,用于依据获取所有谐波模板的匹配结果的子模块获得的M个结果W1~WM中,取最大值Wmax,作为当前L帧信号的浊音存在性的估计值,并设定阈值λ,如果当前分析单元的浊音存在性估计值大于设定λ,则判断当前L帧信号中的每一帧都含有浊音。
8.根据权利要求7所述的抗噪声干扰的浊语音检测系统,其特征在于,所述系统还包含:移动及进一步抉择模块,用于将长度为L的分析窗向后移动1帧,由于一帧信号可能会存在于L个分析窗中,只要其中任一个分析窗做出了“存在浊音”的判断,则认为该帧信号存在浊语音。
CN201210056627.XA 2012-03-06 2012-03-06 一种抗噪声干扰的浊语音检测方法及系统 Expired - Fee Related CN103310800B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210056627.XA CN103310800B (zh) 2012-03-06 2012-03-06 一种抗噪声干扰的浊语音检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210056627.XA CN103310800B (zh) 2012-03-06 2012-03-06 一种抗噪声干扰的浊语音检测方法及系统

Publications (2)

Publication Number Publication Date
CN103310800A CN103310800A (zh) 2013-09-18
CN103310800B true CN103310800B (zh) 2015-10-07

Family

ID=49135939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210056627.XA Expired - Fee Related CN103310800B (zh) 2012-03-06 2012-03-06 一种抗噪声干扰的浊语音检测方法及系统

Country Status (1)

Country Link
CN (1) CN103310800B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106356076B (zh) * 2016-09-09 2019-11-05 北京百度网讯科技有限公司 基于人工智能的语音活动性检测方法和装置
CN110648686B (zh) * 2018-06-27 2023-06-23 达发科技股份有限公司 调整语音频率的方法及其声音播放装置
CN109489747B (zh) * 2018-12-24 2020-03-20 合肥工业大学 一种基于谐波分析的电磁流量计信号处理方法
CN110189765B (zh) * 2019-04-25 2021-08-20 武汉大晟极科技有限公司 基于频谱形状的语音特征估计方法
CN115954012B (zh) * 2023-03-03 2023-05-09 成都启英泰伦科技有限公司 一种周期性瞬态干扰事件检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912993A (zh) * 2005-08-08 2007-02-14 中国科学院声学研究所 基于能量及谐波的语音端点检测方法
CN1912992A (zh) * 2005-08-08 2007-02-14 中国科学院声学研究所 一种基于谐波特征的浊音检测方法
JP2009294537A (ja) * 2008-06-06 2009-12-17 Raytron:Kk 音声区間検出装置および音声区間検出方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912993A (zh) * 2005-08-08 2007-02-14 中国科学院声学研究所 基于能量及谐波的语音端点检测方法
CN1912992A (zh) * 2005-08-08 2007-02-14 中国科学院声学研究所 一种基于谐波特征的浊音检测方法
JP2009294537A (ja) * 2008-06-06 2009-12-17 Raytron:Kk 音声区間検出装置および音声区間検出方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于能量和浊音特性的语音端点检测;国雁萌; 盛任农; 牟英良;;《计算机工程与应用》;20061231;全文 *
行驶汽车环境中的话音活动检测研究;安茂波; 国雁萌; 付强; 颜永红;《应用声学》;20120930;第31卷(第5期);全文 *

Also Published As

Publication number Publication date
CN103310800A (zh) 2013-09-18

Similar Documents

Publication Publication Date Title
US9047878B2 (en) Speech determination apparatus and speech determination method
Aneeja et al. Single frequency filtering approach for discriminating speech and nonspeech
US8600073B2 (en) Wind noise suppression
US8818806B2 (en) Speech processing apparatus and speech processing method
EP2743924B1 (en) Method and apparatus for adaptively detecting a voice activity in an input audio signal
CN103310800B (zh) 一种抗噪声干扰的浊语音检测方法及系统
CN101010722A (zh) 音频信号中话音活动的检测
CN104464722A (zh) 基于时域和频域的语音活性检测方法和设备
KR100930060B1 (ko) 신호 검출 방법, 장치 및 그 방법을 실행하는 프로그램이기록된 기록매체
CN105788603A (zh) 一种基于经验模态分解的音频识别方法及系统
CN105118522B (zh) 噪声检测方法及装置
CA2458428A1 (en) System for suppressing wind noise
CN102097095A (zh) 一种语音端点检测方法及装置
CN110265065B (zh) 一种构建语音端点检测模型的方法及语音端点检测系统
CN103905656B (zh) 残留回声的检测方法及装置
CN103730110A (zh) 一种检测语音端点的方法和装置
CN104599677A (zh) 基于语音重建的瞬态噪声抑制方法
CN108962285B (zh) 一种基于人耳掩蔽效应划分子带的语音端点检测方法
US20130255473A1 (en) Tonal component detection method, tonal component detection apparatus, and program
CN111312291B (zh) 信噪比检测方法、系统、移动终端及存储介质
CN108053842B (zh) 基于图像识别的短波语音端点检测方法
CN103248992A (zh) 一种基于双麦克风的目标方向语音活动检测方法及系统
CN104575513A (zh) 突发噪声的处理系统、突发噪声的检测及抑制方法与装置
CN101308651B (zh) 音频暂态信号的检测方法
KR100930061B1 (ko) 신호 검출 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151007