CN106571138B - 一种信号端点的检测方法、检测装置及检测设备 - Google Patents

一种信号端点的检测方法、检测装置及检测设备 Download PDF

Info

Publication number
CN106571138B
CN106571138B CN201510648598.XA CN201510648598A CN106571138B CN 106571138 B CN106571138 B CN 106571138B CN 201510648598 A CN201510648598 A CN 201510648598A CN 106571138 B CN106571138 B CN 106571138B
Authority
CN
China
Prior art keywords
input signal
signal
envelope
gain
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510648598.XA
Other languages
English (en)
Other versions
CN106571138A (zh
Inventor
梁民
汪法兵
梁先华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Telecommunications Technology CATT
Original Assignee
China Academy of Telecommunications Technology CATT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Telecommunications Technology CATT filed Critical China Academy of Telecommunications Technology CATT
Priority to CN201510648598.XA priority Critical patent/CN106571138B/zh
Publication of CN106571138A publication Critical patent/CN106571138A/zh
Application granted granted Critical
Publication of CN106571138B publication Critical patent/CN106571138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Control Of Amplification And Gain Control (AREA)

Abstract

本发明提供了一种信号端点的检测方法、检测装置及检测设备,涉及信号处理技术领域。本发明的检测方法包括:获取输入信号;对所述输入信号进行处理,得到所述输入信号的包络信号;对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;根据所述增益序列,确定所述输入信号的端点。本发明的方案,可以实时地实现信号端点的检测,具有较低的处理时延,且具有较低的计算复杂度。

Description

一种信号端点的检测方法、检测装置及检测设备
技术领域
本发明涉及信号处理技术领域,特别涉及一种信号端点的检测方法、检测装置及检测设备。
背景技术
目前语音信号端点检测技术大都抽取语音信号时-频域的特征参数,然后对其进行分类判决以完成语音信号端点检测的任务。语音信号的时域特征参数包括短时平均能量、短时平均幅度和短时平均过零率,而其时-频域特征参数包括倒谱系数、周期率测度和信息熵等;语音信号的端点判决方式由原来的单门限和双门限发展到基于模糊逻辑和模式分类的判决。
目前语音信号端点检测技术均是基于信号帧或子帧结构进行处理的,因而处理延时至少为一个信号帧或子帧的时长;此外,利用信号的时-频特征参数进行语音端点检测尽管具有一定的鲁棒特性,但其特征的抽取均具有一定的计算复杂度。
发明内容
本发明要解决的技术问题是提供一种信号端点的检测方法、检测装置及检测设备。
为了解决上述技术问题,本发明实施例提供一种信号端点的检测方法,包括:
获取输入信号;
对所述输入信号进行处理,得到所述输入信号的包络信号;
对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;
根据所述增益序列,确定所述输入信号的端点。
其中,所述对所述输入信号进行处理,得到所述输入信号的包络信号的步骤包括:
获取所述输入信号的幅值;
根据所述幅值,得到所述输入信号的包络信号。
其中,所述根据所述幅值,得到所述输入信号的包络信号的步骤包括:
根据公式:
Figure GDA0002376304250000021
Figure GDA0002376304250000022
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000023
为输入信号的包络,x(n)为输入信号,|x(n)|为输入信号的幅值,0<α<1且α为起音常数,0<β<1且β为衰减常数。
其中,所述对所述输入信号进行处理,得到所述输入信号的包络信号的步骤包括:
获取所述输入信号的瞬时功率;
根据所述瞬时功率,得到所述输入信号的包络信号。
其中,所述获取所述输入信号的瞬时功率的步骤包括:
根据公式:Px(n)=|x(n)|2得到输入信号的瞬时功率;
其中,x(n)为输入信号,Px(n)为输入信号的瞬时功率。
其中,所述根据所述瞬时功率,得到所述输入信号的包络信号的步骤包括:
根据公式:
Figure GDA0002376304250000024
Figure GDA0002376304250000025
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000026
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
其中,所述对所述输入信号进行处理,得到所述输入信号的包络信号的步骤包括:
获取所述输入信号的瞬时Teager能量;
根据所述瞬时Teager能量,得到所述输入信号的包络信号。
其中,所述获取所述输入信号的瞬时Teager能量的步骤包括:
根据公式:ETeager(n)=|x(n)|2-x(n-1)x(n+1)得到输入信号的瞬时Teager能量;
其中,x(n)为输入信号,ETeager(n)为输入信号的瞬时Teager能量。
其中,所述根据所述瞬时Teager能量,得到所述输入信号的包络信号的步骤包括:
根据公式:
Figure GDA0002376304250000031
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000032
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
其中,所述对所述输入信号进行处理,得到所述输入信号的包络信号的步骤包括:
获取所述输入信号的短时帧能量;
根据所述短时帧能量,得到所述输入信号的包络信号。
其中,所述获取所述输入信号的短时帧能量的步骤包括:
根据公式:
Figure GDA0002376304250000033
得到输入信号的第n帧的短时能量;
其中,Ef(n)为第n帧的短时能量,δ=1或2,N为信号帧长度,n=0,1,…。
其中,所述根据所述短时帧能量,得到所述输入信号的包络信号的步骤包括:
根据公式:
Figure GDA0002376304250000034
Figure GDA0002376304250000035
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000036
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
其中,所述对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平的步骤包括:
利用公式:y(n)=包络信号×vAgc(n)得到处理后的输出电平;
其中,y(n)为输出电平,vAgc(n)为当前时刻的增益。
其中,所述根据所述处理后的输出电平进行增益调整,得到调整后的增益序列的步骤包括:
将当前时刻的输出电平与电平门限进行比较;
若输出电平大于或等于电平门限,则降低增益;
若输出电平小于电平门限的预设百分比,则提高增益;
获取调整后的增益序列。
其中,若所述若输出电平大于或等于电平门限,则降低增益的步骤具体为:
根据公式:vAgc(n+1)=vAgc(n)×γ降低下一时刻的增益;
其中,vAgc(n)为当前时刻的增益,vAgc(n+1)为下一时刻的增益,γ<1。
其中,所述若输出电平小于电平门限的预设百分比,则提高增益的步骤包括:
根据公式:vAgc(n+1)=vAgc(n)×Pk提高下一时刻的增益;
其中,vAgc(n)为当前时刻的增益,vAgc(n+1)为下一时刻的增益,Pk=vAgcTbl[k],且k=INT{[输出电平/电平门限]×10};
其中,vAgcTbl[i]=Pi,且P0>P1>…>Pr-1>1.0,i=0,1,2,…,r-1;
r=INT{p%×10}+1,其中,INT{·}为取整函数,p%为电平门限的预设百分比。
其中,所述根据所述增益序列,确定所述输入信号的端点的步骤包括:
对所述增益序列进行滤波处理得到所述增益序列的预设包络;
对所述预设包络进行伪归一化处理得到处理后的包络序列;
对所述包络序列进行判断,确定所述输入信号的端点。
其中,所述预设包络为上包络或下包络。
其中,所述对所述增益序列进行滤波处理得到所述增益序列的预设包络的步骤包括:
采用最小值有序统计滤波取得所述增益序列的预设包络;或者
采用最大值有序统计滤波取得所述增益序列的预设包络;或者
采用中值有序统计滤波取得所述增益序列的预设包络。
其中,所述对所述预设包络进行伪归一化处理得到处理后的包络序列的步骤包括:
利用公式:vAgcEnvNorm(n)=vAgcEnv(n)/vAgcEnvMax(n)得到伪归一化处理后的包络序列;
其中,vAgcEnvNorm(n)是对vAgcEnv(n)进行伪归一化处理后得到的伪归一化增益序列包络,vAgcEnv(n)为增益序列的预设包络,vAgcEnvMax(n)为当前时刻的预设包络的最大值,且vAgcEnvMax(n)=max{vAgcEnvMax(n-1),vAgcEnv(n)}。
其中,对所述包络序列进行判断,确定所述输入信号的端点的步骤包括:
将所述包络序列与预设增益门限进行比较,得到所述输入信号在每一时刻的状态;
根据所述输入信号在每一时刻的状态,得到所述输入信号的起始端点和结束端点。
其中,所述将所述包络序列与预设增益门限进行比较,得到所述输入信号在每一时刻的状态的步骤包括:
利用公式:
Figure GDA0002376304250000051
得到输入信号在每一时刻的状态;
其中,SpeechFlag(n)为输入信号在当前时刻的状态,SPEECHON为有信号输入状态,SPEECHOFF为没有信号输入状态,AGCTH为预设增益门限。
其中,对所述包络序列进行判断,确定所述输入信号的端点的步骤包括:
将所述包络序列与预设增益门限以及噪声电平门限或信号电平门限进行比较,得到所述输入信号在每一时刻的状态;
根据所述输入信号在每一时刻的状态,得到所述输入信号的起始端点和结束端点。
其中,所述将所述包络序列与预设增益门限以及噪声电平门限或信号电平门限进行比较,得到所述输入信号在每一时刻的状态的步骤包括:
根据公式:
Figure GDA0002376304250000052
得到所述输入信号在每一时刻的状态;
其中,SpeechFlag(n)为输入信号在当前时刻的状态,SPEECHON为有信号输入状态,SPEECHOFF为没有信号输入状态,AGCTH为预设增益门限;
SigTh(n)=scale_s×minStatistics(n),其中,SigTh(n)为信号电平门限,scale_s为信号电平比例系数;
NoiTh(n)=scale_n×minStatistics(n),其中,NoiTh(n)为噪声电平门限,scale_n为噪声比例系数,minStatistics(n)为当前时刻得到的包络信号的最小值。
其中,所述输入信号为语音信号、以太网收发信号、家居电话线联网协议HPNA收发信号或具有突发模式特征的信号。
本发明实施例提供一种信号端点的检测装置,包括:
第一获取模块,用于获取输入信号;
第一处理模块,用于对所述输入信号进行处理,得到所述输入信号的包络信号;
第二处理模块,对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
第二获取模块,用于根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;
确定模块,根据所述增益序列,确定所述输入信号的端点。
其中,所述第二获取模块包括:
比较单元,用于将当前时刻的输出电平与电平门限进行比较;
第一调整单元,用于若输出电平大于或等于电平门限,则降低增益;
第二调整单元,用于若输出电平小于电平门限的预设百分比,则提高增益;
获取单元,用于获取调整后的增益序列。
其中,所述确定模块包括:
滤波处理单元,用于对所述增益序列进行滤波处理得到所述增益序列的预设包络;
伪归一化处理单元,用于对所述预设包络进行伪归一化处理得到处理后的包络序列;
确定单元,用于对所述包络序列进行判断,确定所述输入信号的端点。
本发明实施例提供一种信号端点的检测设备,包括:
处理器;以及通过总线接口与所述处理器相连接的存储器,所述存储器用于存储所述处理器在执行操作时所使用的程序和数据,当处理器调用并执行所述存储器中所存储的程序和数据时,实现如下的功能模块:
第一获取模块,用于获取输入信号;
第一处理模块,用于对所述输入信号进行处理,得到所述输入信号的包络信号;
第二处理模块,对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
第二获取模块,用于根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;
确定模块,根据所述增益序列,确定所述输入信号的端点。
本发明的有益效果是:
上述方案,可以实时地进行信号端点的检测,因检测结果是基于信号样本给出的,因而具有较低的处理时延;且本发明的所述检测方法具有较低的计算复杂度,易于实现。
附图说明
图1表示本发明实施例一的所述检测方法的流程示意图;
图2表示本发明实施例二的所述检测方法的流程示意图;
图3表示本发明实施例三的所述检测方法的流程示意图;
图4表示基于输入信号的幅值来进行端点检测的示意图;
图5表示本发明实施例的检测方法的详细流程示意图;
图6表示基于输入信号的瞬时功率来进行端点检测的示意图;
图7表示基于输入信号的瞬时能量来进行端点检测的示意图;
图8表示基于输入信号的短时帧能量来进行端点检测的示意图;
图9表示本发明实施例的检测装置的模块示意图;
图10表示本发明实施例的检测设备的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。
本发明针对现有的信号端点检测技术是基于信号帧或子帧结构进行处理的,因而存在至少一个信号帧或子帧的时延,同时,此种检测技术计算较为复杂,不利于节约成本的问题,提供一种信号端点的检测方法、检测装置及检测设备,可以实时地进行信号端点的检测,同时降低了计算复杂度。
实施例一
如图1所示,本发明实施例一的所述信号端点的检测方法,包括:
步骤11,获取输入信号;
需要说明的是,所述输入信号包括但不限于是语音信号、以太网收发信号或家居电话线联网协议HPNA收发信号,而本发明中主要以输入信号为语音信号进行后续的阐述。
步骤12,对所述输入信号进行处理,得到所述输入信号的包络信号;
需要说明的是,本发明中不是直接使用输入信号,而是将所述输入信号进行特定的处理,得到输入信号的包络信号。
步骤13,对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
需要说明的是,因本发明中采用语音信号进行主要的描述,因而此处对信号的处理为对输入信号进行增益放大或缩小。
步骤14,根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;
本发明中,为了使得输入信号经处理后的输出电平维持在预设的变化范围内,因此当输出电平不在预设范围内时,需要对增益进行调整,以使得后续的输出电平继续维持在该预设的变化范围内,经过此番调整,便可得到处理该输入信号的增益序列。
步骤15,根据所述增益序列,确定所述输入信号的端点。
因增益序列反映的是输入信号的信号大小,因此通过对增益序列的判断,便可得到该输入信号在何时为信号的开始端点,何时为信号的结束端点。
需要说明的是,上述方案,可以实时地进行信号端点的检测,因检测结果是基于信号样本给出的,因而具有较低的处理时延;且本发明的所述检测方法具有较低的计算复杂度,易于实现。
在步骤12中,因对输入信号的处理方式不同,得到的输入信号的包络也会不同,因此,本实施例中,所述步骤12在实现时可以包括:
步骤121,获取所述输入信号的幅值;
步骤122,根据所述幅值,得到所述输入信号的包络信号。
具体的,所述步骤122可以采用如下方式实现:
根据公式:
Figure GDA0002376304250000091
Figure GDA0002376304250000092
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000093
为输入信号的包络信号,x(n)为输入信号,|x(n)|为输入信号的幅值,0<α<1且α为起音常数,0<β<1且β为衰减常数。
可选地,所述步骤12在实现时可以包括:
步骤123,获取所述输入信号的瞬时功率;
步骤124,根据所述瞬时功率,得到所述输入信号的包络信号。
具体地,所述步骤123可以采用如下方式实现:
根据公式:Px(n)=|x(n)|2得到输入信号的瞬时功率;
其中,x(n)为输入信号,Px(n)为输入信号的瞬时功率。
对应地,所述步骤124可以采用如下方式实现:
根据公式:
Figure GDA0002376304250000094
Figure GDA0002376304250000095
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000096
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
可选地,所述步骤12在实现时可以包括:
步骤125,获取所述输入信号的瞬时Teager能量;
步骤126,根据所述瞬时Teager能量,得到所述输入信号的包络信号。
具体的,所述步骤125可以采用如下方式实现:
根据公式:ETeager(n)=|x(n)|2-x(n-1)x(n+1)得到输入信号的瞬时Teager能量;
其中,x(n)为输入信号,ETeager(n)为输入信号的瞬时Teager能量。
对应地,所述步骤126采用如下方式实现:
根据公式:
Figure GDA0002376304250000101
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000102
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
可选地,所述步骤12在实现时可以包括:
步骤127,获取所述输入信号的短时帧能量;
步骤128,根据所述短时帧能量,得到所述输入信号的包络信号。
具体地,所述步骤127可以采用如下方式实现:
根据公式:
Figure GDA0002376304250000103
得到输入信号的第n帧的短时能量;
其中,Ef(n)为第n帧的短时能量,δ=1或2,N为信号帧长度,n=0,1,…。
对应地,所述步骤128采用如下方式实现:
根据公式:
Figure GDA0002376304250000104
Figure GDA0002376304250000105
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000106
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
应当说明的是,所述输入信号在经处理后,得到的并不限于输入信号的幅值、瞬时功率、瞬时Teager能量或短时帧能量,任何可有效表征信号功率或能量大小的物理量及其组合均属于本发明的保护范围。
同时,需要说明的是,所述步骤13主要是将包络信号进行增益放大或缩小,即将包络信号与预设放大或缩小倍数相乘便可实现,因此步骤13可以通过采用如下公式实现:
y(n)=包络信号×vAgc(n)得到放大后的输出电平;
其中,y(n)为输出电平,vAgc(n)为当前时刻的增益。
因步骤13实现较为简单,因此不再进行过多的说明。
实施例二
如图2所示,本发明实施例二所述的信号端点的检测方法,包括:
步骤21,获取输入信号;
步骤22,对所述输入信号进行处理,得到所述输入信号的包络信号;
步骤23,对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
步骤24,将当前时刻的输出电平与电平门限进行比较;
步骤25,若输出电平大于或等于电平门限,则降低增益;
步骤26,若输出电平小于电平门限的预设百分比,则提高增益;
步骤27,获取调整后的增益序列;
步骤28,根据所述增益序列,确定所述输入信号的端点。
需要说明的是,上述步骤24至步骤26主要是为了使得经过增益放大或缩小处理后的输出电平维持在预设范围内,因此在当前时刻得到的输出电平不满足要求时,需对应调整下一个时刻的增益,以使得下一时刻,根据增益获取得到的输出电平在预设范围内。
需要说明的是,当采用输入信号的幅值进行处理时,所述输入信号的幅值的包络信号在经过处理后的输出电平应在最大幅值电平(Vmax)的P%和Vmax之间,例如,经过处理后的输出电平应维持在0.8Vmax~Vmax之间;应当说明的是,当采用输入信号的瞬时功率进行处理时,所述输入信号的瞬时功率的包络信号在经过处理后的输出电平应在最大瞬时功率电平(Pmax)的P%和Pmax之间;当采用输入信号的瞬时Teager能量进行处理时,所述输入信号的瞬时Teager能量的包络信号在经过处理后的输出电平应在最大瞬时Teager能量电平(ETeagermax)的P%和ETeager,max之间;当采用输入信号的短时帧能量进行处理时,所述输入信号的短时帧能量的包络信号在经过处理后的输出电平应在最大短时帧能量电平(Emax)的P%和Emax之间。
可选的,所述步骤25可以采用如下公式实现:
根据公式:vAgc(n+1)=vAgc(n)×γ降低下一时刻的增益;
其中,vAgc(n)为当前时刻的增益,vAgc(n+1)为下一时刻的增益,γ<1。
所述步骤26可以采用如下公式实现:
根据公式:vAgc(n+1)=vAgc(n)×Pk提高下一时刻的增益;
其中,vAgc(n)为当前时刻的增益,vAgc(n+1)为下一时刻的增益,Pk=vAgcTbl[k],且k=INT{[输出电平/电平门限]×10};
应当说明的是,在进行增益的提高时,主要是依据预设的增益调节比例表(vAgcTbl[k])进行增益的提高,vAgcTbl[k]中存放有多个预设增益提高比例,根据当前时刻的输出电平取得vAgcTbl[k]中下一时刻的增益的提高比例,进行增益的调节;具体的所述增益调节比例表的实现方式为:
vAgcTbl[i]=Pi,且P0>P1>…>Pr-1>1.0,i=0,1,2,…,r-1;
r=INT{p%×10}+1,其中,INT{·}为取整函数,p%为电平门限的预设百分比。
应当说明的是,实施例二中,通过输出电平对增益进行调节,使得输出电平保持在预设范围内,从而可以根据输入信号得到较为准确的增益序列,保证了后续端点检测的准确。
实施例三
如图3所示,本实施例三的信号端点的检测方法包括:
步骤31,获取输入信号;
步骤32,对所述输入信号进行处理,得到所述输入信号的包络信号;
步骤33,对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
步骤34,根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;
步骤35,对所述增益序列进行滤波处理得到所述增益序列的预设包络;
需要说明的是,因该增益序列在输入信号在有信号的状态下呈现出相应的凹口特性,但是由于该增益序列是基于输入信号样本得到的,因而这种特征不够细致,不足以准确判定输入信号的起始和终止端点位置,为此,对该增益序列进行滤波平滑处理,以得到该增益序列的预设包络,应当说明的是所述预设包络可以为增益序列的上包络也可以为增益序列的下包络。
步骤36,对所述预设包络进行伪归一化处理得到处理后的包络序列;
需要说明的是,由于不同的工作环境下接收的信号电平存在差异,需要对预设包络进行处理,在现有技术中通常采用归一化处理方式,但是当在线处理时,仅能获取当前时刻和更早时刻的预设包络样本,因此,无法像离线情况那样可以求得预设包络的全局最大值,因此,本发明中采用伪归一化处理方式,即采用当前时刻和历史时刻的预设包络样本中的最大值对提取到的预设包络进行归一化处理。
步骤37,对所述包络序列进行判断,确定所述输入信号的端点。
在得到伪归一化处理后的包络序列后,便可判断该包络序列是处于有信号状态还是没有信号状态,根据得到的一系列的信号状态便可确定该输入信号的起始端点和结束端点。
需要说明的是,所述步骤35在实现时可以包括步骤351,采用最小值有序统计滤波取得所述增益序列的预设包络;或者
步骤352,采用最大值有序统计滤波取得所述增益序列的预设包络;或者
步骤353,采用中值有序统计滤波取得所述增益序列的预设包络。
应当说明的是,本发明中并不限于上述滤波方式,任何规定次序的有序统计滤波技术均属于本发明的保护范围。
以最小值有序统计滤波为例,所述步骤351的具体实现方式为:
采用公式:W(i)=W(i-1);W(0)=vAgc(n);
vAgcEnv(n)=min{W(i),i=0,1,2,…,L-1}的得到预设包络;
其中,i=L-1,L-2,…,2;且W是长度为L个样本的缓存器。
可选地,所述步骤36可以采用如下方式实现:
利用公式:vAgcEnvNorm(n)=vAgcEnv(n)/vAgcEnvMax(n)得到伪归一化处理后的包络序列;
其中,vAgcEnvNorm(n)是对vAgcEnv(n)进行伪归一化处理后得到的伪归一化增益序列包络,vAgcEnv(n)为增益序列的预设包络,vAgcEnvMax(n)为当前时刻的预设包络的最大值,且vAgcEnvMax(n)=max{vAgcEnvMax(n-1),vAgcEnv(n)}。
可选地,所述步骤37在实现时可以包括:
步骤371,将所述包络序列与预设增益门限进行比较,得到所述输入信号在每一时刻的状态;
步骤372,根据所述输入信号在每一时刻的状态,得到所述输入信号的起始端点和结束端点。
具体地,所述步骤371可以采用如下方式实现:
利用公式:
Figure GDA0002376304250000141
得到输入信号在每一时刻的状态;
其中,SpeechFlag(n)为输入信号在当前时刻的状态,SPEECHON为有信号输入状态,SPEECHOFF为没有信号输入状态,AGCTH为预设增益门限。
应当说明的是,为了保证该信号端点的检测更准确,所述步骤37在实现时可以包括:
步骤373,将所述包络序列与预设增益门限以及噪声电平门限或信号电平门限进行比较,得到所述输入信号在每一时刻的状态;
步骤374,根据所述输入信号在每一时刻的状态,得到所述输入信号的起始端点和结束端点。
具体地,所述步骤371可以采用如下方式实现:
根据公式:
Figure GDA0002376304250000142
得到所述输入信号在每一时刻的状态;
其中,SpeechFlag(n)为输入信号在当前时刻的状态,SPEECHON为有信号输入状态,SPEECHOFF为没有信号输入状态,AGCTH为预设增益门限;
SigTh(n)=scale_s×minStatistics(n),其中,SigTh(n)为信号电平门限,scale_s为信号电平比例系数;
NoiTh(n)=scale_n×minStatistics(n),其中,NoiTh(n)为噪声电平门限,scale_n为噪声比例系数,minStatistics(n)为当前时刻得到的包络信号的最小值。
本发明以上实施例通过对输入信号进行预处理,得到增益序列,然后利用该增益序列的凹口特定,判断出该输入信号的起始端点和结束端点,该方法具有较低的处理时延、较低的计算复杂度,易于实现。
对本发明的实现方式举例说明如下:
以检测语音信号的端点为例,本发明的实现原理为:将接收到的语音信号样本通过一个虚拟自动增益控制器(VAGC)放大至预先规定范围的幅值电平,在无语音信号的情况下,VAGC的增益将逐步地增大至其最大值;而在有语音信号的情况下,VAGC的增益将由其先前的最大值而突然下降,以便使输入通过VAGC放大后的输出电平在规定的电平范围内。因在整个语音信号持续期间,VAGC的增益将维持在一个较低的水平,而在该语音信号段结束后,VAGC的增益又将逐步地增大至其最大值,VAGC增益曲线在有语音信号出现期间呈现一个凹口特性,本发明便是利用语音信号出现期间增益曲线的凹口特性进行语音信号端点的检测。如图4所示,将首先获取语音信号样本x(n)的幅值|x(n)|,然后获取该幅值的包络
Figure GDA0002376304250000151
Figure GDA0002376304250000152
在增益放大器中进行放大处理,得到输出电平y(n),然后根据输出电平调整VAGC的增益,获取增益序列,然后计算该增益序列的下包络,并将该下包络进行伪归一化处理,将处理后的信号序列输入信号端点检测判决逻辑器,该信号端点检测判决逻辑器利用信号电平门限变量和噪声电平门限变量以及增益门限进行当前时刻输入信号的状态判决,最后将整体的判决结果输出给选通门逻辑,由选通门逻辑将该判决结果送至识别系统进行处理。
如图5所示,对图4中的由语音信号样本得到其端点的判决过程说明如下:
1、首先初始化有关参数和变量,设置n=0。
2、根据公式1计算n时刻的语音信号的幅值的包络
Figure GDA0002376304250000157
公式1:
Figure GDA0002376304250000153
Figure GDA0002376304250000154
其中,
Figure GDA0002376304250000155
为语音信号的幅值的包络信号,|x(n)|为语音信号的幅值,0<α<1且α为起音常数,0<β<1且β为衰减常数。
3、根据公式2计算增益放大器的输出y(n);
公式2:
Figure GDA0002376304250000156
其中,y(n)为输出电平,vAgc(n)为n时刻的增益;
4、判断y(n)是否大于或等于幅值电平Vmax
5、若y(n)>=Vmax,则利用公式3更新增益放大器的增益;
公式3:vAgc(n+1)=vAgc(n)×γ;
其中,vAgc(n+1)为n+1时刻的增益,vAgc(n)为n时刻的增益,γ<1。
6、如果y(n)<Vmax,则判断y(n)是否小于Vmax的p%。
7、如果y(n)<Vmax×p%,则根据公式4至公式6更新增益放大器的增益;
公式4:vAgc(n+1)=vAgc(n)×Pk
公式5:Pk=vAgcTbl[k];
公式6:k=INT{[y(n)/Vmax]×10};
其中,vAgcTbl[i]=Pi,且P0>P1>…>Pr-1>1.0,i=0,1,2,…,r-1;
r=INT{p%×10}+1,其中,INT{·}为取整函数。
8、根据公式7至公式9提取增益序列的下包络;
公式7:W(i)=W(i-1);其中,i=L-1,L-2,…,2;
公式8:W(0)=vAgc(n);其中,vAgc(n)为n时刻的增益序列;
公式9:vAgcEnv(n)=min{W(i),i=0,1,2,…,L-1};其中,vAgcEnv(n)为n时刻的增益序列的下包络。
9、根据公式10和公式11对下包络进行为归一化处理;
公式10:vAgcEnvNorm(n)=vAgcEnv(n)/vAgcEnvMax(n);
公式11:vAgcEnvMax(n)=max{vAgcEnvMax(n-1),vAgcEnv(n)};
其中,vAgcEnvNorm(n)为伪归一化处理后的下包络,vAgcEnvMax(n)为n时刻的增益序列的最大值。
10、根据公式12得到n时刻的判决结果;
公式12:
Figure GDA0002376304250000161
其中,SpeechFlag(n)为语音信号在当前时刻的状态,SPEECHON为有信号输入状态,SPEECHOFF为没有信号输入状态,AGCTH为预设增益门限,SigTh(n)为信号电平门限,NoiTh(n)为噪声电平门限。
11、根据公式13至15分别更新信号电平门限和噪声电平门限;
公式13:SigTh(n)=scale_s×minStatistics(n),NoiTh(n)=scale_n×minStatistics(n);
其中,scale_s为信号电平比例系数,scale_n为噪声比例系数。
如果vAgcEnvNorm(n)≥AGCTH且SpeechFlag(n)=SPEECHOFF,则利用公式14和公式15更新minStatistics(n);否则minStatistics(n)不做更新,且
Figure GDA0002376304250000171
复位成Vmax
首先利用公式14更新幅值的包络的最小值;
公式14:
Figure GDA0002376304250000172
Figure GDA0002376304250000173
然后再利用公式15更新minStatistics(n);
公式15:
Figure GDA0002376304250000174
12、判断语音信号是否结束;
13、如果语音信号未结束,则n=n+1,继续进行下一时刻的语音信号的判决。
图6、图7和图8分别为利用利用语音信号的瞬时功率、瞬时能量(如瞬时Teager能量)、短时帧能量来进行语音信号端点检测的信号流程示意图,因图6、图7和图8中所表示的内容与图4中的类似,在此便不再进行详细的说明。
实施例四
如图9所示,本发明实施例的信号端点的检测装置90,包括:
第一获取模块91,用于获取输入信号;
第一处理模块92,用于对所述输入信号进行处理,得到所述输入信号的包络信号;
第二处理模块93,对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
第二获取模块94,用于根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;
确定模块95,根据所述增益序列,确定所述输入信号的端点。
需要说明的是,所述输入信号为语音信号、以太网收发信号家居电话线联网协议HPNA收发信号或其它具有“突发模式”(burst mode)特征的信号。
应当说明的是,所述第一处理模块92在实现时,可以包括:
幅值获取单元,用于获取所述输入信号的幅值;
幅值包络获取单元,用于根据所述幅值,得到所述输入信号的包络信号。
其中,所述幅值包络获取单元具体用于:
根据公式:
Figure GDA0002376304250000181
Figure GDA0002376304250000182
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000183
为输入信号的包络,x(n)为输入信号,|x(n)|为输入信号的幅值,0<α<1且α为起音常数,0<β<1且β为衰减常数。
所述第一处理模块92在实现时,可以包括:
瞬时功率获取单元,用于获取所述输入信号的瞬时功率;
瞬时功率包络获取单元,用于根据所述瞬时功率,得到所述输入信号的包络信号。
进一步地,所述瞬时功率获取单元具体用于:
根据公式:Px(n)=|x(n)|2得到输入信号的瞬时功率;
其中,x(n)为输入信号,Px(n)为输入信号的瞬时功率。
进一步地,所述瞬时功率包络获取单元具体用于:
根据公式:
Figure GDA0002376304250000184
Figure GDA0002376304250000185
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000186
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
所述第一处理模块92在实现时,可以包括:
瞬时能量获取单元,用于获取所述输入信号的瞬时Teager能量;
瞬时能量包络获取单元,用于根据所述瞬时Teager能量,得到所述输入信号的包络信号。
进一步地,所述瞬时能量获取单元具体用于:
根据公式:ETeager(n)=|x(n)|2-x(n-1)x(n+1)得到输入信号的瞬时Teager能量;
其中,x(n)为输入信号,ETeager(n)为输入信号的瞬时Teager能量。
所述瞬时能量包络获取单元具体用于:
根据公式:
Figure GDA0002376304250000191
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000192
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
所述第一处理模块92在实现时,可以包括:
短时帧能量获取单元,用于获取所述输入信号的短时帧能量;
短时帧能量包络获取单元,用于根据所述短时帧能量,得到所述输入信号的包络信号。
进一步地,短时帧能量获取单元具体用于:
根据公式:
Figure GDA0002376304250000193
得到输入信号的第n帧的短时能量;
其中,Ef(n)为第n帧的短时能量,δ=1或2,N为信号帧长度,n=0,1,…。
进一步地,短时帧能量包络获取单元具体用于:
根据公式:
Figure GDA0002376304250000194
Figure GDA0002376304250000195
得到输入信号的包络信号;
其中,
Figure GDA0002376304250000196
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
可选地,所述第二处理模块93具体用于:
利用公式:y(n)=包络信号×vAgc(n)得到处理后的输出电平;
其中,y(n)为输出电平,vAgc(n)为当前时刻的增益。
可选地,所述第二获取模块94包括:
比较单元,用于将当前时刻的输出电平与电平门限进行比较;
第一调整单元,用于若输出电平大于或等于电平门限,则降低增益;
第二调整单元,用于若输出电平小于电平门限的预设百分比,则提高增益;
获取单元,用于获取调整后的增益序列。
进一步地,所述第一调整单元具体用于:
根据公式:vAgc(n+1)=vAgc(n)×γ降低下一时刻的增益;
其中,vAgc(n)为当前时刻的增益,vAgc(n+1)为下一时刻的增益,γ<1。
进一步地,所述第二调整单元具体用于:
根据公式:vAgc(n+1)=vAgc(n)×Pk提高下一时刻的增益;
其中,vAgc(n)为当前时刻的增益,vAgc(n+1)为下一时刻的增益,Pk=vAgcTbl[k],且k=INT{[输出电平/电平门限]×10};
其中,vAgcTbl[i]=Pi,且P0>P1>…>Pr-1>1.0,i=0,1,2,…,r-1;
r=INT{p%×10}+1,其中,INT{·}为取整函数,p%为电平门限的预设百分比。
可选地,所述确定模块95包括:
滤波处理单元,用于对所述增益序列进行滤波处理得到所述增益序列的预设包络;
伪归一化处理单元,用于对所述预设包络进行伪归一化处理得到处理后的包络序列;
确定单元,用于对所述包络序列进行判断,确定所述输入信号的端点。
其中,所述预设包络为上包络或下包络。
可选地,所述滤波处理单元具体用于:
采用最小值有序统计滤波取得所述增益序列的预设包络;或者
采用最大值有序统计滤波取得所述增益序列的预设包络;或者
采用中值有序统计滤波取得所述增益序列的预设包络。
可选地,所述伪归一化处理单元具体用于:
利用公式:vAgcEnvNorm(n)=vAgcEnv(n)/vAgcEnvMax(n)得到伪归一化处理后的包络序列;
其中,vAgcEnvNorm(n)是对vAgcEnv(n)进行伪归一化处理后得到的伪归一化增益序列包络,vAgcEnv(n)为增益序列的预设包络,vAgcEnvMax(n)为当前时刻的预设包络的最大值,且vAgcEnvMax(n)=max{vAgcEnvMax(n-1),vAgcEnv(n)}。
可选地,所述确定单元在具体实现时,可以包括:
第一比较子单元,用于将所述包络序列与预设增益门限进行比较,得到所述输入信号在每一时刻的状态;
第一确定子单元,用于根据所述输入信号在每一时刻的状态,得到所述输入信号的起始端点和结束端点。
其中,所述第一比较子单元具体用于:
利用公式:
Figure GDA0002376304250000211
得到输入信号在每一时刻的状态;
其中,SpeechFlag(n)为输入信号在当前时刻的状态,SPEECHON为有信号输入状态,SPEECHOFF为没有信号输入状态,AGCTH为预设增益门限。
所述确定单元在具体实现时,可以包括:
第二比较子单元,用于将所述包络序列与预设增益门限以及噪声电平门限或信号电平门限进行比较,得到所述输入信号在每一时刻的状态;
第二确定子单元,用于根据所述输入信号在每一时刻的状态,得到所述输入信号的起始端点和结束端点。
其中,所述第二比较子单元具体用于:
根据公式:
Figure GDA0002376304250000212
得到所述输入信号在每一时刻的状态;
其中,SpeechFlag(n)为输入信号在当前时刻的状态,SPEECHON为有信号输入状态,SPEECHOFF为没有信号输入状态,AGCTH为预设增益门限;
SigTh(n)=scale_s×minStatistics(n),其中,SigTh(n)为信号电平门限,scale_s为信号电平比例系数;
NoiTh(n)=scale_n×minStatistics(n),其中,NoiTh(n)为噪声电平门限,scale_n为噪声比例系数,minStatistics(n)为当前时刻得到的包络信号的最小值。
需要说明的是,该检测装置的实施例是与上述检测方法实施例一一对应的检测装置,上述检测方法实施例中所有实现方式均适用于该检测装置的实施例中,也能达到相同的技术效果。
实施例五
如图10所示,本实施例提供一种信号端点的检测设备,包括:
处理器101;以及通过总线接口102与所述处理器101相连接的存储器103,所述存储器103用于存储所述处理器101在执行操作时所使用的程序和数据,当处理器101调用并执行所述存储器103中所存储的程序和数据时,实现如下的功能模块:
第一获取模块,用于获取输入信号;
第一处理模块,用于对所述输入信号进行处理,得到所述输入信号的包络信号;
第二处理模块,对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
第二获取模块,用于根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;
确定模块,根据所述增益序列,确定所述输入信号的端点。
该处理器101还用于实现上述检测设备的其它任意一个模块的功能。
本领域技术人员可以理解,实现上述实施例的全部或者部分步骤可以通过硬件来完成,也可以通过计算机程序来指示相关的硬件来完成,所述计算机程序包括执行上述方法的部分或者全部步骤的指令;且该计算机程序可以存储于一可读存储介质中,存储介质可以是任何形式的存储介质。
以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在本发明的保护范围内。

Claims (25)

1.一种信号端点的检测方法,其特征在于,包括:
获取输入信号;
对所述输入信号进行处理,得到所述输入信号的包络信号;
对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;
根据所述增益序列,确定所述输入信号的端点;
其中,所述增益序列反映的是所述输入信号的信号大小,所述输入信号的端点包括:输入信号的起始端点和结束端点;
其中,增益调整的原则为维持所述处理后的输出电平在预设范围内。
2.根据权利要求1所述的信号端点的检测方法,其特征在于,所述对所述输入信号进行处理,得到所述输入信号的包络信号的步骤包括:
获取所述输入信号的幅值;
根据所述幅值,得到所述输入信号的包络信号。
3.根据权利要求2所述的信号端点的检测方法,其特征在于,所述根据所述幅值,得到所述输入信号的包络信号的步骤包括:
根据公式:
Figure FDA0002376304240000011
得到输入信号的包络信号;
其中,
Figure FDA0002376304240000012
为输入信号的包络,x(n)为输入信号,|x(n)|为输入信号的幅值,0<α<1且α为起音常数,0<β<1且β为衰减常数,n为信号样本的时间索引。
4.根据权利要求1所述的信号端点的检测方法,其特征在于,所述对所述输入信号进行处理,得到所述输入信号的包络信号的步骤包括:
获取所述输入信号的瞬时功率;
根据所述瞬时功率,得到所述输入信号的包络信号。
5.根据权利要求4所述的信号端点的检测方法,其特征在于,所述获取所述输入信号的瞬时功率的步骤包括:
根据公式:Px(n)=|x(n)|2得到输入信号的瞬时功率;
其中,x(n)为输入信号,Px(n)为输入信号的瞬时功率,n为信号样本的时间索引。
6.根据权利要求5所述的信号端点的检测方法,其特征在于,所述根据所述瞬时功率,得到所述输入信号的包络信号的步骤包括:
根据公式:
Figure FDA0002376304240000021
得到输入信号的包络信号;
其中,
Figure FDA0002376304240000022
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
7.根据权利要求1所述的信号端点的检测方法,其特征在于,所述对所述输入信号进行处理,得到所述输入信号的包络信号的步骤包括:
获取所述输入信号的瞬时Teager能量;
根据所述瞬时Teager能量,得到所述输入信号的包络信号。
8.根据权利要求7所述的信号端点的检测方法,其特征在于,所述获取所述输入信号的瞬时Teager能量的步骤包括:
根据公式:ETeager(n)=|x(n)|2-x(n-1)x(n+1)得到输入信号的瞬时Teager能量;
其中,x(n)为输入信号,ETeager(n)为输入信号的瞬时Teager能量,n为信号样本的时间索引。
9.根据权利要求8所述的信号端点的检测方法,其特征在于,所述根据所述瞬时Teager能量,得到所述输入信号的包络信号的步骤包括:
根据公式:
Figure FDA0002376304240000023
得到输入信号的包络信号;
其中,
Figure FDA0002376304240000024
为包络信号,0<α<1且α为起音常数,0<β<1且β为衰减常数。
10.根据权利要求1所述的信号端点的检测方法,其特征在于,所述对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平的步骤包括:
利用公式:y(n)=包络信号×vAgc(n)得到处理后的输出电平;
其中,y(n)为输出电平,vAgc(n)为当前时刻的增益,n为信号样本的时间索引。
11.根据权利要求1所述的信号端点的检测方法,其特征在于,所述根据所述处理后的输出电平进行增益调整,得到调整后的增益序列的步骤包括:
将当前时刻的输出电平与电平门限进行比较;
若输出电平大于或等于电平门限,则降低增益;
若输出电平小于电平门限的预设百分比,则提高增益;
获取调整后的增益序列。
12.根据权利要求11所述的信号端点的检测方法,其特征在于,若所述若输出电平大于或等于电平门限,则降低增益的步骤具体为:
根据公式:vAgc(n+1)=vAgc(n)×γ降低下一时刻的增益;
其中,vAgc(n)为当前时刻的增益,vAgc(n+1)为下一时刻的增益,γ<1,n为信号样本的时间索引。
13.根据权利要求11所述的信号端点的检测方法,其特征在于,所述若输出电平小于电平门限的预设百分比,则提高增益的步骤包括:
根据公式:vAgc(n+1)=vAgc(n)×Pk提高下一时刻的增益;
其中,vAgc(n)为当前时刻的增益,vAgc(n+1)为下一时刻的增益,k=INT{[输出电平/电平门限]×10};
其中,vAgcTbl[k]=Pk,k=0,1,2,…,r-1,Pk为预设的增益调节比例常数,且P0>P1>…>Pr-1>1.0;
r=INT{p%×10}+1,其中,INT{·}为取整函数,p%为电平门限的预设百分比,n为信号样本的时间索引。
14.根据权利要求1所述的信号端点的检测方法,其特征在于,所述根据所述增益序列,确定所述输入信号的端点的步骤包括:
对所述增益序列进行滤波处理得到所述增益序列的预设包络;
对所述预设包络进行伪归一化处理得到处理后的包络序列;
对所述包络序列进行判断,确定所述输入信号的端点。
15.根据权利要求14所述的信号端点的检测方法,其特征在于,所述预设包络为上包络或下包络。
16.根据权利要求14所述的信号端点的检测方法,其特征在于,所述对所述增益序列进行滤波处理得到所述增益序列的预设包络的步骤包括:
采用最小值有序统计滤波取得所述增益序列的预设包络;或者
采用最大值有序统计滤波取得所述增益序列的预设包络;或者
采用中值有序统计滤波取得所述增益序列的预设包络。
17.根据权利要求14所述的信号端点的检测方法,其特征在于,所述对所述预设包络进行伪归一化处理得到处理后的包络序列的步骤包括:
利用公式:vAgcEnvNorm(n)=vAgcEnv(n)/vAgcEnvMax(n)得到伪归一化处理后的包络序列;
其中,vAgcEnvNorm(n)是对vAgcEnv(n)进行伪归一化处理后得到的伪归一化增益序列包络,vAgcEnv(n)为增益序列的预设包络,vAgcEnvMax(n)为当前时刻的预设包络的最大值,且vAgcEnvMax(n)=max{vAgcEnvMax(n-1),vAgcEnv(n)},n为信号样本的时间索引。
18.根据权利要求14所述的信号端点的检测方法,其特征在于,对所述包络序列进行判断,确定所述输入信号的端点的步骤包括:
将所述包络序列与预设增益门限进行比较,得到所述输入信号在每一时刻的状态;
根据所述输入信号在每一时刻的状态,得到所述输入信号的起始端点和结束端点。
19.根据权利要求18所述的信号端点的检测方法,其特征在于,所述将所述包络序列与预设增益门限进行比较,得到所述输入信号在每一时刻的状态的步骤包括:
利用公式:
Figure FDA0002376304240000041
得到输入信号在每一时刻的状态;
其中,SpeechFlag(n)为输入信号在当前时刻的状态,SPEECHON为有信号输入状态,SPEECHOFF为没有信号输入状态,AGCTH为预设增益门限,n为信号样本的时间索引;vAgcEnvNorm(n)是对vAgcEnv(n)进行伪归一化处理后得到的伪归一化增益序列包络,vAgcEnv(n)为增益序列的预设包络。
20.根据权利要求14所述的信号端点的检测方法,其特征在于,对所述包络序列进行判断,确定所述输入信号的端点的步骤包括:
将所述包络序列与预设增益门限以及噪声电平门限或信号电平门限进行比较,得到所述输入信号在每一时刻的状态;
根据所述输入信号在每一时刻的状态,得到所述输入信号的起始端点和结束端点;
其中,所述将所述包络序列与预设增益门限以及噪声电平门限或信号电平门限进行比较,得到所述输入信号在每一时刻的状态的步骤包括:
根据公式:
Figure FDA0002376304240000051
得到所述输入信号在每一时刻的状态;
其中,SpeechFlag(n)为输入信号在当前时刻的状态,SPEECHON为有信号输入状态,SPEECHOFF为没有信号输入状态,AGCTH为预设增益门限;
SigTh(n)=scale_s×minStatistics(n),其中,SigTh(n)为信号电平门限,scale_s为信号电平比例系数;
NoiTh(n)=scale_n×minStatistics(n),其中,NoiTh(n)为噪声电平门限,scale_n为噪声比例系数,minStatistics(n)为当前时刻得到的包络信号的最小值;
Figure FDA0002376304240000052
为输入信号的包络;vAgcEnvNorm(n)是对vAgcEnv(n)进行伪归一化处理后得到的伪归一化增益序列包络,vAgcEnv(n)为增益序列的预设包络;n为信号样本的时间索引。
21.根据权利要求1所述的信号端点的检测方法,其特征在于,所述输入信号为语音信号、以太网收发信号、家居电话线联网协议HPNA收发信号或具有突发模式特征的信号。
22.一种信号端点的检测装置,其特征在于,包括:
第一获取模块,用于获取输入信号;
第一处理模块,用于对所述输入信号进行处理,得到所述输入信号的包络信号;
第二处理模块,对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
第二获取模块,用于根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;
确定模块,根据所述增益序列,确定所述输入信号的端点;
其中,所述增益序列反映的是所述输入信号的信号大小,所述输入信号的端点包括:输入信号的起始端点和结束端点;
其中,增益调整的原则为维持所述处理后的输出电平在预设范围内。
23.根据权利要求22所述的信号端点的检测装置,其特征在于,所述第二获取模块包括:
比较单元,用于将当前时刻的输出电平与电平门限进行比较;
第一调整单元,用于若输出电平大于或等于电平门限,则降低增益;
第二调整单元,用于若输出电平小于电平门限的预设百分比,则提高增益;
获取单元,用于获取调整后的增益序列。
24.根据权利要求22所述的信号端点的检测装置,其特征在于,所述确定模块包括:
滤波处理单元,用于对所述增益序列进行滤波处理得到所述增益序列的预设包络;
伪归一化处理单元,用于对所述预设包络进行伪归一化处理得到处理后的包络序列;
确定单元,用于对所述包络序列进行判断,确定所述输入信号的端点。
25.一种信号端点的检测设备,其特征在于,包括:
处理器;以及通过总线接口与所述处理器相连接的存储器,所述存储器用于存储所述处理器在执行操作时所使用的程序和数据,当处理器调用并执行所述存储器中所存储的程序和数据时,实现如下的功能模块:
第一获取模块,用于获取输入信号;
第一处理模块,用于对所述输入信号进行处理,得到所述输入信号的包络信号;
第二处理模块,对所述包络信号进行增益放大或缩小处理,得到处理后的输出电平;
第二获取模块,用于根据所述处理后的输出电平进行增益调整,得到调整后的增益序列;
确定模块,根据所述增益序列,确定所述输入信号的端点;
其中,所述增益序列反映的是所述输入信号的信号大小,所述输入信号的端点包括:输入信号的起始端点和结束端点;
其中,增益调整的原则为维持所述处理后的输出电平在预设范围内。
CN201510648598.XA 2015-10-09 2015-10-09 一种信号端点的检测方法、检测装置及检测设备 Active CN106571138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510648598.XA CN106571138B (zh) 2015-10-09 2015-10-09 一种信号端点的检测方法、检测装置及检测设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510648598.XA CN106571138B (zh) 2015-10-09 2015-10-09 一种信号端点的检测方法、检测装置及检测设备

Publications (2)

Publication Number Publication Date
CN106571138A CN106571138A (zh) 2017-04-19
CN106571138B true CN106571138B (zh) 2020-08-11

Family

ID=58506044

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510648598.XA Active CN106571138B (zh) 2015-10-09 2015-10-09 一种信号端点的检测方法、检测装置及检测设备

Country Status (1)

Country Link
CN (1) CN106571138B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110444194B (zh) * 2019-06-28 2021-08-20 北京捷通华声科技股份有限公司 一种语音检测方法和装置
CN112382312A (zh) * 2020-09-23 2021-02-19 福建信通慧安科技有限公司 目标探测器及目标探测方法
CN111884665B (zh) * 2020-09-28 2021-01-01 中国人民解放军国防科技大学 基于最大熵的数字接收机自动增益控制方法
CN112420079B (zh) * 2020-11-18 2022-12-06 青岛海尔科技有限公司 语音端点检测方法和装置、存储介质及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19831320A1 (de) * 1998-07-13 2000-01-27 Ericsson Telefon Ab L M Digitales adaptives Filter und akustischer Echokompensator
GB2409389B (en) * 2003-12-09 2005-10-05 Wolfson Ltd Signal processors and associated methods
KR100710509B1 (ko) * 2006-04-11 2007-04-25 남상욱 펄스면적변조를 이용한 고효율 선형 전력증폭기 시스템
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
CN100580693C (zh) * 2008-01-30 2010-01-13 中国科学院计算技术研究所 一种广告检测识别方法及系统
CN202068572U (zh) * 2011-02-16 2011-12-07 上海弘广电子科技有限公司 网络音效处理器
US9349386B2 (en) * 2013-03-07 2016-05-24 Analog Device Global System and method for processor wake-up based on sensor data

Also Published As

Publication number Publication date
CN106571138A (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
CN106571138B (zh) 一种信号端点的检测方法、检测装置及检测设备
WO2018107874A1 (zh) 一种音频数据的自动增益控制方法与装置
CN110335593B (zh) 语音端点检测方法、装置、设备及存储介质
KR20160024858A (ko) 지역성 말투를 구분하는 음성 데이터 인식 방법, 장치 및 서버
CN110047519B (zh) 一种语音端点检测方法、装置及设备
JP2008534989A (ja) 音声アクティビティ検出装置および方法
EP3118852B1 (en) Method and device for detecting audio signal
CN104485103B (zh) 一种基于矢量泰勒级数的多环境模型孤立词识别方法
CN111540342B (zh) 一种能量阈值调整方法、装置、设备及介质
WO2004075167A2 (en) Log-likelihood ratio method for detecting voice activity and apparatus
CN103366739A (zh) 面向孤立词语音识别的自适应端点检测方法及其系统
CN104900232A (zh) 一种基于双层gmm结构和vts特征补偿的孤立词识别方法
CN103559887A (zh) 用于语音增强系统的背景噪声估计方法
CN109360585A (zh) 一种语音激活检测方法
CN107910017A (zh) 一种带噪语音端点检测中阈值设定的方法
CN103996399B (zh) 语音检测方法和系统
CN111179931A (zh) 用于语音交互的方法、装置及家用电器
CN111048118B (zh) 一种语音信号处理方法、装置及终端
WO2017128910A1 (zh) 一种语音出现概率的确定方法、装置及电子设备
US10600432B1 (en) Methods for voice enhancement
CN113314153B (zh) 语音端点检测的方法、装置、设备和存储介质
CN113470691B (zh) 一种语音信号的自动增益控制方法及其相关装置
CN112102818B (zh) 结合语音活性检测和滑动窗噪声估计的信噪比计算方法
CN109427345B (zh) 一种风噪检测方法、装置及系统
JPS6147437B2 (zh)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant