CN101308653A - 一种应用于语音识别系统的端点检测方法 - Google Patents
一种应用于语音识别系统的端点检测方法 Download PDFInfo
- Publication number
- CN101308653A CN101308653A CNA200810107116XA CN200810107116A CN101308653A CN 101308653 A CN101308653 A CN 101308653A CN A200810107116X A CNA200810107116X A CN A200810107116XA CN 200810107116 A CN200810107116 A CN 200810107116A CN 101308653 A CN101308653 A CN 101308653A
- Authority
- CN
- China
- Prior art keywords
- voice
- energy
- frame
- point
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明涉及一种应用于语音识别系统的端点检测方法,采用能量双门限算法与模型分类器判决相结合的方式,即检测—验证策略进行语音信号端点检测。在检测阶段,采用能量双门限算法进行能量初判;在验证阶段,先采用段过零率判决,然后再使用模型分类器进一步的验证,检测—验证策略的步骤包括:模型训练、能量初判、过零率判决、模型分类器判决、判断语音结束点和确认语音片段。本发明能高效准确的检测出语音的端点位置,同时,该方法较容易实现在线化,可以应用于语音识别实时系统。
Description
技术领域
本发明涉及语音识别领域。
背景技术
在语音识别系统中,数字语音信号是由静音段、噪声段及语音段混合组成的,在这种信号中将语音和各种非语音信号区分开来,准确的确定出语音信号被称为端点检测或语音活动性检测(Voice Activity Detection,VAD)。端点检测的正确与否,会直接影响到语音识别系统的性能,这表现在精度和速度两方面:首先,如果移除信号中的静音和噪声段有利于系统准确提取语音的特征,提高语音识别的准确率;其次,如果待处理的信号中包含大量的非语音部分,有效的端点检测算法可以去除噪声段的计算,则计算量会大大减小,速度也会显著提高。
端点检测的研究大致可以分为两类:基于特征的方法和基于模型的方法,基于特征的方法是指寻找对语音和噪声具有区分性的特征,按一定的规则来判断语音段与噪声段,所用的特征主要有能量、基频、过零率、熵等。基于模型的方法是指针对噪声与语音分别建模,用分类的方法来进行端点的检测。基于能量、过零率等特征的方法逻辑简单,计算效率高,容易应用于实时系统,这类方法在高信噪比的情况下效果很好,但在信噪比较低的情况下性能急剧下降。基于模型分类器的方法在模型与使用实际环境匹配的情况下能取得较好的效果,但这种方法的缺点是噪声的环境有很多种,无法针对所有的环境建立对应的模型,另外,基于模型的方法一般采用较多维数的特征,这样计算效率上相对较低。
发明内容
针对上述问题,本发明提供一种高效稳健的应用于语音识别系统的端点检测方法,能高效准确的检测出语音的端点位置;同时,该方法较容易实现在线化,可以应用于语音识别实时系统。
为解决上述问题,本发明提供了一种应用于语音识别系统的端点检测方法,含有能量双门限算法和基于模型的算法,该方法采用能量双门限算法与模型分类器判决相结合的方式,即检测-验证策略进行语音信号端点检测。在检测阶段,采用能量双门限算法进行能量初判;在验证阶段,先采用段过零率判决,然后再使用模型分类器进一步的验证。本发明的步骤包括:
模型训练;
进行能量初判,根据能量特征确定门限值,寻找可能的语音的起始点;
模型分类器判决,对能量初判阶段和过零率判决阶段得到的语音起始点进一步的验证;
判断语音结束点和确认语音片段。
所述模型训练的步骤为:首先,针对端点检测的应用环境收集训练数据,对训练数据进行人工标注,分为语音与非语音部分;其次,对训练库中的语音信号进行分帧处理,每帧提取十二维梅尔频率倒谱系数(Mel-Frequency CepstralCoefficients,MFCC)特征及一维能量特征,使用高斯混合模型(GaussianMixture Model,GMM)对这十三维特征进行建模,其中语音部分数据用来训练语音模型,非语音部分数据用来训练非语音模型;最后,使用最小分类错误准则(Minimum Classification Error,MCE)对得到的GMM模型进行区分性训练。
所述能量初判即根据能量特征确定门限,按一定的规则来寻找可能的语音的起始点,能量初判的过程描述如下:
1)根据背景噪声能量计算Esil,用来代表环境噪声情况;
2)根据Esil计算两个能量门限El和Eh;
3)判断从当前位置开始的x帧内有无连续y帧的能量大于El门限值,如果有,则记录可能的语音起始点的位置,如果没有,则重新判断;
4)判断从当前位置开始的m帧内有无连续n帧的能量大于Eh门限值,如果有,则该点为可能的语音起始点并进行下一步过零率判决,如果没有,则重新判断。
所述过零率判决是对能量初判阶段得到的语音起始点进行进一步的验证。从可能的语音起始点开始取一窗的数据,计算该窗数据的段平均过零率,如果段平均过零率大于门限值,则认为该语音起始点可信,继续下一步模型分类器判决,否则,认为该语音起始点不可信,重新判断。
所述模型分类器判决是对能量初判阶段和过零率判决阶段得到的语音起始点进行进一步的验证。所述模型分类器判决的过程描述如下:
1)从可能的语音起始点开始取一窗的数据;
2)逐帧进行判决,过程如下:对窗中的数据按帧提取十二维MFCC特征和一维能量特征,并对能量维特征进行归一化处理,然后,分别对于语音模型和非语音计算似然度,进而根据似然度进行判决,如果该帧的语音与非语音的log似然比大于门限值,则该帧判为语音;否则,该帧判为非语音;
3)进行段决策,即统计窗中判为语音的帧所占的比例,如果比例大于门限值,则确认语音起始点可信,开始判断语音结束点;否则,重新判断。
所述判断语音结束点是指在判决出语音起始点后,根据能量门限按一定的规则来判断语音的结束点。判断语音结束点的过程描述如下:
1)从语音起始点开始逐帧判断其能量值,如果低于能量门限El,则记录下该帧的位置;
2)从能量低于El的帧开始判断接下来的a帧是否包含b个能量大于Eh的帧,如果是,则该点不是语音结束点,重新判断;否则,该点是语音结束点。
所述确认语音片段,是指在判断出语音的起始点和结束点以后,根据一定的规则来确认是否为有效的语音片段。即判断语音结束点与语音起始点之间的间隔是否大于最小语音长段门限,如果是,则确认该段为语音;否则,该段不是有效的语音片段。
经过以上的流程以后,即可检测出语音数据,并送给识别器进行处理。
本发明结合了能量双门限、过零率及模型分类器,能高效准确的检测出语音的端点位置,同时,该方法较容易实现在线化,可以应用于语音识别实时系统。
附图说明
以下结合附图和实施例对本发明作进一步说明。
图1是本发明提供的应用于语音识别系统的端点检测流程图;
图2是能量双门限算法探测语音起始点的流程图。
具体实施方式
本发明采用能量双门限算法与模型分类器判决相结合的方式,即检测一验证策略进行语音信号端点检测。在检测阶段,采用能量双门限算法进行能量初判;在验证阶段,先采用段过零率判决,然后再使用模型分类器进一步的验证。本发明的步骤包括:
模型训练;
进行能量初判,根据能量特征确定门限值,寻找可能的语音的起始点;
模型分类器判决,对能量初判阶段和过零率判决阶段得到的语音起始点进一步的验证;
判断语音结束点和确认语音片段。
模型训练:首先,针对端点检测的应用环境收集训练数据,对训练数据进行人工标注,分为语音与非语音部分。其次,对训练库中的语音信号进行分帧处理,每帧提取十二维MFCC特征及一维能量特征,使用GMM模型对这十三维特征进行建模,其中语音部分数据用来训练语音模型,非语音部分数据用来训练非语音模型。最后,对得到的GMM模型进行区分性训练,使用MCE准则使训练后的语音模型与非语音模型更具有区分性。能量双门限算法与模型分类器相结合的端点检测流程参见图1。
步骤101:输入已数字化的语音数据,对语音数据进行分帧处理,帧长25ms,帧移10ms,然后进入步骤102。
步骤102:使用能量双门限方法进行初判,找到可能的语音起始点,其过程如图2所示,具体的步骤如下:
步骤201:从当前位置Cur处取i帧计算背景噪声能量Esil,计算公式如下:
进入步骤202。
步骤202:根据Esil计算两个能量门限El和Eh,计算公式如下:
El=Esil*α/(log(Esil)-β)
Eh=Esil*A/((log(Esil)-B)*(log(Esil)-Θ))
进入步骤203。
步骤203:判断从当前位置Cur处开始的x帧内有无连续y帧的能量大于El,如果是,则进入步骤204,否则当前位置向后移一帧,回到步骤201重新判断。
步骤204:判断从当前位置Cur处开始的m帧内有无连续n帧的能量大于Eh,如果是,则进入步骤205,否则当前位置向后移一帧,回到步骤201重新判断。
步骤205:记录可能的语音起始点位置,进入步骤103。
步骤103:使用过零率来验证步骤102中检测出的语音起始点是否为真正的语音起始点,具体的步骤是从可能的语音起始点开始取一窗的数据,窗长为L,计算该窗数据的段平均过零率,计算公式如下:
其中Ei代表第i帧的能量,β代表偏置值。
如果段平均过零率大于门限值,则认为该语音起始点可信,进入步骤104;否则,认为该语音起始点不可信,回到步骤102重新进行判断。
步骤104:使用模型分类器来验证步骤103验证后的语音起始点是否为真正的语音起始点,具体的步骤如下:
(1)进行帧判决,过程如下:对窗中的数据按帧提取MFCC和能量特征,并对能量维特征进行归一化处理。然后,分别对于语音模型和非语音计算似然度,计算公式如下:
其中,yt为第t帧的MFCC特征(t=1--L),λi为语音模型和非语音模型(i=1--2)。
假设λ1代表语音模型,λ2代表非语音模型,对于任一帧如果log(p(yi|λ1))-log(p(yi|λ2))大于门限值,则该帧判为语音,否则该帧判为非语音。
(2)进行段决策,即根据帧判决的结果统计窗中判为语音的帧所占的比例,如果比例大于门限值,则认为该语音起始点可信,进入步骤105,否则回到步骤102重新进行判断。
步骤105:根据能量门限按一定的规则来判断语音的结束点,判断语音结束点的过程如下:
(1)从步骤104中确定的语音起始点开始逐帧判断其能量值,如果低于能量门限El,则记录下该帧的位置;
(2)从能量低于El的帧开始判断接下来的a帧是否包含b个能量大于Eh的帧,如果是,则该点不是语音结束点,回到步骤102重新判断;否则,该点是语音结束点。
步骤106:判断步骤105中确定的语音结束点与步骤104中确定的语音起始点之间的间隔是否大于最小语音长段门限,如果是,则确认该段为语音;否则,该段不是有效的语音片段。
经过以上的步骤,即可检测出语音数据,并送给识别器进行处理。
与现有技术相比,本发明采用“检测-验证”的策略,在检测阶段,先采用简单的能量双门限算法过滤掉大量的静音段和部分能量较小的噪音段,有效的保证了端点检测算法的效率;在验证阶段,先采用段过零率判决过滤掉明显的噪音段,然后再使用模型分类器进行进一步的验证,而模型分类器的训练阶段引入了区分性训练,使得模型分类器的分类能力大大提高,验证的效果也有明显的改善。采用这种框架设计出的端点检测器,计算消耗较小,且端点检测的效果较为准确。
Claims (7)
1、一种应用于语音识别系统的端点检测方法,含有能量双门限算法和基于模型的算法,其特征在于该方法采用能量双门限算法与模型分类器判决相结合的方式,即检测-验证策略进行语音信号端点检测,在检测阶段,采用所述能量双门限算法进行能量初判;在验证阶段,先采用段过零率判决,然后再使用所述模型分类器进一步的验证,其步骤包括:
模型训练;
进行能量初判,根据能量特征确定门限值,寻找可能的语音的起始点;
模型分类器判决,对能量初判阶段和过零率判决阶段得到的语音起始点进一步的验证;
判断语音结束点和确认语音片段。
2、根据权利要求1所述的应用于语音识别系统的端点检测方法,其特征在于所述模型训练的步骤为:
1)针对端点检测的应用环境收集训练数据,对训练数据进行人工标注,分为语音与非语音部分;
2)对训练库中的语音信号进行分帧处理,每帧提取十二维梅尔频率倒谱系数特征及一维能量特征,使用高斯混合模型对这十三维特征进行建模,其中语音部分数据用来训练语音模型,非语音部分数据用来训练非语音模型;
3)使用最小分类错误准则对得到的高斯混合模型进行区分性训练。
3、根据权利要求1所述的应用于语音识别系统的端点检测方法,其特征在于所述能量初判的步骤为:
1)根据背景噪声能量计算Esil,用来代表环境噪声情况;
2)根据Esil计算两个能量门限El和Eh;
3)判断从当前位置开始的x帧内有无连续y帧的能量大于El门限值,如果有,则记录可能的语音起始点的位置,如果没有,则重新判断;
4)判断从当前位置开始的m帧内有无连续n帧的能量大于Eh门限值,如果有,则该点为可能的语音起始点并进行下一步过零率判决,如果没有,则重新判断。
4、根据权利要求3所述的应用于语音识别系统的端点检测方法,其特征在于所述过零率判决是从可能的语音起始点开始取一窗的数据,计算该窗数据的段平均过零率,如果段平均过零率大于门限值,则认为该语音起始点可信,继续下一步模型分类器判决,否则,认为该语音起始点不可信,重新判断。
5、根据权利要求4所述的应用于语音识别系统的端点检测方法,其特征在于所述模型分类器判决的步骤为:
1)从可能的语音起始点开始取一窗的数据;
2)逐帧进行判决,过程如下:对窗中的数据按帧提取十二维梅尔频率倒谱系数特征和能量特征,并对能量维特征进行归一化处理,然后,分别对于语音模型和非语音模型计算似然度,进而根据似然度进行判决,如果该帧的语音与非语音的log似然比大于门限值,则该帧判为语音;否则,该帧判为非语音;
3)进行段决策,即统计窗中判为语音的帧所占的比例,如果比例大于门限值,则确认语音起始点可信,开始判断语音结束点;否则,重新判断。
6、根据权利要求5所述的应用于语音识别系统的端点检测方法,其特征在于所述判断语音结束点的步骤为:
1)从语音起始点开始逐帧判断其能量值,如果低于能量门限El,则记录下该帧的位置;
2)从能量低于El的帧开始判断接下来的a帧是否包含b个能量大于Eh的帧,如果是,则该点不是语音结束点,重新判断;否则,该点是语音结束点。
7、根据权利要求1-6任一项所述的应用于语音识别系统的端点检测方法,其特征在于在判断出语音的起始点和结束点以后,通过判断语音结束点与语音起始点之间的间隔是否大于最小语音长段门限来确认是否为有效的语音片段,如果是,则确认该段为语音;否则,该段不是有效的语音片段。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200810107116XA CN101308653A (zh) | 2008-07-17 | 2008-07-17 | 一种应用于语音识别系统的端点检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200810107116XA CN101308653A (zh) | 2008-07-17 | 2008-07-17 | 一种应用于语音识别系统的端点检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101308653A true CN101308653A (zh) | 2008-11-19 |
Family
ID=40125069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200810107116XA Pending CN101308653A (zh) | 2008-07-17 | 2008-07-17 | 一种应用于语音识别系统的端点检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101308653A (zh) |
Cited By (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012055113A1 (zh) * | 2010-10-29 | 2012-05-03 | 安徽科大讯飞信息科技股份有限公司 | 录音结束点检测方法及系统 |
CN102543078A (zh) * | 2010-12-09 | 2012-07-04 | 盛乐信息技术(上海)有限公司 | 电子名片系统及电子名片的语音录入方法、语音检索方法 |
CN103247293A (zh) * | 2013-05-14 | 2013-08-14 | 中国科学院自动化研究所 | 一种语音数据的编码及解码方法 |
CN103578470A (zh) * | 2012-08-09 | 2014-02-12 | 安徽科大讯飞信息科技股份有限公司 | 一种电话录音数据的处理方法及系统 |
CN103730118A (zh) * | 2012-10-11 | 2014-04-16 | 百度在线网络技术(北京)有限公司 | 语音信号采集方法和移动终端 |
CN104078076A (zh) * | 2014-06-13 | 2014-10-01 | 科大讯飞股份有限公司 | 一种语音录入方法及系统 |
CN104428832A (zh) * | 2012-07-09 | 2015-03-18 | Lg电子株式会社 | 语音识别装置及其方法 |
CN104715761A (zh) * | 2013-12-16 | 2015-06-17 | 深圳百科信息技术有限公司 | 一种音频有效数据检测方法和系统 |
CN105118502A (zh) * | 2015-07-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别系统的端点检测方法及系统 |
CN105261357A (zh) * | 2015-09-15 | 2016-01-20 | 百度在线网络技术(北京)有限公司 | 基于统计模型的语音端点检测方法及装置 |
CN105575406A (zh) * | 2016-01-07 | 2016-05-11 | 深圳市音加密科技有限公司 | 一种基于似然比测试的噪声鲁棒性的检测方法 |
CN105718019A (zh) * | 2014-12-01 | 2016-06-29 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN105989838A (zh) * | 2015-01-30 | 2016-10-05 | 展讯通信(上海)有限公司 | 语音识别方法及装置 |
WO2017045429A1 (zh) * | 2015-09-18 | 2017-03-23 | 广州酷狗计算机科技有限公司 | 一种音频数据的检测方法、系统及存储介质 |
CN106782508A (zh) * | 2016-12-20 | 2017-05-31 | 美的集团股份有限公司 | 语音音频的切分方法和语音音频的切分装置 |
WO2017120958A1 (zh) * | 2016-01-17 | 2017-07-20 | 谢文 | 使用耳机时的报警方法以及报警耳机 |
CN107068147A (zh) * | 2015-10-19 | 2017-08-18 | 谷歌公司 | 语音端点确定 |
CN107248410A (zh) * | 2017-07-19 | 2017-10-13 | 浙江联运知慧科技有限公司 | 声纹识别垃圾箱开门的方法 |
CN107424628A (zh) * | 2017-08-08 | 2017-12-01 | 哈尔滨理工大学 | 一种嘈杂环境下特定目标语音端点搜索的方法 |
CN107767863A (zh) * | 2016-08-22 | 2018-03-06 | 科大讯飞股份有限公司 | 语音唤醒方法、系统及智能终端 |
CN108122552A (zh) * | 2017-12-15 | 2018-06-05 | 上海智臻智能网络科技股份有限公司 | 语音情绪识别方法和装置 |
CN108198547A (zh) * | 2018-01-18 | 2018-06-22 | 深圳市北科瑞声科技股份有限公司 | 语音端点检测方法、装置、计算机设备和存储介质 |
CN108199937A (zh) * | 2018-02-09 | 2018-06-22 | 杭州智仁建筑工程有限公司 | 一种自动控制的智能家具 |
CN108257616A (zh) * | 2017-12-05 | 2018-07-06 | 苏州车萝卜汽车电子科技有限公司 | 人机对话的检测方法以及装置 |
WO2018145584A1 (zh) * | 2017-02-13 | 2018-08-16 | 芋头科技(杭州)有限公司 | 一种语音端点检测方法及语音识别方法 |
CN108711437A (zh) * | 2018-03-06 | 2018-10-26 | 深圳市沃特沃德股份有限公司 | 语音处理方法和装置 |
CN108766426A (zh) * | 2018-05-31 | 2018-11-06 | 中国舰船研究设计中心 | 一种舰艇用智能语音交互指挥系统 |
CN108847218A (zh) * | 2018-06-27 | 2018-11-20 | 郑州云海信息技术有限公司 | 一种自适应门限整定语音端点检测方法,设备及可读存储介质 |
CN108847217A (zh) * | 2018-05-31 | 2018-11-20 | 平安科技(深圳)有限公司 | 一种语音切分方法、装置、计算机设备及存储介质 |
CN109446948A (zh) * | 2018-10-15 | 2019-03-08 | 西安交通大学 | 一种基于Android平台的人脸和语音多生物特征融合认证方法 |
US10311874B2 (en) | 2017-09-01 | 2019-06-04 | 4Q Catalyst, LLC | Methods and systems for voice-based programming of a voice-controlled device |
CN110335593A (zh) * | 2019-06-17 | 2019-10-15 | 平安科技(深圳)有限公司 | 语音端点检测方法、装置、设备及存储介质 |
CN110364187A (zh) * | 2019-07-03 | 2019-10-22 | 深圳华海尖兵科技有限公司 | 一种语音信号的端点识别方法和装置 |
CN110767236A (zh) * | 2018-07-10 | 2020-02-07 | 上海智臻智能网络科技股份有限公司 | 一种语音识别方法和装置 |
CN112489692A (zh) * | 2020-11-03 | 2021-03-12 | 北京捷通华声科技股份有限公司 | 语音端点检测方法和装置 |
CN112767920A (zh) * | 2020-12-31 | 2021-05-07 | 深圳市珍爱捷云信息技术有限公司 | 通话语音的识别方法、装置、设备及存储介质 |
CN113075296A (zh) * | 2021-04-01 | 2021-07-06 | 湖南翰坤实业有限公司 | 基于声波检测和bim模型的外墙结构安全检测方法、装置 |
CN114242116A (zh) * | 2022-01-05 | 2022-03-25 | 成都锦江电子系统工程有限公司 | 一种语音的话音与非话音的综合判决方法 |
WO2022105861A1 (zh) * | 2020-11-20 | 2022-05-27 | 北京有竹居网络技术有限公司 | 用于识别语音的方法、装置、电子设备和介质 |
-
2008
- 2008-07-17 CN CNA200810107116XA patent/CN101308653A/zh active Pending
Cited By (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9330667B2 (en) | 2010-10-29 | 2016-05-03 | Iflytek Co., Ltd. | Method and system for endpoint automatic detection of audio record |
WO2012055113A1 (zh) * | 2010-10-29 | 2012-05-03 | 安徽科大讯飞信息科技股份有限公司 | 录音结束点检测方法及系统 |
CN102543078A (zh) * | 2010-12-09 | 2012-07-04 | 盛乐信息技术(上海)有限公司 | 电子名片系统及电子名片的语音录入方法、语音检索方法 |
CN102543078B (zh) * | 2010-12-09 | 2016-08-03 | 上海果壳电子有限公司 | 电子名片系统及电子名片的语音录入方法、语音检索方法 |
CN104428832B (zh) * | 2012-07-09 | 2018-06-26 | Lg电子株式会社 | 语音识别装置及其方法 |
CN104428832A (zh) * | 2012-07-09 | 2015-03-18 | Lg电子株式会社 | 语音识别装置及其方法 |
US9443510B2 (en) | 2012-07-09 | 2016-09-13 | Lg Electronics Inc. | Speech recognition apparatus and method |
CN103578470A (zh) * | 2012-08-09 | 2014-02-12 | 安徽科大讯飞信息科技股份有限公司 | 一种电话录音数据的处理方法及系统 |
CN103578470B (zh) * | 2012-08-09 | 2019-10-18 | 科大讯飞股份有限公司 | 一种电话录音数据的处理方法及系统 |
CN103730118A (zh) * | 2012-10-11 | 2014-04-16 | 百度在线网络技术(北京)有限公司 | 语音信号采集方法和移动终端 |
CN103730118B (zh) * | 2012-10-11 | 2017-03-15 | 百度在线网络技术(北京)有限公司 | 语音信号采集方法和移动终端 |
CN103247293B (zh) * | 2013-05-14 | 2015-04-08 | 中国科学院自动化研究所 | 一种语音数据的编码及解码方法 |
CN103247293A (zh) * | 2013-05-14 | 2013-08-14 | 中国科学院自动化研究所 | 一种语音数据的编码及解码方法 |
CN104715761A (zh) * | 2013-12-16 | 2015-06-17 | 深圳百科信息技术有限公司 | 一种音频有效数据检测方法和系统 |
CN104715761B (zh) * | 2013-12-16 | 2018-03-30 | 深圳市梦网百科信息技术有限公司 | 一种音频有效数据检测方法和系统 |
CN104078076A (zh) * | 2014-06-13 | 2014-10-01 | 科大讯飞股份有限公司 | 一种语音录入方法及系统 |
CN104078076B (zh) * | 2014-06-13 | 2017-04-05 | 科大讯飞股份有限公司 | 一种语音录入方法及系统 |
CN105718019A (zh) * | 2014-12-01 | 2016-06-29 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN105989838A (zh) * | 2015-01-30 | 2016-10-05 | 展讯通信(上海)有限公司 | 语音识别方法及装置 |
CN105989838B (zh) * | 2015-01-30 | 2019-09-06 | 展讯通信(上海)有限公司 | 语音识别方法及装置 |
CN105118502B (zh) * | 2015-07-14 | 2017-05-10 | 百度在线网络技术(北京)有限公司 | 语音识别系统的端点检测方法及系统 |
CN105118502A (zh) * | 2015-07-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别系统的端点检测方法及系统 |
CN105261357B (zh) * | 2015-09-15 | 2016-11-23 | 百度在线网络技术(北京)有限公司 | 基于统计模型的语音端点检测方法及装置 |
CN105261357A (zh) * | 2015-09-15 | 2016-01-20 | 百度在线网络技术(北京)有限公司 | 基于统计模型的语音端点检测方法及装置 |
WO2017045429A1 (zh) * | 2015-09-18 | 2017-03-23 | 广州酷狗计算机科技有限公司 | 一种音频数据的检测方法、系统及存储介质 |
CN107068147A (zh) * | 2015-10-19 | 2017-08-18 | 谷歌公司 | 语音端点确定 |
CN105575406A (zh) * | 2016-01-07 | 2016-05-11 | 深圳市音加密科技有限公司 | 一种基于似然比测试的噪声鲁棒性的检测方法 |
WO2017120958A1 (zh) * | 2016-01-17 | 2017-07-20 | 谢文 | 使用耳机时的报警方法以及报警耳机 |
CN107767863A (zh) * | 2016-08-22 | 2018-03-06 | 科大讯飞股份有限公司 | 语音唤醒方法、系统及智能终端 |
CN106782508A (zh) * | 2016-12-20 | 2017-05-31 | 美的集团股份有限公司 | 语音音频的切分方法和语音音频的切分装置 |
CN108428448A (zh) * | 2017-02-13 | 2018-08-21 | 芋头科技(杭州)有限公司 | 一种语音端点检测方法及语音识别方法 |
WO2018145584A1 (zh) * | 2017-02-13 | 2018-08-16 | 芋头科技(杭州)有限公司 | 一种语音端点检测方法及语音识别方法 |
CN107248410A (zh) * | 2017-07-19 | 2017-10-13 | 浙江联运知慧科技有限公司 | 声纹识别垃圾箱开门的方法 |
CN107424628A (zh) * | 2017-08-08 | 2017-12-01 | 哈尔滨理工大学 | 一种嘈杂环境下特定目标语音端点搜索的方法 |
US10311874B2 (en) | 2017-09-01 | 2019-06-04 | 4Q Catalyst, LLC | Methods and systems for voice-based programming of a voice-controlled device |
CN108257616A (zh) * | 2017-12-05 | 2018-07-06 | 苏州车萝卜汽车电子科技有限公司 | 人机对话的检测方法以及装置 |
CN108122552A (zh) * | 2017-12-15 | 2018-06-05 | 上海智臻智能网络科技股份有限公司 | 语音情绪识别方法和装置 |
CN108198547A (zh) * | 2018-01-18 | 2018-06-22 | 深圳市北科瑞声科技股份有限公司 | 语音端点检测方法、装置、计算机设备和存储介质 |
CN108199937A (zh) * | 2018-02-09 | 2018-06-22 | 杭州智仁建筑工程有限公司 | 一种自动控制的智能家具 |
CN108711437A (zh) * | 2018-03-06 | 2018-10-26 | 深圳市沃特沃德股份有限公司 | 语音处理方法和装置 |
CN108766426A (zh) * | 2018-05-31 | 2018-11-06 | 中国舰船研究设计中心 | 一种舰艇用智能语音交互指挥系统 |
CN108847217A (zh) * | 2018-05-31 | 2018-11-20 | 平安科技(深圳)有限公司 | 一种语音切分方法、装置、计算机设备及存储介质 |
CN108766426B (zh) * | 2018-05-31 | 2021-09-07 | 中国舰船研究设计中心 | 一种舰艇用智能语音交互指挥系统 |
WO2019227547A1 (zh) * | 2018-05-31 | 2019-12-05 | 平安科技(深圳)有限公司 | 一种语音切分方法、装置、计算机设备及存储介质 |
CN108847218A (zh) * | 2018-06-27 | 2018-11-20 | 郑州云海信息技术有限公司 | 一种自适应门限整定语音端点检测方法,设备及可读存储介质 |
CN108847218B (zh) * | 2018-06-27 | 2020-07-21 | 苏州浪潮智能科技有限公司 | 一种自适应门限整定语音端点检测方法,设备及可读存储介质 |
CN110767236A (zh) * | 2018-07-10 | 2020-02-07 | 上海智臻智能网络科技股份有限公司 | 一种语音识别方法和装置 |
CN109446948A (zh) * | 2018-10-15 | 2019-03-08 | 西安交通大学 | 一种基于Android平台的人脸和语音多生物特征融合认证方法 |
CN110335593A (zh) * | 2019-06-17 | 2019-10-15 | 平安科技(深圳)有限公司 | 语音端点检测方法、装置、设备及存储介质 |
WO2020253073A1 (zh) * | 2019-06-17 | 2020-12-24 | 平安科技(深圳)有限公司 | 语音端点检测方法、装置、设备及存储介质 |
CN110335593B (zh) * | 2019-06-17 | 2024-07-05 | 平安科技(深圳)有限公司 | 语音端点检测方法、装置、设备及存储介质 |
CN110364187A (zh) * | 2019-07-03 | 2019-10-22 | 深圳华海尖兵科技有限公司 | 一种语音信号的端点识别方法和装置 |
CN112489692A (zh) * | 2020-11-03 | 2021-03-12 | 北京捷通华声科技股份有限公司 | 语音端点检测方法和装置 |
CN112489692B (zh) * | 2020-11-03 | 2024-10-18 | 北京捷通华声科技股份有限公司 | 语音端点检测方法和装置 |
WO2022105861A1 (zh) * | 2020-11-20 | 2022-05-27 | 北京有竹居网络技术有限公司 | 用于识别语音的方法、装置、电子设备和介质 |
CN112767920A (zh) * | 2020-12-31 | 2021-05-07 | 深圳市珍爱捷云信息技术有限公司 | 通话语音的识别方法、装置、设备及存储介质 |
CN113075296A (zh) * | 2021-04-01 | 2021-07-06 | 湖南翰坤实业有限公司 | 基于声波检测和bim模型的外墙结构安全检测方法、装置 |
CN114242116A (zh) * | 2022-01-05 | 2022-03-25 | 成都锦江电子系统工程有限公司 | 一种语音的话音与非话音的综合判决方法 |
CN114242116B (zh) * | 2022-01-05 | 2024-08-02 | 成都锦江电子系统工程有限公司 | 一种语音的话音与非话音的综合判决方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101308653A (zh) | 一种应用于语音识别系统的端点检测方法 | |
KR101922776B1 (ko) | 음성 웨이크업 방법 및 장치 | |
US8930196B2 (en) | System for detecting speech interval and recognizing continuous speech in a noisy environment through real-time recognition of call commands | |
CN102163427B (zh) | 一种基于环境模型的音频异常事件检测方法 | |
CN102543063B (zh) | 基于说话人分割与聚类的多说话人语速估计方法 | |
WO2020220439A9 (zh) | 基于深度神经网络的高速公路交通流量状态识别方法 | |
CN103280220B (zh) | 一种实时的婴儿啼哭声识别方法 | |
CN106601230B (zh) | 基于连续混合高斯hmm模型的物流分拣地名语音识别方法、系统及物流分拣系统 | |
CN108922541B (zh) | 基于dtw和gmm模型的多维特征参数声纹识别方法 | |
CN105529028A (zh) | 语音解析方法和装置 | |
CN106710599A (zh) | 一种基于深度神经网络的特定声源检测方法与系统 | |
CN103646649A (zh) | 一种高效的语音检测方法 | |
US8301578B2 (en) | System and method for tagging signals of interest in time variant data | |
CN103065627A (zh) | 基于dtw与hmm证据融合的特种车鸣笛声识别方法 | |
CN101923855A (zh) | 文本无关的声纹识别系统 | |
CN108335699A (zh) | 一种基于动态时间规整和语音活动检测的声纹识别方法 | |
Rossignol et al. | Feature extraction and temporal segmentation of acoustic signals | |
CN104103280B (zh) | 基于动态时间归整算法的离线语音端点检测的方法和装置 | |
CN112992191B (zh) | 语音端点检测方法、装置、电子设备及可读存储介质 | |
CN105825857A (zh) | 基于声纹识别帮助失聪患者判断声音类别的方法 | |
CN103021421A (zh) | 用于枪声的多级筛选检测识别方法 | |
Sarkar et al. | Automatic speech segmentation using average level crossing rate information | |
Sharma et al. | Automatic identification of silence, unvoiced and voiced chunks in speech | |
CN206781702U (zh) | 一种基于量子神经网络的语音识别汽车防盗系统 | |
Zolnay et al. | Extraction methods of voicing feature for robust speech recognition. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20081119 |