CN108847218A - 一种自适应门限整定语音端点检测方法,设备及可读存储介质 - Google Patents
一种自适应门限整定语音端点检测方法,设备及可读存储介质 Download PDFInfo
- Publication number
- CN108847218A CN108847218A CN201810680909.4A CN201810680909A CN108847218A CN 108847218 A CN108847218 A CN 108847218A CN 201810680909 A CN201810680909 A CN 201810680909A CN 108847218 A CN108847218 A CN 108847218A
- Authority
- CN
- China
- Prior art keywords
- voice
- frame
- short
- detecting method
- end detecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 26
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 239000000284 extract Substances 0.000 claims abstract description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract description 3
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001314 paroxysmal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
- G10L15/05—Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Abstract
本发明提供一种自适应门限整定语音端点检测方法,设备及可读存储介质,设置待检测的语音帧长为N,k为帧数,共有L帧数据,获取L帧的短时参数,获取第k帧的短时能量为amp,短时过零率为zcr;搜索参考噪音;获取初始参考门限;检测语音段起点x1和语音段终点x2;再次噪音提取,并获取短时门限X(i+1);把第i+1次与第i次提取的门限值进行比较,判断其是否相等,通过语音搜索,不断的比较前后两帧语音的参数关系,合理地取得有效的参考语音帧,而不是单纯的提取待检测语音段的前几帧。为了得到更为精准的检测效果,本发明采取了门限不断自调整、循环检测的方式,直至算法最终收敛。
Description
技术领域
本发明涉及语音检测领域,尤其涉及一种自适应门限整定语音端点检测方法,设备及可读存储介质。
背景技术
端点检测的目的就是在复杂的应用环境下的信号流中分辨出语音信号和非语音信号,并确定语音信号的开始及结束。通过端点检测,一方面,能有效的除去一些冗余的噪声信号,这样为特征提取与模式匹配节省了大量的时间,大大的提高了系统运行的效率。另一方面,端点检测提升了特征参数所反映说话人个性信息所占的比重,即提升了特征参数的可靠性。可见,端点检测是语音识别系统中至关重要的一步,其算法的优劣在某种程度上也直接决定了整个语音识别系统的成败。
到目前为止,端点检测的研究经历了几十年,产生了很多方法,这些方法大致可以分为两大类:基于参数的方法和基于模型的方法。(1)基于参数门限的方法,这类算法的基本思想是寻找出能表征语音和噪音差异的特征参数来进行语音和噪音的时段区分。常用的参数有:短时能量、短时过零率、线性预测系数、频带方差、信息熵等。(2)基于模型的方法,此类方法的基本思想是对噪音与语音分别进行建模来区分语音时段和非语言时段,如:基于HMM的端点检测、基于神经网络的端点检测等。基于短时能量和短时过零率的端点检测是最为经典的一种基于参数的检测算法,该算法使用简单,参数提取方便,在高信噪比的情况下能够比较准确的区分出语音和噪声。基于MEL倒谱特征(MFCC)的端点检测,倒谱参数在噪声环境下更能够区分语音段和噪音段,因此具有更好的检测效果,但是引入MFCC参数增加了算法的复杂度。一种基于谱熵和谱能量的端点检测,引入了熵的概念,利用语音与噪声的熵差异来区分噪音与语音。但是以上方法都面临着同一个问题,相关参数门限设定的问题。传统的方法便是取待测语音帧的前几帧来设定参考门限,或是根据以往的经验取一个经验值。
发明内容
为了克服上述现有技术中的不足,本发明提供一种自适应门限整定语音端点检测方法,方法包括:
步骤1:设置待检测的语音帧长为N,k为帧数,共有L帧数据,获取L帧的短时参数,获取第k帧的短时能量为amp,短时过零率为zcr;
步骤2:搜索参考噪音;
步骤3:获取初始参考门限;
步骤4:检测语音段起点x1和语音段终点x2;
步骤5:再次噪音提取,并获取短时门限X(i+1);
步骤6:把第i+1次与第i次提取的门限值进行比较,判断其是否相等。
优选地,步骤6之后还包括:
若X(i+1)=X(i),则算法收敛,输出检测结果。
优选地,步骤6之后还包括:
若X(i+1)≠X(i),则i=i+1,转至步骤4,基于双门限端点检测,得到起点x1与终点x2;
再次噪音提取,并获取短时门限X(i+1);
把第i+1次与第i次提取的门限值进行比较,判断其是否相等;
若X(i+1)=X(i),则算法收敛,输出检测结果;
若X(i+1)≠X(i),则i=i+1,转至步骤4,直至X(i+1)=X(i),则算法收敛,输出检测结果。
优选地,步骤6之后还包括:
若X(i+1)≠X(i),如转至步骤4已达到预设次数时,输出检测结果。
优选地,步骤2还包括:
从语音的终点为开始,与其相邻帧作比较:记其前向搜索的帧数为m,终止帧为M;
从语音的起点为开始,与其相邻帧作比较:记其后向搜索的帧数为n,终止帧为N;
若:Z(m+1)/Z(m)>100,则停止搜索,M=m;否则:m=m+1,转至步骤3;
若:Z(n-1)/Z(n)>100,则停止搜索,N=n;否则:n=n+1,转至步骤3。
优选地,步骤3还包括:
设检测到的前后段的背景噪声短时能量的均值为amp_zy(i),短时平均过零率为zcr_zy(i),其中,M表示前向扫描的噪音帧数,N表示后向扫描的噪音帧数,i表示噪声提取的次数,若i=0,则表示开始初次噪音提取。用式amp_zy(i)和zcr_zy(i)计算初始参考门限。
优选地,步骤4还包括:
根据待检测语音的清音和浊音的边界以及清音和无声的边界,获取语音音波曲线;
预设语音的短时能量设定第一语音能量值门限阈值M1;
根据第一语音能量值门限阈值M1与语音音波曲线之间的两个交点,将所述两个交点确定为语音段的初始起始点和初始结束点;
预设语音的短时能量设定第二语音能量值门限阈值M2,第一语音能量值门限阈值M1大于第二语音能量值门限阈值M2;
分别从初始起始点和初始结束点分别向两边搜索,获取语音音波曲线与第二语音能量值门限阈值M2之间的两个交点,将所述两个交点确定为语音段起点x1和语音段终点x2。
一种实现自适应门限整定语音端点检测方法的设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现自适应门限整定语音端点检测方法的步骤。
一种实现自适应门限整定语音端点检测方法的计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现自适应门限整定语音端点检测方法的步骤。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过语音搜索,不断的比较前后两帧语音的参数关系,合理地取得有效的参考语音帧,而不是单纯的提取待检测语音段的前几帧。为了得到更为精准的检测效果,本发明采取了门限不断自调整、循环检测的方式,直至算法最终收敛。此外,由于新算法是通过降低门限值来提高检测精度的,易受到突发性的尖峰噪声干扰,在检测的过程中,也做了尖峰噪声脉冲检测,进一步提高了检测精度。
附图说明
为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为自适应门限整定语音端点检测方法流程图;
图2为检测语音段起点x1和语音段终点x2示意图。
具体实施方式
本发明提供一种自适应门限整定语音端点检测方法,如图1和图2所示,方法包括:
S1:设置待检测的语音帧长为N,k为帧数,共有L帧数据,获取L帧的短时参数,获取第k帧的短时能量为amp,短时过零率为zcr;
S2:搜索参考噪音;
S3:获取初始参考门限;
S4:检测语音段起点x1和语音段终点x2;
S5:再次噪音提取,并获取短时门限X(i+1);
S6:把第i+1次与第i次提取的门限值进行比较,判断其是否相等。
本发明中,步骤6之后还包括:
若X(i+1)=X(i),则算法收敛,输出检测结果。
本发明中,步骤6之后还包括:
若X(i+1)≠X(i),则i=i+1,转至步骤4,基于双门限端点检测,得到起点x1与终点x2;
再次噪音提取,并获取短时门限X(i+1);
把第i+1次与第i次提取的门限值进行比较,判断其是否相等;
若X(i+1)=X(i),则算法收敛,输出检测结果;
若X(i+1)≠X(i),则i=i+1,转至步骤4,直至X(i+1)=X(i),则算法收敛,输出检测结果。
本发明中,步骤6之后还包括:
若X(i+1)≠X(i),如转至步骤4已达到预设次数时,输出检测结果。
本发明中,步骤2还包括:
从语音的终点为开始,与其相邻帧作比较:记其前向搜索的帧数为m,终止帧为M;
从语音的起点为开始,与其相邻帧作比较:记其后向搜索的帧数为n,终止帧为N;
若:Z(m+1)/Z(m)>100,则停止搜索,M=m;否则:m=m+1,转至步骤3;
若:Z(n-1)/Z(n)>100,则停止搜索,N=n;否则:n=n+1,转至步骤3。
本发明中,步骤3还包括:
设检测到的前后段的背景噪声短时能量的均值为amp_zy(i),短时平均过零率为zcr_zy(i),其中,M表示前向扫描的噪音帧数,N表示后向扫描的噪音帧数,i表示噪声提取的次数,若i=0,则表示开始初次噪音提取。用式amp_zy(i)和zcr_zy(i)计算初始参考门限。
本发明中,步骤4还包括:
根据待检测语音的清音和浊音的边界以及清音和无声的边界,获取语音音波曲线101;
预设语音的短时能量设定第一语音能量值门限阈值M1;
根据第一语音能量值门限阈值M1与语音音波曲线101之间的两个交点,将所述两个交点确定为语音段的初始起始点和初始结束点;
预设语音的短时能量设定第二语音能量值门限阈值M2,第一语音能量值门限阈值M1大于第二语音能量值门限阈值M2;
分别从初始起始点和初始结束点分别向两边搜索,获取语音音波曲线101与第二语音能量值门限阈值M2之间的两个交点,将所述两个交点确定为语音段起点x1和语音段终点x2。
双门限端点检测运用短时能量进行第一级粗判决,找到清音和浊音的边界;再利用短时平均过零率进行第二级判决,找到清音和无声的边界,获取语音音波曲线101。语音信号语音段位于浊音段,因为浊音段能量较高。而噪声和静音则位于能量较低的清音段。根据这一特性,第一级为粗判过程可描述如下,如图2所示,预设语音的短时能量设定第一语音能量值门限阈值M1;通常情况下语音短时能量都在此门限之上,根据这个阈值确定根据第一语音能量值门限阈值M1与语音音波曲线101之间的两个交点,将所述两个交点确定为语音段的初始起始点和初始结束点;初始起始点和初始结束点之间的语音段表示语音信号。为了找到语音段的精确起点和终点,还需要对初始起始点和初始结束点之外进行检测。再预设语音的短时能量设定第二语音能量值门限阈值M2,第一语音能量值门限阈值M1大于第二语音能量值门限阈值M2,分别从初始起始点和初始结束点分别向两边搜索,获取语音音波曲线与第二语音能量值门限阈值M2之间的两个交点,将所述两个交点确定为语音段起点x1和语音段终点x2。语音段起点x1和语音段终点x2之间的语音段就是根据短时能量所判定的语音段。
本发明还提供一种实现自适应门限整定语音端点检测方法的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序以实现自适应门限整定语音端点检测方法的步骤。
本发明还提供一种实现自适应门限整定语音端点检测方法的计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现自适应门限整定语音端点检测方法的步骤。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.一种自适应门限整定语音端点检测方法,其特征在于,方法包括:
步骤1:设置待检测的语音帧长为N,k为帧数,共有L帧数据,获取L帧的短时参数,获取第k帧的短时能量为amp,短时过零率为zcr;
步骤2:搜索参考噪音;
步骤3:获取初始参考门限;
步骤4:检测语音段起点x1和语音段终点x2;
步骤5:再次噪音提取,并获取短时门限X(i+1);
步骤6:把第i+1次与第i次提取的门限值进行比较,判断其是否相等。
2.根据权利要求1所述的自适应门限整定语音端点检测方法,其特征在于,方法包括:
步骤6之后还包括:
若X(i+1)=X(i),则算法收敛,输出检测结果。
3.根据权利要求1所述的自适应门限整定语音端点检测方法,其特征在于,方法包括:
步骤6之后还包括:
若X(i+1)≠X(i),则i=i+1,转至步骤4,基于双门限端点检测,得到起点x1与终点x2;
再次噪音提取,并获取短时门限X(i+1);
把第i+1次与第i次提取的门限值进行比较,判断其是否相等;
若X(i+1)=X(i),则算法收敛,输出检测结果;
若X(i+1)≠X(i),则i=i+1,转至步骤4,直至X(i+1)=X(i),则算法收敛,输出检测结果。
4.根据权利要求3所述的自适应门限整定语音端点检测方法,其特征在于,方法包括:
步骤6之后还包括:
若X(i+1)≠X(i),如转至步骤4已达到预设次数时,输出检测结果。
5.根据权利要求1所述的自适应门限整定语音端点检测方法,其特征在于,方法包括:
步骤2还包括:
从语音的终点为开始,与其相邻帧作比较:记其前向搜索的帧数为m,终止帧为M;
从语音的起点为开始,与其相邻帧作比较:记其后向搜索的帧数为n,终止帧为N;
若:Z(m+1)/Z(m)>100,则停止搜索,M=m;否则:m=m+1,转至步骤3;
若:Z(n-1)/Z(n)>100,则停止搜索,N=n;否则:n=n+1,转至步骤3。
6.根据权利要求1所述的自适应门限整定语音端点检测方法,其特征在于,方法包括:
步骤3还包括:
设检测到的前后段的背景噪声短时能量的均值为amp_zy(i),短时平均过零率为zcr_zy(i),其中,M表示前向扫描的噪音帧数,N表示后向扫描的噪音帧数,i表示噪声提取的次数,若i=0,则表示开始初次噪音提取;用式amp_zy(i)和zcr_zy(i)计算初始参考门限。
7.根据权利要求1所述的自适应门限整定语音端点检测方法,其特征在于,方法包括:
步骤4还包括:
根据待检测语音的清音和浊音的边界以及清音和无声的边界,获取语音音波曲线;
预设语音的短时能量设定第一语音能量值门限阈值M1;
根据第一语音能量值门限阈值M1与语音音波曲线之间的两个交点,将所述两个交点确定为语音段的初始起始点和初始结束点;
预设语音的短时能量设定第二语音能量值门限阈值M2,第一语音能量值门限阈值M1大于第二语音能量值门限阈值M2;
分别从初始起始点和初始结束点分别向两边搜索,获取语音音波曲线与第二语音能量值门限阈值M2之间的两个交点,将所述两个交点确定为语音段起点x1和语音段终点x2。
8.一种实现自适应门限整定语音端点检测方法的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至7任意一项所述的自适应门限整定语音端点检测方法的步骤。
9.一种实现自适应门限整定语音端点检测方法的计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1至7任意一项所述的自适应门限整定语音端点检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810680909.4A CN108847218B (zh) | 2018-06-27 | 2018-06-27 | 一种自适应门限整定语音端点检测方法,设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810680909.4A CN108847218B (zh) | 2018-06-27 | 2018-06-27 | 一种自适应门限整定语音端点检测方法,设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108847218A true CN108847218A (zh) | 2018-11-20 |
CN108847218B CN108847218B (zh) | 2020-07-21 |
Family
ID=64199867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810680909.4A Active CN108847218B (zh) | 2018-06-27 | 2018-06-27 | 一种自适应门限整定语音端点检测方法,设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108847218B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110867197A (zh) * | 2019-10-23 | 2020-03-06 | 吴杰 | 语音交互过程中实时打断语音机器人的方法及设备 |
CN111276164A (zh) * | 2020-02-15 | 2020-06-12 | 中国人民解放军空军特色医学中心 | 飞机上高噪音环境自适应话音激活检测装置及方法 |
CN112331188A (zh) * | 2019-07-31 | 2021-02-05 | 武汉Tcl集团工业研究院有限公司 | 一种语音数据处理方法、系统及终端设备 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0690436A2 (de) * | 1994-06-28 | 1996-01-03 | Alcatel SEL Aktiengesellschaft | Start-/Endpunkt-Detektion zur Worterkennung |
EP1077448A2 (de) * | 1999-08-18 | 2001-02-21 | Siemens Aktiengesellschaft | Spracherkennung unter Berücksichtigung der Lautstärkeschwankungen |
CN101308653A (zh) * | 2008-07-17 | 2008-11-19 | 安徽科大讯飞信息科技股份有限公司 | 一种应用于语音识别系统的端点检测方法 |
CN101625857A (zh) * | 2008-07-10 | 2010-01-13 | 新奥特(北京)视频技术有限公司 | 一种自适应的语音端点检测方法 |
CN102522081A (zh) * | 2011-12-29 | 2012-06-27 | 北京百度网讯科技有限公司 | 一种检测语音端点的方法及系统 |
CN103117067A (zh) * | 2013-01-19 | 2013-05-22 | 渤海大学 | 一种低信噪比下语音端点检测方法 |
CN103366739A (zh) * | 2012-03-28 | 2013-10-23 | 郑州市科学技术情报研究所 | 面向孤立词语音识别的自适应端点检测方法及其系统 |
CN104021789A (zh) * | 2014-06-25 | 2014-09-03 | 厦门大学 | 一种利用短时时频值的自适应端点检测方法 |
US20160027430A1 (en) * | 2014-05-28 | 2016-01-28 | Interactive Intelligence Group, Inc. | Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system |
US20160300572A1 (en) * | 2011-09-01 | 2016-10-13 | At&T Intellectual Property I, L.P. | System and method for advanced turn-taking interactive spoken dialog systems |
CN106847270A (zh) * | 2016-12-09 | 2017-06-13 | 华南理工大学 | 一种双门限地名语音端点检测方法 |
CN107045870A (zh) * | 2017-05-23 | 2017-08-15 | 南京理工大学 | 一种基于特征值编码的语音信号端点检测方法 |
CN107910017A (zh) * | 2017-12-19 | 2018-04-13 | 河海大学 | 一种带噪语音端点检测中阈值设定的方法 |
CN107993649A (zh) * | 2017-11-29 | 2018-05-04 | 无锡同芯微纳科技有限公司 | 基于五门限的声音端点检测方法及其应用 |
-
2018
- 2018-06-27 CN CN201810680909.4A patent/CN108847218B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0690436A2 (de) * | 1994-06-28 | 1996-01-03 | Alcatel SEL Aktiengesellschaft | Start-/Endpunkt-Detektion zur Worterkennung |
EP1077448A2 (de) * | 1999-08-18 | 2001-02-21 | Siemens Aktiengesellschaft | Spracherkennung unter Berücksichtigung der Lautstärkeschwankungen |
CN101625857A (zh) * | 2008-07-10 | 2010-01-13 | 新奥特(北京)视频技术有限公司 | 一种自适应的语音端点检测方法 |
CN101308653A (zh) * | 2008-07-17 | 2008-11-19 | 安徽科大讯飞信息科技股份有限公司 | 一种应用于语音识别系统的端点检测方法 |
US20160300572A1 (en) * | 2011-09-01 | 2016-10-13 | At&T Intellectual Property I, L.P. | System and method for advanced turn-taking interactive spoken dialog systems |
CN102522081A (zh) * | 2011-12-29 | 2012-06-27 | 北京百度网讯科技有限公司 | 一种检测语音端点的方法及系统 |
CN103366739A (zh) * | 2012-03-28 | 2013-10-23 | 郑州市科学技术情报研究所 | 面向孤立词语音识别的自适应端点检测方法及其系统 |
CN103117067A (zh) * | 2013-01-19 | 2013-05-22 | 渤海大学 | 一种低信噪比下语音端点检测方法 |
US20160027430A1 (en) * | 2014-05-28 | 2016-01-28 | Interactive Intelligence Group, Inc. | Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system |
CN104021789A (zh) * | 2014-06-25 | 2014-09-03 | 厦门大学 | 一种利用短时时频值的自适应端点检测方法 |
CN106847270A (zh) * | 2016-12-09 | 2017-06-13 | 华南理工大学 | 一种双门限地名语音端点检测方法 |
CN107045870A (zh) * | 2017-05-23 | 2017-08-15 | 南京理工大学 | 一种基于特征值编码的语音信号端点检测方法 |
CN107993649A (zh) * | 2017-11-29 | 2018-05-04 | 无锡同芯微纳科技有限公司 | 基于五门限的声音端点检测方法及其应用 |
CN107910017A (zh) * | 2017-12-19 | 2018-04-13 | 河海大学 | 一种带噪语音端点检测中阈值设定的方法 |
Non-Patent Citations (4)
Title |
---|
朴春俊,马静霞,徐鹏: "噪音情况下语音端点检测方法的研究", 《计算机工程与应用》 * |
李建宁,冯宏伟: "基于变帧长自适应门限的端点检测方法", 《语音技术》 * |
潘丹青: "一种改进的语音端点特征检测方法", 《桂林航天工业学院学报》 * |
熊飞,张雪英: "基于OMAP5912平台的自适应双门限语音端点检测The Endpoint Detection of A Daptive Dual Thresholds based On OMAP5912 Platform", 《电脑开发与应用》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112331188A (zh) * | 2019-07-31 | 2021-02-05 | 武汉Tcl集团工业研究院有限公司 | 一种语音数据处理方法、系统及终端设备 |
CN110867197A (zh) * | 2019-10-23 | 2020-03-06 | 吴杰 | 语音交互过程中实时打断语音机器人的方法及设备 |
CN111276164A (zh) * | 2020-02-15 | 2020-06-12 | 中国人民解放军空军特色医学中心 | 飞机上高噪音环境自适应话音激活检测装置及方法 |
CN111276164B (zh) * | 2020-02-15 | 2021-08-03 | 中国人民解放军空军特色医学中心 | 飞机上高噪音环境自适应话音激活检测装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108847218B (zh) | 2020-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110364143B (zh) | 语音唤醒方法、装置及其智能电子设备 | |
US7756700B2 (en) | Perceptual harmonic cepstral coefficients as the front-end for speech recognition | |
CN103971685B (zh) | 语音命令识别方法和系统 | |
US9196247B2 (en) | Voice recognition method and voice recognition apparatus | |
US20170154640A1 (en) | Method and electronic device for voice recognition based on dynamic voice model selection | |
CN101206858B (zh) | 一种孤立词语音端点检测的方法及系统 | |
JPS62231997A (ja) | 音声認識システム及びその方法 | |
WO2021040842A1 (en) | Optimizing a keyword spotting system | |
CN108847218A (zh) | 一种自适应门限整定语音端点检测方法,设备及可读存储介质 | |
Zhang et al. | Improved modeling for F0 generation and V/U decision in HMM-based TTS | |
CN112071308A (zh) | 一种基于语音合成数据增强的唤醒词训练方法 | |
CN108682432B (zh) | 语音情感识别装置 | |
CN111540342A (zh) | 一种能量阈值调整方法、装置、设备及介质 | |
Smolenski et al. | Usable speech processing: A filterless approach in the presence of interference | |
ÖZAYDIN | Examination of energy based voice activity detection algorithms for noisy speech signals | |
Zolnay et al. | Extraction methods of voicing feature for robust speech recognition. | |
JP5621786B2 (ja) | 音声検出装置、音声検出方法、および音声検出プログラム | |
Varela et al. | Combining pulse-based features for rejecting far-field speech in a HMM-based voice activity detector | |
Upadhya | Pitch detection in time and frequency domain | |
Sudhakar et al. | Automatic speech segmentation to improve speech synthesis performance | |
US20090063149A1 (en) | Speech retrieval apparatus | |
CN116830191A (zh) | 基于热词属性调配自动语音识别参数 | |
Sarikaya et al. | Robust speech activity detection in the presence of noise | |
Sarikaya et al. | Robust detection of speech activity in the presence of noise | |
CN107039046B (zh) | 一种基于特征融合的语音声效模式检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200622 Address after: 215100 No. 1 Guanpu Road, Guoxiang Street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province Applicant after: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd. Address before: 450000 Henan province Zheng Dong New District of Zhengzhou City Xinyi Road No. 278 16 floor room 1601 Applicant before: ZHENGZHOU YUNHAI INFORMATION TECHNOLOGY Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |