CN105070287B - 一种自适应嘈杂环境下语音端点检测的方法和装置 - Google Patents

一种自适应嘈杂环境下语音端点检测的方法和装置 Download PDF

Info

Publication number
CN105070287B
CN105070287B CN201510394437.2A CN201510394437A CN105070287B CN 105070287 B CN105070287 B CN 105070287B CN 201510394437 A CN201510394437 A CN 201510394437A CN 105070287 B CN105070287 B CN 105070287B
Authority
CN
China
Prior art keywords
voice
energy value
sample
average energy
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510394437.2A
Other languages
English (en)
Other versions
CN105070287A (zh
Inventor
郑战海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201510394437.2A priority Critical patent/CN105070287B/zh
Publication of CN105070287A publication Critical patent/CN105070287A/zh
Application granted granted Critical
Publication of CN105070287B publication Critical patent/CN105070287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种自适应嘈杂环境下语音端点检测的方法和装置。该方法,包括:录制多个连续的语音片;语音片中初始的若干语音片采集为样本语音;计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;根据语音平均能量值和平均能量值的大小关系判断样本语音是否包含目标语音;当样本语音包含目标语音时,样本语音的起点检测为目标语音的起点;当样本语音不包含目标语音时,将第一特定语音片的起点检测为目标语音的起点;将第二特定语音片的起点检测为目标语音的终点。通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,自适应环境检测语音的端点。

Description

一种自适应嘈杂环境下语音端点检测的方法和装置
技术领域
本发明涉及语音处理领域,尤其涉及一种自适应嘈杂环境下语音端点检测的方法和装置。
背景技术
很多学习机和移动终端都有很多涉及到检测语音端点的应用,因为在嘈杂环境下和安静环境下的差异,经常无法判断准确,不能正确的截取有用的语音信息,有的做法就是让用户用手按住按键或屏幕,说完话就自动放开的形式,来代替自动语音端点的检测。还有一种做法是让用户自己设定当前环境模式为嘈杂环境还是安静环境。但在一些低龄的孩子学习类应用中,就显得对孩子比较约束,不能自然的实现与机器的对话。
发明内容
本发明提供了一种自适应嘈杂环境下语音端点检测的方法和装置,其通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,使之适应嘈杂环境和安静环境下的不同参数检测标准,从而自适应环境检测语音的端点。
为实现上述设计,本发明采用以下技术方案:
一方面采用一种自适应嘈杂环境下语音端点检测的方法,包括:
录制多个连续的语音片;所述语音片中初始的若干语音片采集为样本语音;
计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;
根据所述语音平均能量值和平均能量值的大小关系判断所述样本语音是否包含目标语音;
当所述样本语音包含目标语音时,所述样本语音的起点检测为目标语音的起点;
当所述样本语音不包含目标语音时,将第一特定语音片的起点检测为目标语音的起点;所述第一特定语音片及之后的第一连续预设个数的语音片的语音平均能量值超出起点溢出值;
将第二特定语音片的起点检测为目标语音的终点;所述第二特定语音片及之后的第二连续预设个数的语音片的语音平均能量值低于终点溢出值。
其中,所述根据所述语音平均能量值和平均能量值的大小关系判断所述样本语音是否包含目标语音,包括:
若所述样本语音中语音片的语音平均能量值与所述平均能量值的差值超出第一阈值,将该语音片从样本语音中排除;
计算样本语音中剩余语音片的有效平均能量值;
若所述有效平均能量值低于能量阈值,判断所述样本语音不包含目标语音;否则判断所述样本语音包含目标语音。
其中,所述录制多个连续的语音片之前,还包括:
预设背景噪音能量值;
所述计算样本语音中剩余语音片的有效平均能量值之后,还包括:
将所述背景噪音能量值更新为所述有效平均能量值。
其中,所述起点溢出值S1=Q1+W1;所述终点溢出值S2=Q1+W2;
其中,Q1为背景噪音能量值;W1为第一修正值;W2为第二修正值。
其中,W1=Q1*K1(0<K1<1);W2=Q1*K2(0<K2<1);
其中,K1为第一修正系数,K2为第二修正系数。
另一方面采用一种自适应嘈杂环境下语音端点检测的装置,包括:
语音片录制单元,用于录制多个连续的语音片;所述语音片中初始的若干语音片采集为样本语音;
能量值计算单元,用于计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;
目标语音判断单元,用于根据所述语音平均能量值和平均能量值的大小关系判断所述样本语音是否包含目标语音;
第一起点确定单元,用于当所述样本语音包含目标语音时,所述样本语音的起点检测为目标语音的起点;
第二起点确定单元,用于当所述样本语音不包含目标语音时,将第一特定语音片的起点检测为目标语音的起点;所述第一特定语音片及之后的第一连续预设个数的语音片的语音平均能量值超出起点溢出值;
终点确定单元,用于将第二特定语音片的起点检测为目标语音的终点;所述第二特定语音片及之后的第二连续预设个数的语音片的语音平均能量值低于终点溢出值。
其中,所述目标语音判断单元,包括:
样本清理模块,用于若所述样本语音中语音片的语音平均能量值与所述平均能量值的差值超出第一阈值,将该语音片从样本语音中排除;
能量值计算模块,用于计算样本语音中剩余语音片的有效平均能量值;
目标语音判断模块,用于若所述有效平均能量值低于能量阈值,判断所述样本语音不包含目标语音;否则判断所述样本语音包含目标语音。
其中,还包括:
参数预设单元,用于预设背景噪音能量值;
还包括:
参数更新单元,用于将所述背景噪音能量值更新为所述有效平均能量值。
其中,所述起点溢出值S1=Q1+W1;所述终点溢出值S2=Q1+W2;
其中,Q1为背景噪音能量值;W1为第一修正值;W2为第二修正值。
其中,W1=Q1*K1(0<K1<1);W2=Q1*K2(0<K2<1);
其中,K1为第一修正系数,K2为第二修正系数。
本发明的有益效果为:通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,使之适应嘈杂环境和安静环境下的不同参数检测标准,从而自适应环境检测语音的端点。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。
图1是本发明具体实施方式中提供的一种自适应嘈杂环境下语音端点检测的方法的第一实施例的方法流程图。
图2是本发明具体实施方式中提供的一种自适应嘈杂环境下语音端点检测的方法的第二实施例的方法流程图。
图3是本发明具体实施方式中提供的语音片的示意图。
图4是本发明具体实施方式中提供的一种自适应嘈杂环境下语音端点检测的装置的第一实施例的结构方框图。
图5是本发明具体实施方式中提供的一种自适应嘈杂环境下语音端点检测的装置的第二实施例的结构方框图。
具体实施方式
为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,其是本发明具体实施方式中提供的一种自适应嘈杂环境下语音端点检测的方法的第一实施例的方法流程图。如图所示,该方法,包括:
步骤S101:录制多个连续的语音片;所述语音片中初始的若干语音片采集为样本语音。
在本方案中,语音片仅仅是处理语音过程中对音频数据的组织方式,而不是录制的语音分成互相独立的音频文件。录制得到的其实是一个连续的音频文件,只是在判断过程中对数据逐段处理。对应的,样本语音也只是数据处理过程中的一种定义方式,而不是一个独立的音频文件。
步骤S102:计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值。
语音端点的检测基于语音的能量值实现,首先要计算单个语音片的语音平均能量值和所有语音片的平均能量值(每个语音片的语音平均能量值求和后除以语音片的个数)。
步骤S103:根据所述语音平均能量值和平均能量值的大小关系判断所述样本语音是否包含目标语音。
步骤S104:当所述样本语音包含目标语音时,所述样本语音的起点检测为目标语音的起点。
步骤S105:当所述样本语音不包含目标语音时,将第一特定语音片的起点检测为目标语音的起点;所述第一特定语音片及之后的第一连续预设个数的语音片的语音平均能量值超出起点溢出值。
起点溢出值相当于一参考值,当连续多个语音片的语音平均能量值超出起点溢出值时,认为外界的发声开始稳定,确认语音的起点。
步骤S106:将第二特定语音片的起点检测为目标语音的终点;所述第二特定语音片及之后的第二连续预设个数的语音片的语音平均能量值低于终点溢出值。
终点溢出值相当于另一参考值,当连续多个语音片的语音平均能量值低于终点溢出值时,认为外界的发声结束,确认语音的终点。
综上所述,通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,使之适应嘈杂环境和安静环境下的不同参数检测标准,从而自适应环境检测语音的端点。
请参考图2,其是本发明具体实施方式中提供的一种自适应嘈杂环境下语音端点检测的方法的第二实施例的方法流程图。如图所示,该方法,包括:
步骤S201:预设背景噪音能量值。
背景噪音能量值体现背景环境中声音的能量强度,一般而言室内静音状态下的能量值即可作为背景噪音能量值。
步骤S202:录制多个连续的语音片;所述语音片中初始的若干语音片采集为样本语音。
本实施例中的录制过程通过应用场景下的某一特定事件激发,例如检测到屏幕上的触摸操作或应用场景下互动过程中终端设备的动作完成之后。如图3所示,将连续10个语音片T1-T10采集为样本语音。
步骤S203:计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值。
步骤S204:若所述样本语音中语音片的语音平均能量值与所述平均能量值的差值超出第一阈值,将该语音片从样本语音中排除。
步骤S205:计算样本语音中剩余语音片的有效平均能量值。
有效平均能量值的计算相当于滤除了样本语音片中的干扰,运算结果更加精确。在图3中,T2和T10的语音平均能量值与平均能量值的差值超出第一阈值,此时计算T1、T3-T9共8个语音片的有效平均能量值。
步骤S206:将所述背景噪音能量值更新为所述有效平均能量值。
在不同的应用环境下,背景噪音能量值不同,而有效平均能量值可以作为实际的应用环境下的背景噪音能量值,所以将有效平均能量值替换为背景噪音能量值。
步骤S207:若所述有效平均能量值低于能量阈值,判断所述样本语音不包含目标语音;否则判断所述样本语音包含目标语音。
步骤S208:当所述样本语音包含目标语音时,所述样本语音的起点检测为目标语音的起点。
步骤S209:当所述样本语音不包含目标语音时,将第一特定语音片的起点检测为目标语音的起点;所述第一特定语音片及之后的第一连续预设个数的语音片的语音平均能量值超出起点溢出值。
步骤S210:将第二特定语音片的起点检测为目标语音的终点;所述第二特定语音片及之后的第二连续预设个数的语音片的语音平均能量值低于终点溢出值。
其中,所述起点溢出值S1=Q1+W1;所述终点溢出值S2=Q1+W2;
其中,Q1为背景噪音能量值;W1为第一修正值;W2为第二修正值。
其中,W1=Q1*K1(0<K1<1);W2=Q1*K2(0<K2<1);
其中,K1为第一修正系数,K2为第二修正系数。
起点溢出值和终点溢出值都是基于背景噪音能量值进行修正后的参考值,具体的修正大小可根据具体情况自行设定,但肯定都比背景噪音能量值大,可是也不会大出一倍。
综上所述,通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,使之适应嘈杂环境和安静环境下的不同参数检测标准,从而自适应环境检测语音的端点。同时,动态修正背景噪音能量值,让背景噪音能量值匹配终端设备所处的真实环境,判断更加精确。
以下为本方案一种自适应嘈杂环境下语音端点检测的装置的实施例,自适应嘈杂环境下语音端点检测的装置的实施例基于自适应嘈杂环境下语音端点检测的方法的实施例实现,在装置的实施例中未尽的描述,请参考方法的实施例。
请参考图4,其是本发明具体实施方式中提供的一种自适应嘈杂环境下语音端点检测的装置的第一实施例的结构方框图。如图所示,该装置,包括:
语音片录制单元310,用于录制多个连续的语音片;所述语音片中初始的若干语音片采集为样本语音;
能量值计算单元320,用于计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;
目标语音判断单元330,用于根据所述语音平均能量值和平均能量值的大小关系判断所述样本语音是否包含目标语音;
第一起点确定单元340,用于当所述样本语音包含目标语音时,所述样本语音的起点检测为目标语音的起点;
第二起点确定单元350,用于当所述样本语音不包含目标语音时,将第一特定语音片的起点检测为目标语音的起点;所述第一特定语音片及之后的第一连续预设个数的语音片的语音平均能量值超出起点溢出值;
终点确定单元360,用于将第二特定语音片的起点检测为目标语音的终点;所述第二特定语音片及之后的第二连续预设个数的语音片的语音平均能量值低于终点溢出值。
综上所述,上述各单元的协同工作,通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,使之适应嘈杂环境和安静环境下的不同参数检测标准,从而自适应环境检测语音的端点。
请参考图5,其是本发明具体实施方式中提供的一种自适应嘈杂环境下语音端点检测的装置的第二实施例的结构方框图。如图所示,该装置,包括:
语音片录制单元310,用于录制多个连续的语音片;所述语音片中初始的若干语音片采集为样本语音;
能量值计算单元320,用于计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;
目标语音判断单元330,用于根据所述语音平均能量值和平均能量值的大小关系判断所述样本语音是否包含目标语音;
第一起点确定单元340,用于当所述样本语音包含目标语音时,所述样本语音的起点检测为目标语音的起点;
第二起点确定单元350,用于当所述样本语音不包含目标语音时,将第一特定语音片的起点检测为目标语音的起点;所述第一特定语音片及之后的第一连续预设个数的语音片的语音平均能量值超出起点溢出值;
终点确定单元360,用于将第二特定语音片的起点检测为目标语音的终点;所述第二特定语音片及之后的第二连续预设个数的语音片的语音平均能量值低于终点溢出值。
其中,所述目标语音判断单元330,包括:
样本清理模块331,用于若所述样本语音中语音片的语音平均能量值与所述平均能量值的差值超出第一阈值,将该语音片从样本语音中排除;
能量值计算模块332,用于计算样本语音中剩余语音片的有效平均能量值;
目标语音判断模块333,用于若所述有效平均能量值低于能量阈值,判断所述样本语音不包含目标语音;否则判断所述样本语音包含目标语音。
其中,还包括:
参数预设单元300,用于预设背景噪音能量值;
还包括:
参数更新单元370,用于将所述背景噪音能量值更新为所述有效平均能量值。
其中,所述起点溢出值S1=Q1+W1;所述终点溢出值S2=Q1+W2;
其中,Q1为背景噪音能量值;W1为第一修正值;W2为第二修正值。
其中,W1=Q1*K1(0<K1<1);W2=Q1*K2(0<K2<1);
其中,K1为第一修正系数,K2为第二修正系数。
综上所述,上述各单元的协同工作,通过以语音片的方式对声音进行录制,对初始的若干时间片进行采样和能量计算,根据能量的计算结果判断语音的起点和终点,使之适应嘈杂环境和安静环境下的不同参数检测标准,从而自适应环境检测语音的端点。同时,动态修正背景噪音能量值,让背景噪音能量值匹配终端设备所处的真实环境,判断更加精确。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。

Claims (8)

1.一种自适应嘈杂环境下语音端点检测的方法,其特征在于,包括:
录制多个连续的语音片;所述语音片中初始的若干语音片采集为样本语音;
计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;
根据所述语音平均能量值和所有语音片的平均能量值的大小关系判断所述样本语音是否包含目标语音;
当所述样本语音包含目标语音时,所述样本语音的起点检测为目标语音的起点;
当所述样本语音不包含目标语音时,将第一特定语音片的起点检测为目标语音的起点;所述第一特定语音片及之后的第一连续预设个数的语音片的语音平均能量值超出起点溢出值;
将第二特定语音片的起点检测为目标语音的终点;所述第二特定语音片及之后的第二连续预设个数的语音片的语音平均能量值低于终点溢出值;
其中,所述根据所述语音平均能量值和所有语音片的平均能量值的大小关系判断所述样本语音是否包含目标语音,包括:
若所述样本语音中语音片的语音平均能量值与所述所有语音片的平均能量值的差值超出第一阈值,将该语音片从样本语音中排除;
计算样本语音中剩余语音片的有效平均能量值;
若所述有效平均能量值低于能量阈值,判断所述样本语音不包含目标语音;否则判断所述样本语音包含目标语音。
2.根据权利要求1所述的方法,其特征在于,所述录制多个连续的语音片之前,还包括:
预设背景噪音能量值;
所述计算样本语音中剩余语音片的有效平均能量值之后,还包括:
将所述背景噪音能量值更新为所述有效平均能量值。
3.根据权利要求2所述的方法,其特征在于,所述起点溢出值S1=Q1+W1;所述终点溢出值S2=Q1+W2;
其中,Q1为背景噪音能量值;W1为第一修正值;W2为第二修正值。
4.根据权利要求3所述的方法,其特征在于,W1=Q1*K1(0<K1<1);W2=Q1*K2(0<K2<1);
其中,K1为第一修正系数,K2为第二修正系数。
5.一种自适应嘈杂环境下语音端点检测的装置,其特征在于,包括:
语音片录制单元,用于录制多个连续的语音片;所述语音片中初始的若干语音片采集为样本语音;
能量值计算单元,用于计算样本语音中每个语音片的语音平均能量值和所有语音片的平均能量值;
目标语音判断单元,用于根据所述语音平均能量值和所有语音片的平均能量值的大小关系判断所述样本语音是否包含目标语音;
第一起点确定单元,用于当所述样本语音包含目标语音时,所述样本语音的起点检测为目标语音的起点;
第二起点确定单元,用于当所述样本语音不包含目标语音时,将第一特定语音片的起点检测为目标语音的起点;所述第一特定语音片及之后的第一连续预设个数的语音片的语音平均能量值超出起点溢出值;
终点确定单元,用于将第二特定语音片的起点检测为目标语音的终点;所述第二特定语音片及之后的第二连续预设个数的语音片的语音平均能量值低于终点溢出值;
其中,所述目标语音判断单元,包括:
样本清理模块,用于若所述样本语音中语音片的语音平均能量值与所述所有语音片的平均能量值的差值超出第一阈值,将该语音片从样本语音中排除;
能量值计算模块,用于计算样本语音中剩余语音片的有效平均能量值;
目标语音判断模块,用于若所述有效平均能量值低于能量阈值,判断所述样本语音不包含目标语音;否则判断所述样本语音包含目标语音。
6.根据权利要求5所述的装置,其特征在于,还包括:
参数预设单元,用于预设背景噪音能量值;
还包括:
参数更新单元,用于将所述背景噪音能量值更新为所述有效平均能量值。
7.根据权利要求6所述的装置,其特征在于,所述起点溢出值S1=Q1+W1;所述终点溢出值S2=Q1+W2;
其中,Q1为背景噪音能量值;W1为第一修正值;W2为第二修正值。
8.根据权利要求7所述的装置,其特征在于,W1=Q1*K1(0<K1<1);W2=Q1*K2(0<K2<1);
其中,K1为第一修正系数,K2为第二修正系数。
CN201510394437.2A 2015-07-03 2015-07-03 一种自适应嘈杂环境下语音端点检测的方法和装置 Active CN105070287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510394437.2A CN105070287B (zh) 2015-07-03 2015-07-03 一种自适应嘈杂环境下语音端点检测的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510394437.2A CN105070287B (zh) 2015-07-03 2015-07-03 一种自适应嘈杂环境下语音端点检测的方法和装置

Publications (2)

Publication Number Publication Date
CN105070287A CN105070287A (zh) 2015-11-18
CN105070287B true CN105070287B (zh) 2019-03-15

Family

ID=54499640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510394437.2A Active CN105070287B (zh) 2015-07-03 2015-07-03 一种自适应嘈杂环境下语音端点检测的方法和装置

Country Status (1)

Country Link
CN (1) CN105070287B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105609118B (zh) * 2015-12-30 2020-02-07 生迪智慧科技有限公司 语音检测方法及装置
CN107424628A (zh) * 2017-08-08 2017-12-01 哈尔滨理工大学 一种嘈杂环境下特定目标语音端点搜索的方法
CN107749298A (zh) * 2017-10-12 2018-03-02 安徽咪鼠科技有限公司 一种应用于智能语音鼠标的音频块处理方法
CN107799124A (zh) * 2017-10-12 2018-03-13 安徽咪鼠科技有限公司 一种应用于智能语音鼠标的vad检测方法
CN112669880B (zh) * 2020-12-16 2023-05-02 北京读我网络技术有限公司 一种自适应检测语音结束的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1622193A (zh) * 2004-12-24 2005-06-01 北京中星微电子有限公司 一种语音信号检测方法
CN1763844A (zh) * 2004-10-18 2006-04-26 中国科学院声学研究所 基于滑动窗口的端点检测方法、装置和语音识别系统
CN1773605A (zh) * 2004-11-12 2006-05-17 中国科学院声学研究所 一种应用于语音识别系统的语音端点检测方法
CN102687196A (zh) * 2009-10-08 2012-09-19 西班牙电信公司 用于检测语音段的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010014857A1 (en) * 1998-08-14 2001-08-16 Zifei Peter Wang A voice activity detector for packet voice network
GB2450886B (en) * 2007-07-10 2009-12-16 Motorola Inc Voice activity detector and a method of operation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1763844A (zh) * 2004-10-18 2006-04-26 中国科学院声学研究所 基于滑动窗口的端点检测方法、装置和语音识别系统
CN1773605A (zh) * 2004-11-12 2006-05-17 中国科学院声学研究所 一种应用于语音识别系统的语音端点检测方法
CN1622193A (zh) * 2004-12-24 2005-06-01 北京中星微电子有限公司 一种语音信号检测方法
CN102687196A (zh) * 2009-10-08 2012-09-19 西班牙电信公司 用于检测语音段的方法

Also Published As

Publication number Publication date
CN105070287A (zh) 2015-11-18

Similar Documents

Publication Publication Date Title
CN105070287B (zh) 一种自适应嘈杂环境下语音端点检测的方法和装置
US10453443B2 (en) Providing an indication of the suitability of speech recognition
JP6553111B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
US8065146B2 (en) Detecting an answering machine using speech recognition
CN103578468B (zh) 一种语音识别中置信度阈值的调整方法及电子设备
CN108172242B (zh) 一种改进的蓝牙智能云音箱语音交互端点检测方法
WO2016180100A1 (zh) 一种音频处理的性能提升方法及装置
CN108039181B (zh) 一种声音信号的情感信息分析方法和装置
TWI539440B (zh) 互動式語音識別電子裝置及方法
CN104123950A (zh) 一种录音方法及装置
CN103916513A (zh) 在通信终端记录通话信息的方法和设备
EP4379711A3 (en) Method and apparatus for adaptively detecting a voice activity in an input audio signal
WO2016173132A1 (zh) 语音识别方法、装置及用户设备
CN103391347A (zh) 一种自动录音的方法及装置
CN103617801A (zh) 语音检测方法、装置及电子设备
CN108733341B (zh) 一种语音交互方法及装置
CN105405441B (zh) 一种语音信息的反馈方法及装置
CN104052886A (zh) 一种信息处理方法及电子设备
CN112002349B (zh) 一种语音端点检测方法及装置
CN108696768A (zh) 一种语音识别方法及系统
CN111048118B (zh) 一种语音信号处理方法、装置及终端
CN106095380A (zh) 声音信号获取方法及装置
WO2021136298A1 (zh) 一种语音处理方法、装置、智能设备及存储介质
EP3240303B1 (en) Sound feedback detection method and device
JP5187584B2 (ja) 入力音声評価装置、入力音声の評価方法および評価プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant