CN105609118A - 语音检测方法及装置 - Google Patents
语音检测方法及装置 Download PDFInfo
- Publication number
- CN105609118A CN105609118A CN201511020926.8A CN201511020926A CN105609118A CN 105609118 A CN105609118 A CN 105609118A CN 201511020926 A CN201511020926 A CN 201511020926A CN 105609118 A CN105609118 A CN 105609118A
- Authority
- CN
- China
- Prior art keywords
- pcm data
- speech
- trigger mode
- pcm
- conditioned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 230000001143 conditioned effect Effects 0.000 claims description 37
- 230000009466 transformation Effects 0.000 claims description 7
- 238000013075 data extraction Methods 0.000 claims description 5
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 239000000284 extract Substances 0.000 description 7
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种语音检测方法及装置,根据预设的判断条件进行语音采集和语音提取,即可以通过软件算法判定是否有语音数据输入触发,当检测到语音数据输入出触发后,再通过软件算法判定语音输入的结束。该方法以软件的形式替代了传统硬件DSP芯片实现语音检测,在没有降低检测性能的同时可以有效降低硬件成本,系统功耗也会有一定程度的下降。
Description
技术领域
本发明涉及语音检测技术,尤其涉及一种语音检测方法及装置。
背景技术
随着智能家居技术的不断发展,语音控制越来越多地应用于人们的居家生活中,例如,通过语音控制家用电器。精确的语音检测是实现有效的语音控制的重要前提。
目前,普遍通过数字信号处理(DigitalSignalProcessing,简称DSP)芯片等硬件检测方式实现语音检测,这种硬件检测方式的实现成本较大,而且整个控制系统的系统功耗也比较大。
发明内容
本发明实施例提供一种语音检测方法及装置,通过软件的形式替代了传统硬件DSP芯片实现语音检测,在没有降低检测性能的同时可以有效降低硬件成本,系统功耗也会有一定程度的下降。
本发明实施例提供的语音检测方法,包括:
根据第一预设条件判定语音采集系统由非触发模式进入触发模式,从零开始记录触发模式运行参考时间T1,并将非触发模式运行参考时间T2置零,其中第一预设条件是根据T2和非触发模式下的第二PCM数据设定的;
在触发模式下进行语音采集,获取第一脉冲编码调制PCM数据;
根据第二预设条件提取T1内的第一PCM数据,其中第二预设条件是根据T1、预设时间内的第一PCM数据和所述第二PCM数据设定的;
将T1内的第一PCM数据与语音模型匹配,获取语音数据。
在本发明的一实施例中,上述根据第一预设条件判定语音采集系统由非触发模式进入触发模式之前,还包括:从零开始记录T2,在非触发模式下进行语音采集,获取第二PCM数据。
在本发明的一实施例中,上述获取第一脉冲编码调制PCM数据之后,还包括:对第一PCM数据进行傅里叶变换,得到所述第一PCM数据的分贝值;上述获取第二PCM数据之后,还包括:对第二PCM数据进行傅里叶变换,得到所述第二PCM数据的分贝值。
在本发明的一实施例中,上述根据第一预设条件判定语音采集系统由非触发模式进入触发模式,具体包括:当T2≥第一阈值,且最新获取的第二PCM数据的分贝值与T2内的第二PCM数据的平均分贝值之间的差值大于或等于第一预设值时,判定语音采集系统由非触发模式进入触发模式。
在本发明的一实施例中,上述第一阈值为最小语音突变检测时间。
在本发明的一实施例中,上述根据第二预设条件提取T1内的第一PCM数据,具体包括:当第二阈值≤T1<第三阈值,且预设时间内的第一PCM数据的平均分贝值与第二PCM数据的平均分贝值之间的差值小于第二预设值时,提取T1内的第一PCM数据。
在本发明的一实施例中,上述语音检测方法还包括:当T1≥第三阈值时,或者根据第二预设条件提取T1内的第一PCM数据之后,判定语音采集系统由触发模式进入非触发模式,从零开始记录T2,并将T1置零。
在本发明的一实施例中,上述第二阈值为有效语音输入起始分析时间,上述第三阈值为有效语音输入分析超时时间。
本发明实施例提供的语音检测装置,包括:
模式判定模块,用于根据第一预设条件判定语音采集系统由非触发模式进入触发模式,从零开始记录所述触发模式运行参考时间T1,并将所述非触发模式运行参考时间T2置零,其中第一预设条件是根据T2和非触发模式下的第二PCM数据设定的;
语音采集模块,用于在触发模式下进行语音采集,获取第一脉冲编码调制PCM数据;
数据提取模块,用于根据第二预设条件提取T1内的第一PCM数据,其中第二预设条件是根据T1、预设时间内的第一PCM数据和所述第二PCM数据设定的;
数据匹配模块,用于将T1内的第一PCM数据与语音模型匹配,获取语音数据。
本发明实施例提供的语音检测方法及装置,根据预设的判断条件进行语音采集和语音提取,即可以通过软件算法判定是否有语音数据输入触发,当检测到语音数据输入出触发后,再通过软件算法判定语音输入的结束。该方法以软件的形式替代了传统硬件DSP芯片实现语音检测,在没有降低检测性能的同时可以有效降低硬件成本,系统功耗也会有一定程度的下降。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种语音检测方法的流程图;
图2为本发明实施例提供的一种示例性的语音检测方法的流程图;
图3为本发明实施例提供的一种语音检测装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的下述实施例中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在没有特别说明的情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。
本发明实施例提供的语音检测方法具体可以通过语音检测装置来实现,该装置可以集成在控制终端中,该装置可以通过软件方式来实现,控制终端具体可以是智能手机、个人数字助理、个人电脑、家庭网关、无线调制解调器、机顶盒、数据卡或无线路由器。
图1为本发明实施例提供的一种语音检测方法的流程图,如图1所示,本实施例提供的语音检测方法包括以下步骤:
S11,根据第一预设条件判定语音采集系统由非触发模式进入触发模式,从零开始记录触发模式运行参考时间T1,并将非触发模式运行参考时间T2置零;
S12,在触发模式下进行语音采集,获取第一脉冲编码调制PCM数据;
S13,根据第二预设条件提取T1内的第一PCM数据;
S14,将T1内的第一PCM数据与语音模型匹配,获取语音数据。
具体的,在本实施例中,第一预设条件是根据T2和非触发模式下的第二PCM数据设定的,第二预设条件是根据T1、预设时间内的第一PCM数据和所述第二PCM数据设定的。
进一步的,在步骤S11之前,还可以从零开始记录T2,并在非触发模式下进行语音采集,获取第二PCM数据。
作为本实施例一种可选的实施方式,可以为非触发模式的运行参考时间T2设置时间门限为第一阈值,在根据第一预设条件判定语音采集系统由非触发模式进入触发模式的具体检测判定过程中,可以先根据记录的T2的值,判断是否达到第一阈值,若没有达到(T2<第一阈值),则判定当前仍为非触发模式,继续进行语音采集,获取第二PCM数据;若达到(T2≥第一阈值),则可以进一步判定是否有有效的语音输入。
优选的,可以根据最新获取的第二PCM数据的分贝值与T2内的第二PCM数据的平均分贝值之间的差值来判定是否有有效的语音输入。具体的,当最新获取的第二PCM数据的分贝值与T2内的第二PCM数据的平均分贝值之间的差值大于或等于第一预设值时,则认为有有效的语音输入。
也就是说,当满足第一预设条件为:T2≥第一阈值,且最新获取的第二PCM数据的分贝值与T2内的第二PCM数据的平均分贝值之间的差值大于或等于第一预设值时,判定语音采集系统由非触发模式进入触发模式,同时从零开始记录T1,并将T2置零。
相反的,当T2<第一阈值,或者T2≥第一阈值,但最新获取的第二PCM数据的分贝值与T2内的第二PCM数据的平均分贝值之间的差值小于第一预设值时,则判定语音采集系统仍然运行在非触发模式下。
作为本实施例一种可选的实施方式,可以为触发模式的运行参考时间T1设置时间门限第二阈值和第三阈值,即第二阈值≤T1<第三阈值。在根据第二预设条件提取T1内的第一PCM数据的具体检测判定过程中,可以先根据记录的T1的值,判断是否满足设定的时间门限,若不满足(T1<第二阈值),则判定当前仍为触发模式,继续进行语音采集,获取第一PCM数据;若满足(第二阈值≤T1<第三阈值),则可以进一步判定有效的语音输入是否结束。
优选的,可以根据预设时间内的第一PCM数据的平均分贝值与所述第二PCM数据的平均分贝值之间的差值来判定有效的语音输入是否结束。具体的,当预设时间内的第一PCM数据的平均分贝值与非触发模式下的第二PCM数据的平均分贝值之间的差值小于第二预设值时,判定有效的语音输入结束,并提取T1内的第一PCM数据。
也就是说,当满足第二预设条件为:第二阈值≤T1<第三阈值,且所述预设时间内的第一PCM数据的平均分贝值与所述第二PCM数据的平均分贝值之间的差值小于第二预设值时,提取T1内的第一PCM数据。
进一步的,在根据第二预设条件提取T1内的第一PCM数据之后,判定语音采集系统由触发模式进入非触发模式,同时从零开始记录T2,并将T1置零。
相反的,当T1≥第三阈值时,则也会判定语音采集系统由触发模式进入非触发模式,同时从零开始记录T2,并将T1置零。
可以理解的是,为了获取各PCM数据的分贝值,还可以分别在获取第一PCM数据和第二PCM数据之后,对第一PCM数据和第二PCM数据进行傅里叶变换,以便获取相应的PCM数据的分贝值。
值得一提的是,作为本实施例一种优选的实施方式,可以选择最小语音突变检测时间作为第一阈值,选择有效语音输入起始分析时间作为第二阈值,以及选择有效语音输入分析超时时间作为第三阈值。
可以理解的是,在具体实施过程中,上述的预设时间、第一预设值和第二预设值可以根据实际的语音检测环境、语音拾取设备的灵敏度等来选择,本实施例对此不作任何限定。
本实施例提供的语音检测方法,根据预设的判断条件进行语音采集和语音提取,即可以通过软件算法判定是否有语音数据输入触发,当检测到语音数据输入出触发后,再通过软件算法判定语音输入的结束。该方法以软件的形式替代了传统硬件DSP芯片实现语音检测,在没有降低检测性能的同时可以有效降低硬件成本,系统功耗也会有一定程度的下降。
为了更清楚的解释说明本发明的技术方案,下面进一步通过图2所示的实施例进行示例性说明,图2为本发明实施例提供的一种示例性的语音检测方法的流程图,如图2所示,该语音检测方法具体可以包括以下步骤:
S21,初始化语音检测系统,进入非触发模式,T2从零开始累计;
S22,进行语音采集,获取相应的PCM数据;
S23,对S22中获取的PCM数据进行傅里叶变换得到当前语音分贝值;
S24,判断当前是否为触发模式,若是,则执行S28,若否,则执行S25;
S25,判断T2是否小于第一阈值,若是,则执行S22~S24,若否,则执行S26;
S26,判断最新得到的语音分贝值与当前模式下的平均语音分贝值之间的差值是否大于或等于10dB,若是,则执行S27,若否,则执行S22~S24;
S27,语音检测系统由非触发模式进入触发模式,T1从零开始累计,T2置零;
S28,判断T1是否小于第二阈值,若是,则执行S22~S24,若否,则执行S29;
S29,判断T1是否小于第三阈值,若是,则执行S210,若否,则执行S211;
S210,判断最新3秒的平均语音分贝值与非触发模式下的平均语音分贝值之间的差值是否小于2dB,若是,则执行S212~S213,若否,则执行S22~S24;
S211,语音检测系统由触发模式进入非触发模式,T2从零开始累计,T1置零;
S212,提取T1内的PCM数据;
S213,将S212中提取的PCM数据与语音模型进行匹配,获取语音数据。
可选的,在S211和S213之后,还可能包括:S214,是否收到退出指令,若是,则结束检测,若否,则执行S22~S24。可以理解的是,也可能在其他步骤之后收到退出指令。
需要说明的是,本实施例仅用于对图1所示实施例进行进一步解释说明,而非用来限制本发明。具体的技术效果与图1所示实施例类似,此处不再赘述。
此外,本发明还提供一种语音检测装置,可以用来实现本发明图1或图2所示实施例提供的语音检测方法,此处不再赘述。该装置可以集成在控制终端中,该装置可以通过软件方式来实现。
图3为本发明实施例提供的一种语音检测装置的结构示意图,如图3所示,该装置包括:模式判定模块31,语音采集模块32,数据提取模块33和数据匹配模块34。其中,模式判定模块31用于根据第一预设条件判定语音采集系统由非触发模式进入触发模式,从零开始记录触发模式运行参考时间T1,并将非触发模式运行参考时间T2置零,其中第一预设条件是根据T2和非触发模式下的第二PCM数据设定的;语音采集模块32用于在触发模式下进行语音采集,获取第一脉冲编码调制PCM数据;数据提取模块33用于根据第二预设条件提取T1内的第一PCM数据,其中第二预设条件是根据T1、预设时间内的第一PCM数据和所述第二PCM数据设定的;数据匹配模块34用于将所述T1内的第一PCM数据与语音模型匹配,获取语音数据。
进一步的,模式判定模块31还用于在语音采集系统进入触发模式之前,从零开始记录T2;语音采集模块32还用于在非触发模式下进行语音采集,获取第二PCM数据。
在实际应用中,语音采集模块32还可以对第一PCM数据进行傅里叶变换,得到第一PCM数据的分贝值;或者,对第二PCM数据进行傅里叶变换,得到第二PCM数据的分贝值。
在实际应用中,第一预设条件具体可以为:T2≥第一阈值,且最新获取的第二PCM数据的分贝值与T2内的第二PCM数据的平均分贝值之间的差值大于或等于第一预设值。模式判定模块31具体可以用于:在满足第一预设条件时,判定语音采集系统由非触发模式进入触发模式。
可选的,第一阈值可以为最小语音突变检测时间。
在实际应用中,第二预设条件具体可以为:第二阈值≤T1<第三阈值,且所述预设时间内的第一PCM数据的平均分贝值与所述第二PCM数据的平均分贝值之间的差值小于第二预设值。数据提取模块31具体可以用于:在满足第二预设条件时,提取T1内的第一PCM数据。
可选的,第二阈值可以为有效语音输入起始分析时间,第三阈值可以为有效语音输入分析超时时间。
另外,在实际应用中,作为一种可能的实施方式,模式判定模块31还可以用于,当T1≥第三阈值时,或者根据第二预设条件提取T1内的第一PCM数据之后,判定语音采集系统由触发模式进入非触发模式,从零开始记录T2,并将T1置零。
本实施例提供的语音检测装置,可以用来实现本发明图1或图2所示实施例提供的语音检测方法,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (9)
1.一种语音检测方法,其特征在于,包括:
根据第一预设条件判定语音采集系统由非触发模式进入触发模式,从零开始记录触发模式运行参考时间T1,并将非触发模式运行参考时间T2置零,所述第一预设条件是根据T2和非触发模式下的第二脉冲编码调制PCM数据设定的;
在所述触发模式下进行语音采集,获取第一PCM数据;
根据第二预设条件提取T1内的第一PCM数据,所述第二预设条件是根据T1、预设时间内的第一PCM数据和所述第二PCM数据设定的;
将所述T1内的第一PCM数据与语音模型匹配,获取语音数据。
2.根据权利要求1所述的方法,其特征在于,所述根据第一预设条件判定语音采集系统由非触发模式进入触发模式之前,还包括:
从零开始记录T2;
在所述非触发模式下进行语音采集,获取第二PCM数据。
3.根据权利要求2所述的方法,其特征在于,所述获取第一PCM数据之后,还包括:
对所述第一PCM数据进行傅里叶变换,得到所述第一PCM数据的分贝值;
所述获取第二PCM数据之后,还包括:
对所述第二PCM数据进行傅里叶变换,得到所述第二PCM数据的分贝值。
4.根据权利要求3所述的方法,其特征在于,所述根据第一预设条件判定语音采集系统由非触发模式进入触发模式,具体包括:
当T2≥第一阈值,且最新获取的第二PCM数据的分贝值与T2内的第二PCM数据的平均分贝值之间的差值大于或等于第一预设值时,判定语音采集系统由非触发模式进入触发模式。
5.根据权利要求4所述的方法,其特征在于,所述第一阈值为最小语音突变检测时间。
6.根据权利要求3所述的方法,其特征在于,所述根据第二预设条件提取T1内的第一PCM数据,具体包括:
当第二阈值≤T1<第三阈值,且所述预设时间内的第一PCM数据的平均分贝值与所述第二PCM数据的平均分贝值之间的差值小于第二预设值时,提取T1内的第一PCM数据。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当T1≥第三阈值时,或者根据第二预设条件提取T1内的第一PCM数据之后,判定所述语音采集系统由触发模式进入非触发模式,从零开始记录T2,并将T1置零。
8.根据权利要求6或7所述的方法,其特征在于,所述第二阈值为有效语音输入起始分析时间,所述第三阈值为有效语音输入分析超时时间。
9.一种语音检测装置,其特征在于,包括:
模式判定模块,用于根据第一预设条件判定语音采集系统由非触发模式进入触发模式,从零开始记录所述触发模式运行参考时间T1,并将所述非触发模式运行参考时间T2置零,所述第一预设条件是根据T2和非触发模式下的第二脉冲编码调制PCM数据设定的;
语音采集模块,用于在所述触发模式下进行语音采集,获取第一脉冲编码调制PCM数据;
数据提取模块,用于根据第二预设条件提取T1内的第一PCM数据,所述第二预设条件是根据T1、预设时间内的第一PCM数据和所述第二PCM数据设定的;
数据匹配模块,用于将所述T1内的第一PCM数据与语音模型匹配,获取语音数据。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511020926.8A CN105609118B (zh) | 2015-12-30 | 2015-12-30 | 语音检测方法及装置 |
PCT/CN2016/110052 WO2017114166A1 (en) | 2015-12-30 | 2016-12-15 | Speech detection method and apparatus |
US15/737,669 US20180174602A1 (en) | 2015-12-30 | 2016-12-15 | Speech detection method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511020926.8A CN105609118B (zh) | 2015-12-30 | 2015-12-30 | 语音检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105609118A true CN105609118A (zh) | 2016-05-25 |
CN105609118B CN105609118B (zh) | 2020-02-07 |
Family
ID=55989001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511020926.8A Active CN105609118B (zh) | 2015-12-30 | 2015-12-30 | 语音检测方法及装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20180174602A1 (zh) |
CN (1) | CN105609118B (zh) |
WO (1) | WO2017114166A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017114166A1 (en) * | 2015-12-30 | 2017-07-06 | Sengled Co., Ltd. | Speech detection method and apparatus |
CN112002345A (zh) * | 2020-08-14 | 2020-11-27 | 上海动听网络科技有限公司 | 适用于声波的录音检测方法及装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113766710B (zh) * | 2021-05-06 | 2023-12-01 | 深圳市杰理微电子科技有限公司 | 基于语音检测的智能台灯控制方法以及相关设备 |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0690436A2 (de) * | 1994-06-28 | 1996-01-03 | Alcatel SEL Aktiengesellschaft | Start-/Endpunkt-Detektion zur Worterkennung |
CN1474377A (zh) * | 2002-08-07 | 2004-02-11 | 华为技术有限公司 | 通用A-Law格式语音识别方法 |
CN1912993A (zh) * | 2005-08-08 | 2007-02-14 | 中国科学院声学研究所 | 基于能量及谐波的语音端点检测方法 |
CN101047524A (zh) * | 2006-06-30 | 2007-10-03 | 华为技术有限公司 | 实现多媒体录制的方法及系统 |
CN101197130A (zh) * | 2006-12-07 | 2008-06-11 | 华为技术有限公司 | 声音活动检测方法和声音活动检测器 |
CN101201980A (zh) * | 2007-12-19 | 2008-06-18 | 北京交通大学 | 一种基于语音情感识别的远程汉语教学系统 |
CN101359474A (zh) * | 2007-07-30 | 2009-02-04 | 向为 | 一种自适应多速率宽带编码方法及编码器 |
CN102056026A (zh) * | 2009-11-06 | 2011-05-11 | 中国移动通信集团设计院有限公司 | 音视频同步检测方法及其系统、语音检测方法及其系统 |
JP2011150060A (ja) * | 2010-01-20 | 2011-08-04 | Sanyo Electric Co Ltd | 録音装置 |
CN102194452A (zh) * | 2011-04-14 | 2011-09-21 | 西安烽火电子科技有限责任公司 | 复杂背景噪声中的语音激活检测方法 |
CN102221991A (zh) * | 2011-05-24 | 2011-10-19 | 华润半导体(深圳)有限公司 | 一种4位risc微控制器 |
CN102522081A (zh) * | 2011-12-29 | 2012-06-27 | 北京百度网讯科技有限公司 | 一种检测语音端点的方法及系统 |
CN202563884U (zh) * | 2011-11-18 | 2012-11-28 | 深圳市派高模业有限公司 | 语音识别处理器及智能设备 |
CN203288240U (zh) * | 2013-03-04 | 2013-11-13 | 安徽理工大学 | 一种基于dsp的语音端点检测系统 |
CN103730118A (zh) * | 2012-10-11 | 2014-04-16 | 百度在线网络技术(北京)有限公司 | 语音信号采集方法和移动终端 |
CN103839549A (zh) * | 2012-11-22 | 2014-06-04 | 腾讯科技(深圳)有限公司 | 一种语音指令控制方法及系统 |
CN103886871A (zh) * | 2014-01-28 | 2014-06-25 | 华为技术有限公司 | 语音端点的检测方法和装置 |
CN103886861A (zh) * | 2012-12-20 | 2014-06-25 | 联想(北京)有限公司 | 一种控制电子设备的方法及电子设备 |
CN104134440A (zh) * | 2014-07-31 | 2014-11-05 | 百度在线网络技术(北京)有限公司 | 用于便携式终端的语音检测方法和语音检测装置 |
CN105070287A (zh) * | 2015-07-03 | 2015-11-18 | 广东小天才科技有限公司 | 一种自适应嘈杂环境下语音端点检测的方法和装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1443498B1 (en) * | 2003-01-24 | 2008-03-19 | Sony Ericsson Mobile Communications AB | Noise reduction and audio-visual speech activity detection |
US7756709B2 (en) * | 2004-02-02 | 2010-07-13 | Applied Voice & Speech Technologies, Inc. | Detection of voice inactivity within a sound stream |
JP4282704B2 (ja) * | 2006-09-27 | 2009-06-24 | 株式会社東芝 | 音声区間検出装置およびプログラム |
US8954324B2 (en) * | 2007-09-28 | 2015-02-10 | Qualcomm Incorporated | Multiple microphone voice activity detector |
KR20140026229A (ko) * | 2010-04-22 | 2014-03-05 | 퀄컴 인코포레이티드 | 음성 액티비티 검출 |
US9147397B2 (en) * | 2013-10-29 | 2015-09-29 | Knowles Electronics, Llc | VAD detection apparatus and method of operating the same |
US9886963B2 (en) * | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
US9799349B2 (en) * | 2015-04-24 | 2017-10-24 | Cirrus Logic, Inc. | Analog-to-digital converter (ADC) dynamic range enhancement for voice-activated systems |
CN105609118B (zh) * | 2015-12-30 | 2020-02-07 | 生迪智慧科技有限公司 | 语音检测方法及装置 |
-
2015
- 2015-12-30 CN CN201511020926.8A patent/CN105609118B/zh active Active
-
2016
- 2016-12-15 WO PCT/CN2016/110052 patent/WO2017114166A1/en active Application Filing
- 2016-12-15 US US15/737,669 patent/US20180174602A1/en not_active Abandoned
Patent Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0690436A2 (de) * | 1994-06-28 | 1996-01-03 | Alcatel SEL Aktiengesellschaft | Start-/Endpunkt-Detektion zur Worterkennung |
US5794195A (en) * | 1994-06-28 | 1998-08-11 | Alcatel N.V. | Start/end point detection for word recognition |
CN1474377A (zh) * | 2002-08-07 | 2004-02-11 | 华为技术有限公司 | 通用A-Law格式语音识别方法 |
CN1912993A (zh) * | 2005-08-08 | 2007-02-14 | 中国科学院声学研究所 | 基于能量及谐波的语音端点检测方法 |
CN101047524A (zh) * | 2006-06-30 | 2007-10-03 | 华为技术有限公司 | 实现多媒体录制的方法及系统 |
CN101197130A (zh) * | 2006-12-07 | 2008-06-11 | 华为技术有限公司 | 声音活动检测方法和声音活动检测器 |
CN101359474A (zh) * | 2007-07-30 | 2009-02-04 | 向为 | 一种自适应多速率宽带编码方法及编码器 |
CN101201980A (zh) * | 2007-12-19 | 2008-06-18 | 北京交通大学 | 一种基于语音情感识别的远程汉语教学系统 |
CN102056026A (zh) * | 2009-11-06 | 2011-05-11 | 中国移动通信集团设计院有限公司 | 音视频同步检测方法及其系统、语音检测方法及其系统 |
JP2011150060A (ja) * | 2010-01-20 | 2011-08-04 | Sanyo Electric Co Ltd | 録音装置 |
CN102194452A (zh) * | 2011-04-14 | 2011-09-21 | 西安烽火电子科技有限责任公司 | 复杂背景噪声中的语音激活检测方法 |
CN102221991A (zh) * | 2011-05-24 | 2011-10-19 | 华润半导体(深圳)有限公司 | 一种4位risc微控制器 |
CN202563884U (zh) * | 2011-11-18 | 2012-11-28 | 深圳市派高模业有限公司 | 语音识别处理器及智能设备 |
CN102522081A (zh) * | 2011-12-29 | 2012-06-27 | 北京百度网讯科技有限公司 | 一种检测语音端点的方法及系统 |
CN103730118A (zh) * | 2012-10-11 | 2014-04-16 | 百度在线网络技术(北京)有限公司 | 语音信号采集方法和移动终端 |
CN103839549A (zh) * | 2012-11-22 | 2014-06-04 | 腾讯科技(深圳)有限公司 | 一种语音指令控制方法及系统 |
CN103886861A (zh) * | 2012-12-20 | 2014-06-25 | 联想(北京)有限公司 | 一种控制电子设备的方法及电子设备 |
CN203288240U (zh) * | 2013-03-04 | 2013-11-13 | 安徽理工大学 | 一种基于dsp的语音端点检测系统 |
CN103886871A (zh) * | 2014-01-28 | 2014-06-25 | 华为技术有限公司 | 语音端点的检测方法和装置 |
CN104134440A (zh) * | 2014-07-31 | 2014-11-05 | 百度在线网络技术(北京)有限公司 | 用于便携式终端的语音检测方法和语音检测装置 |
CN105070287A (zh) * | 2015-07-03 | 2015-11-18 | 广东小天才科技有限公司 | 一种自适应嘈杂环境下语音端点检测的方法和装置 |
Non-Patent Citations (2)
Title |
---|
徐大为: ""一种噪声环境下的实时语音端点检测算法"", 《计算机工程与应用》 * |
胡光锐: ""基于倒谱特征的带噪语音端点检测"", 《电子学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017114166A1 (en) * | 2015-12-30 | 2017-07-06 | Sengled Co., Ltd. | Speech detection method and apparatus |
CN112002345A (zh) * | 2020-08-14 | 2020-11-27 | 上海动听网络科技有限公司 | 适用于声波的录音检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105609118B (zh) | 2020-02-07 |
WO2017114166A1 (en) | 2017-07-06 |
US20180174602A1 (en) | 2018-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3522153B1 (en) | Voice control system, wakeup method and wakeup apparatus therefor, electrical appliance and co-processor | |
Chatlani et al. | Local binary patterns for 1-D signal processing | |
US8972252B2 (en) | Signal processing apparatus having voice activity detection unit and related signal processing methods | |
CN110517670A (zh) | 提升唤醒性能的方法和装置 | |
JP2019509523A (ja) | 音声データ処理の方法、装置及び記憶媒体 | |
CN112820291B (zh) | 智能家居控制方法、系统和存储介质 | |
CN108564948B (zh) | 一种语音识别方法及电子设备 | |
CN109065051B (zh) | 一种语音识别处理方法及装置 | |
CN105609118A (zh) | 语音检测方法及装置 | |
CN110600008A (zh) | 语音唤醒的优化方法及系统 | |
CN105989836A (zh) | 一种语音采集方法、装置及终端设备 | |
CN111192590B (zh) | 语音唤醒方法、装置、设备及存储介质 | |
CN107293309A (zh) | 一种基于客户情绪分析提升舆情监控效率的方法 | |
CN110797031A (zh) | 语音变音检测方法、系统、移动终端及存储介质 | |
CN108922522B (zh) | 设备的控制方法、装置、存储介质及电子装置 | |
CN111833902A (zh) | 唤醒模型训练方法、唤醒词识别方法、装置及电子设备 | |
CN110264999A (zh) | 一种音频处理方法、设备及计算机可读介质 | |
CN114791771A (zh) | 智能语音鼠标的交互管理系统及管理方法 | |
CN111179924B (zh) | 一种基于模式切换的唤醒性能优化的方法及系统 | |
CN111866289A (zh) | 外呼号码状态检测方法及装置、智能外呼方法及系统 | |
US20160163313A1 (en) | Information processing method and electronic device | |
CN103714811B (zh) | 一种语音控制物业系统方法及装置 | |
CN112614506B (zh) | 语音激活检测方法和装置 | |
CN110556099B (zh) | 一种命令词控制方法及设备 | |
CN105718019B (zh) | 一种信息处理方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Voice detection method and device Effective date of registration: 20230227 Granted publication date: 20200207 Pledgee: Tongxiang Yunbei Investment Construction Co.,Ltd. Pledgor: SENGLED Co.,Ltd. Registration number: Y2023980033490 |