CN110706703A - 一种语音唤醒方法、装置、介质和设备 - Google Patents
一种语音唤醒方法、装置、介质和设备 Download PDFInfo
- Publication number
- CN110706703A CN110706703A CN201910985003.8A CN201910985003A CN110706703A CN 110706703 A CN110706703 A CN 110706703A CN 201910985003 A CN201910985003 A CN 201910985003A CN 110706703 A CN110706703 A CN 110706703A
- Authority
- CN
- China
- Prior art keywords
- comparison
- awakening
- threshold
- wake
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 132
- 230000008569 process Effects 0.000 claims abstract description 92
- 230000003993 interaction Effects 0.000 claims abstract description 62
- 239000000126 substance Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000001960 triggered effect Effects 0.000 description 5
- 101100356682 Caenorhabditis elegans rho-1 gene Proteins 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 230000002618 waking effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及一种语音唤醒方法、装置、介质和设备。根据本发明实施例提供的方案,在每一轮唤醒过程中,可以包括多次唤醒。在一轮唤醒过程中,如果其中一次唤醒对应的接收到的语音信号与预先保存的包括关键词的语音信号进行比对得到的相似率,低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并继续进行一次唤醒,此时若比对次数达到设定次数,则认为可以将智能语音交互设备唤醒,触发智能语音交互设备进入唤醒状态,实现对智能语音交互设备的唤醒。这样,即使在存在干扰的情况下,也可以通过多次比对的方式,保证唤醒置信度,完成存在干扰情况下的智能语音交互设备唤醒,提高语音唤醒成功率。
Description
技术领域
本发明涉及智能语音交互技术领域,特别涉及一种语音唤醒方法、装置、介质和设备。
背景技术
当前智能语音交互设备,如智能音箱、机器人等应用越来越广泛。这些设备一般都可以被用户用某个关键词唤醒,唤醒后找到用户的方向,对用户的方向进行语音增强,进而进一步识别出用户的语音指令。
目前智能语音交互设备的唤醒依赖于包括关键词的语音信号质量的优劣,对于纯净的语音信号,智能语音交互设备唤醒成功率较高,但是对于受混响、噪声等干扰的语音信号,智能语音交互设备唤醒成功率较低。
发明内容
本发明实施例提供一种语音唤醒方法、装置、介质和设备,用于解决存在干扰的情况下,语音唤醒成功率较低的问题。
本发明提供一种语音唤醒方法,所述方法包括:
接收语音信号;
将接收到的语音信号与预先保存的包括关键词的语音信号进行比对:
若比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,返回执行接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态。
根据本发明实施例提供的方案,在每一轮唤醒过程中,可以包括多次唤醒。在一轮唤醒过程中,如果其中一次唤醒对应的接收到的语音信号与预先保存的包括关键词的语音信号进行比对得到的相似率,低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并继续进行一次唤醒,此时若比对次数达到设定次数,则认为可以将智能语音交互设备唤醒,触发智能语音交互设备进入唤醒状态,实现对智能语音交互设备的唤醒。这样,即使在存在干扰的情况下,接收到的语音信号与预先保存的包括关键词的语音信号进行比对得到的相似率不是很高,也可以通过多次比对的方式,保证唤醒置信度,完成存在干扰情况下的智能语音交互设备唤醒,提高语音唤醒成功率。
在一种可能的实现方式中,所述方法还可以包括:若比对得到的相似率不低于设定的第一阈值,则触发智能语音交互设备进入唤醒状态。
在本发明方案中,如果某一次比对得到的相似率较高,可以直接触发智能语音交互设备进入唤醒状态,进一步保证唤醒的成功率。
在一种可能的实现方式中,所述方法还可以包括:若比对得到的相似率低于设定的第二阈值,则提示进入新一轮唤醒过程。
在本发明方案中,如果某一次比对得到的相似率过低,可以认为本轮唤醒失败,提示进入新一轮唤醒过程,减少误唤醒,提高唤醒的准确率。
在一种可能的实现方式中,所述方法还可以包括:返回执行接收语音信号时,若设定时长内没有接收到语音信号,则提示进入新一轮唤醒过程。
在本发明方案中,如果等待时间较长仍然没有接收到下一次用于唤醒的语音,则可以认为本轮唤醒失败,提示进入新一轮唤醒过程,进一步减少误唤醒,提高唤醒的准确率。
在一种可能的实现方式中,若本轮唤醒过程中,本次比对之前进行过比对,则,若比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,返回执行接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,可以包括:
若比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值均不大于设定的第三阈值,且比对次数没有达到设定次数,则提示需继续唤醒,返回执行接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,否则,提示进入新一轮唤醒过程。
即在本发明方案中,可以进一步结合当前轮次的唤醒过程中,本次唤醒与之前每次唤醒之间的相似率差异均保持在一定范围内,来进一步保证唤醒置信度。通过多次唤醒,逐步增加唤醒置信度,减少误唤醒操作,保证唤醒的准确性。
进一步的,若比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值不满足均不大于设定的第三阈值,提示进入新一轮唤醒过程。
进而可以在当前轮次的唤醒过程中,若本次比对得到的相似率与之前比对得到的相似率差异较大时,认为本轮唤醒失败,提示进入新一轮唤醒过程,来进一步保证唤醒置信度,减少误唤醒操作,保证唤醒的准确性。
本发明还提供一种语音唤醒装置,所述装置包括:
接收模块,用于接收语音信号;
比对模块,用于将所述接收模块接收到的语音信号与预先保存的包括关键词的语音信号进行比对;
唤醒模块,用于若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并触发所述接收模块再次接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态。
在一种可能的实现方式中,所述唤醒模块,还用于若所述比对模块比对得到的相似率不低于设定的第一阈值,则触发智能语音交互设备进入唤醒状态。
在一种可能的实现方式中,所述唤醒模块,还用于若所述比对模块比对得到的相似率低于设定的第二阈值,则提示进入新一轮唤醒过程。
在一种可能的实现方式中,所述唤醒模块,还用于触发所述接收模块再次接收语音信号时,若所述接收模块设定时长内没有接收到语音信号,则提示进入新一轮唤醒过程。
在一种可能的实现方式中,若本轮唤醒过程中,所述比对模块本次比对之前进行过比对,则:所述唤醒模块,用于若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并触发所述接收模块再次接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,包括:
若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值均不大于设定的第三阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并触发所述接收模块再次接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,否则,提示进入新一轮唤醒过程。
进一步的,所述唤醒模块,还用于若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值不满足均不大于设定的第三阈值,提示进入新一轮唤醒过程。
本发明还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现如上所述的方法。
本发明还提供了一种语音唤醒设备,包括至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述方法的步骤。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的语音唤醒方法的流程示意图;
图2为本发明实施例二提供的语音唤醒方法的流程示意图;
图3为本发明实施例三提供的语音唤醒装置的结构示意图;
图4为本发明实施例四提供的语音唤醒设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
本发明实施例一提供一种语音唤醒方法,该方法的步骤流程可以如图1所示,包括:
步骤101、接收语音信号。
在本步骤中,可以接收用户用于唤醒智能语音交互设备的语音信号。
步骤102、进行比对。
在本步骤中,可以将接收到的语音信号与预先保存的包括关键词的语音信号进行比对。
即在本实施例中,需要用户提前录入包括关键词的语音信号,例如,小格。
将接收到的语音信号与预先保存的包括关键词的语音信号进行比对,可以理解为,对接收到的语音信号进行语音特征提取,语音特征可以但不限于为频谱或倒谱系数,并与预先保存的包括关键词的语音信号对应的语音特征模型进行对比,获得相似率。
步骤103、进行唤醒。
在本步骤中,若比对得到的相似率低于设定的第一阈值(可以用α表示),但不低于设定的第二阈值(可以用β表示),且比对次数没有达到设定次数,则提示需继续唤醒,返回执行步骤101,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态。
在一种可能的实现方式中,若本轮唤醒过程中,本次比对之前进行过比对,则本步骤可以进一步根据本轮唤醒过程中,每次比对得到的相似率之间的差异情况进行唤醒,以增加唤醒置信度。
即,若本轮唤醒过程中,本次比对之前进行过比对,则在本步骤中,若比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值均不大于设定的第三阈值(可以用δ表示),且比对次数没有达到设定次数,则提示需继续唤醒,返回执行接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,否则,提示进入新一轮唤醒过程。
当然,若比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值不满足均不大于设定的第三阈值,可以提示进入新一轮唤醒过程。
需要说明的是,在本步骤中,若比对得到的相似率不低于设定的第一阈值,还可以直接触发智能语音交互设备进入唤醒状态,从而进一步保证唤醒的成功率。
此外,在本步骤中,若比对得到的相似率低于设定的第二阈值,还可以提示进入新一轮唤醒过程,进一步保证唤醒的准确性。
需要进一步说明的是,在一种可能的实现方式中,返回执行步骤101时,若设定时长内没有接收到语音信号,可以提示进入新一轮唤醒过程。从而在一定程度上,减少误唤醒的可能,提高唤醒的准确性。
在本发明各实施例中,提示需继续唤醒、以及提示进入新一轮唤醒过程均可以通过任意的提示方法实现。例如,可以但不限于为语音提示、持续发出某种颜色的灯光或者某种颜色的灯光闪烁的方式。
下面以一轮唤醒过程中,设定的比对次数为3次,且若本轮唤醒过程中,本次比对之前进行过比对,则需要本次比对与之前的每次比对得到的相似率之间的差值的绝对值均不大于设定的第三阈值为例,通过实施例二对本发明实施例一提供的方案进行说明。
实施例二
本发明实施例二提供一种语音唤醒方法,该方法的步骤流程可以如图2所示,包括:
步骤201、接收语音信号。
在本步骤中,可以接收用户用于唤醒智能语音交互设备的语音信号。
步骤202、进行比对。
本轮唤醒过程第一次接收到的语音信号,可以称为语音段1。将语音段1与预先保存的包括关键词的语音信号进行比对,得到的相似率可以用ρ1表示。
步骤203、进行唤醒。
若ρ1>=α,此时可以认为环境噪声较小或者唤醒声源较近,可以直接触发智能语音交互设备进入唤醒状态,智能语音交互设备唤醒成功,本流程结束,结束本轮唤醒过程。
若ρ1<β<α,此时可以认为环境噪声较大或者唤醒声源较远,可以提示进入新一轮唤醒过程,智能语音交互设备恢复到初始待唤醒状态,本流程结束,结束本轮唤醒过程。
若β<=ρ1<α,由于本轮唤醒过程中,本次比对之前未进行过比对,那么由于比对次数没有达到3次,可以提示需继续唤醒,并继续执行步骤201,智能语音交互设备进入二次唤醒等待状态。
继续执行步骤201时,需要进一步判断是否在设定时长(可以用T表示)内接收到语音信号,如果是,则继续执行步骤202,否则,可以提示进入新一轮唤醒过程,智能语音交互设备恢复到初始待唤醒状态,本流程结束,结束本轮唤醒过程。
此时,在步骤202中,本轮唤醒过程第二次接收到的语音信号,可以称为语音段2。将语音段2与预先保存的包括关键词的语音信号进行比对,得到的相似率可以用ρ2表示。
此时,在步骤203中:
若ρ2>=α,此时可以认为环境噪声较小或者唤醒声源较近,可以直接触发智能语音交互设备进入唤醒状态,智能语音交互设备唤醒成功,本流程结束,结束本轮唤醒过程。
若ρ2<β<α,此时可以认为环境噪声较大或者唤醒声源较远,可以提示进入新一轮唤醒过程,智能语音交互设备恢复到初始待唤醒状态,本流程结束,结束本轮唤醒过程。
若β<=ρ2<α,由于本轮唤醒过程中,本次比对之前进行过比对,那么:
若不满足|ρ1-ρ2|<=δ,可以提示进入新一轮唤醒过程,智能语音交互设备恢复到初始待唤醒状态,本流程结束,结束本轮唤醒过程。
若|ρ1-ρ2|<=δ,由于比对次数没有达到3次,可以提示需继续唤醒,并继续执行步骤201,智能语音交互设备进入三次唤醒等待状态。
继续执行步骤201时,需要进一步判断是否在设定时长(可以用T表示)内接收到语音信号,如果是,则继续执行步骤202,否则,可以提示进入新一轮唤醒过程,智能语音交互设备恢复到初始待唤醒状态,本流程结束,结束本轮唤醒过程。
此时,在步骤202中,本轮唤醒过程第三次接收到的语音信号,可以称为语音段3。将语音段3与预先保存的包括关键词的语音信号进行比对,得到的相似率可以用ρ3表示。
此时,在步骤203中:
若ρ3>=α,此时可以认为环境噪声较小或者唤醒声源较近,可以直接触发智能语音交互设备进入唤醒状态,智能语音交互设备唤醒成功,本流程结束,结束本轮唤醒过程。
若ρ3<β<α,此时可以认为环境噪声较大或者唤醒声源较远,可以提示进入新一轮唤醒过程,智能语音交互设备恢复到初始待唤醒状态,本流程结束,结束本轮唤醒过程。
若β<=ρ3<α,由于本轮唤醒过程中,本次比对之前进行过比对,那么:
若不满足|ρ1-ρ3|<=δ,以及|ρ2-ρ3|<=δ,可以提示进入新一轮唤醒过程,智能语音交互设备恢复到初始待唤醒状态,本流程结束,结束本轮唤醒过程。
若|ρ1-ρ3|<=δ且|ρ2-ρ3|<=δ,由于比对次数达到3次,可以触发智能语音交互设备进入唤醒状态,智能语音交互设备唤醒成功,本流程结束,结束本轮唤醒过程。
与实施例一、二提供的方法对应的,提供以下的装置。
实施例三
本发明实施例三提供一种语音唤醒装置,该装置的结构可以如图3所示,包括:
接收模块11用于接收语音信号;
比对模块12用于将所述接收模块接收到的语音信号与预先保存的包括关键词的语音信号进行比对;
唤醒模块13用于若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并触发所述接收模块再次接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态。
所述唤醒模块13还用于若所述比对模块比对得到的相似率不低于设定的第一阈值,则触发智能语音交互设备进入唤醒状态。
所述唤醒模块13还用于若所述比对模块比对得到的相似率低于设定的第二阈值,则提示进入新一轮唤醒过程。
所述唤醒模块13还用于触发所述接收模块再次接收语音信号时,若所述接收模块设定时长内没有接收到语音信号,则提示进入新一轮唤醒过程。
若本轮唤醒过程中,所述比对模块本次比对之前进行过比对,则:所述唤醒模块13用于若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并触发所述接收模块再次接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,包括:
若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值均不大于设定的第三阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并触发所述接收模块再次接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,否则,提示进入新一轮唤醒过程。
所述唤醒模块13还用于若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值不满足均不大于设定的第三阈值,提示进入新一轮唤醒过程。
基于同一发明构思,本发明实施例提供以下的设备和介质。
实施例四
本发明实施例四提供一种语音唤醒设备,该设备的结构可以如图4所示,包括至少一个处理器21;以及与所述至少一个处理器通信连接的存储器22;其中,所述存储器22存储有可被所述至少一个处理器21执行的指令,所述指令被所述至少一个处理器21执行,以使所述至少一个处理器21能够执行本发明实施例一所述方法的步骤。
可选的,所述处理器21具体可以包括中央处理器(CPU)、特定应用集成电路(ASIC,application specific integrated circuit),可以是一个或多个用于控制程序执行的集成电路,可以是使用现场可编程门阵列(FPGA,field programmable gate array)开发的硬件电路,可以是基带处理器。
可选的,所述处理器21可以包括至少一个处理核心。
可选的,所述存储器22可以包括只读存储器(ROM,read only memory)、随机存取存储器(RAM,random access memory)和磁盘存储器。存储器22用于存储至少一个处理器21运行时所需的数据。存储器22的数量可以为一个或多个。
本发明实施例五提供一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,当可执行程序被处理器执行时,实现本发明实施例一提供的方法。
在具体的实施过程中,计算机存储介质可以包括:通用串行总线闪存盘(USB,Universal Serial Bus flash drive)、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的存储介质。
在本发明实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性或其它的形式。
在本发明实施例中的各功能单元可以集成在一个处理单元中,或者各个单元也可以均是独立的物理模块。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备,例如可以是个人计算机,服务器,或者网络设备等,或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:通用串行总线闪存盘(universal serial bus flash drive)、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (14)
1.一种语音唤醒方法,其特征在于,所述方法包括:
接收语音信号;
将接收到的语音信号与预先保存的包括关键词的语音信号进行比对:
若比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,返回执行接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:若比对得到的相似率不低于设定的第一阈值,则触发智能语音交互设备进入唤醒状态。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:若比对得到的相似率低于设定的第二阈值,则提示进入新一轮唤醒过程。
4.如权利要求1所述的方法,其特征在于,返回执行接收语音信号时,若设定时长内没有接收到语音信号,则提示进入新一轮唤醒过程。
5.如权利要求1~4任一所述的方法,其特征在于,若本轮唤醒过程中,本次比对之前进行过比对,则,若比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,返回执行接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,包括:
若比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值均不大于设定的第三阈值,且比对次数没有达到设定次数,则提示需继续唤醒,返回执行接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,否则,提示进入新一轮唤醒过程。
6.如权利要求5所述的方法,其特征在于,若比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值不满足均不大于设定的第三阈值,提示进入新一轮唤醒过程。
7.一种语音唤醒装置,其特征在于,所述装置包括:
接收模块,用于接收语音信号;
比对模块,用于将所述接收模块接收到的语音信号与预先保存的包括关键词的语音信号进行比对;
唤醒模块,用于若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并触发所述接收模块再次接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态。
8.如权利要求7所述的装置,其特征在于,所述唤醒模块,还用于若所述比对模块比对得到的相似率不低于设定的第一阈值,则触发智能语音交互设备进入唤醒状态。
9.如权利要求7所述的装置,其特征在于,所述唤醒模块,还用于若所述比对模块比对得到的相似率低于设定的第二阈值,则提示进入新一轮唤醒过程。
10.如权利要求7所述的装置,其特征在于,所述唤醒模块,还用于触发所述接收模块再次接收语音信号时,若所述接收模块设定时长内没有接收到语音信号,则提示进入新一轮唤醒过程。
11.如权利要求7~10任一所述的装置,其特征在于,若本轮唤醒过程中,所述比对模块本次比对之前进行过比对,则:所述唤醒模块,用于若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并触发所述接收模块再次接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,包括:
若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值均不大于设定的第三阈值,且比对次数没有达到设定次数,则提示需继续唤醒,并触发所述接收模块再次接收语音信号,直至比对次数达到设定次数,触发智能语音交互设备进入唤醒状态,否则,提示进入新一轮唤醒过程。
12.如权利要求11所述的装置,其特征在于,所述唤醒模块,还用于若所述比对模块比对得到的相似率低于设定的第一阈值,但不低于设定的第二阈值,且与本轮唤醒过程中,本次比对之前的每次比对得到的相似率之间的差值的绝对值不满足均不大于设定的第三阈值,提示进入新一轮唤醒过程。
13.一种非易失性计算机存储介质,其特征在于,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现权利要求1~6任一所述的方法。
14.一种语音唤醒设备,其特征在于,所述设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1~6任一权利要求所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910985003.8A CN110706703A (zh) | 2019-10-16 | 2019-10-16 | 一种语音唤醒方法、装置、介质和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910985003.8A CN110706703A (zh) | 2019-10-16 | 2019-10-16 | 一种语音唤醒方法、装置、介质和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110706703A true CN110706703A (zh) | 2020-01-17 |
Family
ID=69201181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910985003.8A Pending CN110706703A (zh) | 2019-10-16 | 2019-10-16 | 一种语音唤醒方法、装置、介质和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110706703A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111367944A (zh) * | 2020-03-02 | 2020-07-03 | 深圳市格物致新科技有限公司 | 一种智能厕所信息联动方法、系统及存储介质 |
CN111755002A (zh) * | 2020-06-19 | 2020-10-09 | 北京百度网讯科技有限公司 | 语音识别装置、电子设备和语音识别方法 |
CN112489663A (zh) * | 2020-11-09 | 2021-03-12 | 北京声智科技有限公司 | 一种语音唤醒方法、装置、介质和设备 |
CN113628622A (zh) * | 2021-08-24 | 2021-11-09 | 北京达佳互联信息技术有限公司 | 语音交互方法、装置、电子设备及存储介质 |
WO2023029442A1 (zh) * | 2021-08-30 | 2023-03-09 | 佛山市顺德区美的电子科技有限公司 | 智能设备的控制方法、装置、智能设备和可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160086603A1 (en) * | 2012-06-15 | 2016-03-24 | Cypress Semiconductor Corporation | Power-Efficient Voice Activation |
CN106297777A (zh) * | 2016-08-11 | 2017-01-04 | 广州视源电子科技股份有限公司 | 一种唤醒语音服务的方法和装置 |
CN106653021A (zh) * | 2016-12-27 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 语音唤醒的控制方法、装置及终端 |
CN107230475A (zh) * | 2017-05-27 | 2017-10-03 | 腾讯科技(深圳)有限公司 | 一种语音关键词识别方法、装置、终端及服务器 |
CN107622770A (zh) * | 2017-09-30 | 2018-01-23 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
CN110111789A (zh) * | 2019-05-07 | 2019-08-09 | 百度国际科技(深圳)有限公司 | 语音交互方法、装置、计算设备和计算机可读介质 |
-
2019
- 2019-10-16 CN CN201910985003.8A patent/CN110706703A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160086603A1 (en) * | 2012-06-15 | 2016-03-24 | Cypress Semiconductor Corporation | Power-Efficient Voice Activation |
CN106297777A (zh) * | 2016-08-11 | 2017-01-04 | 广州视源电子科技股份有限公司 | 一种唤醒语音服务的方法和装置 |
CN106653021A (zh) * | 2016-12-27 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 语音唤醒的控制方法、装置及终端 |
CN107230475A (zh) * | 2017-05-27 | 2017-10-03 | 腾讯科技(深圳)有限公司 | 一种语音关键词识别方法、装置、终端及服务器 |
CN107622770A (zh) * | 2017-09-30 | 2018-01-23 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
CN110111789A (zh) * | 2019-05-07 | 2019-08-09 | 百度国际科技(深圳)有限公司 | 语音交互方法、装置、计算设备和计算机可读介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111367944A (zh) * | 2020-03-02 | 2020-07-03 | 深圳市格物致新科技有限公司 | 一种智能厕所信息联动方法、系统及存储介质 |
CN111367944B (zh) * | 2020-03-02 | 2023-05-02 | 深圳市格物致新科技有限公司 | 一种智能厕所信息联动方法、系统及存储介质 |
CN111755002A (zh) * | 2020-06-19 | 2020-10-09 | 北京百度网讯科技有限公司 | 语音识别装置、电子设备和语音识别方法 |
CN112489663A (zh) * | 2020-11-09 | 2021-03-12 | 北京声智科技有限公司 | 一种语音唤醒方法、装置、介质和设备 |
CN113628622A (zh) * | 2021-08-24 | 2021-11-09 | 北京达佳互联信息技术有限公司 | 语音交互方法、装置、电子设备及存储介质 |
WO2023029442A1 (zh) * | 2021-08-30 | 2023-03-09 | 佛山市顺德区美的电子科技有限公司 | 智能设备的控制方法、装置、智能设备和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110706703A (zh) | 一种语音唤醒方法、装置、介质和设备 | |
CN106782536B (zh) | 一种语音唤醒方法及装置 | |
EP3779972A1 (en) | Voice wake-up method and apparatus | |
CN110415705B (zh) | 一种热词识别方法、系统、装置及存储介质 | |
CN109065044B (zh) | 唤醒词识别方法、装置、电子设备及计算机可读存储介质 | |
CN107256707B (zh) | 一种语音识别方法、系统及终端设备 | |
CN106653021A (zh) | 语音唤醒的控制方法、装置及终端 | |
CN110111789B (zh) | 语音交互方法、装置、计算设备和计算机可读介质 | |
CN110910878B (zh) | 语音唤醒控制方法、装置、存储介质及家电设备 | |
CN108039175B (zh) | 语音识别方法、装置及服务器 | |
CN110473536B (zh) | 一种唤醒方法、装置和智能设备 | |
CN109741740B (zh) | 基于外部触发的语音交互方法及装置 | |
CN111161728B (zh) | 一种智能设备的唤醒方法、装置、设备及介质 | |
CN110634468B (zh) | 语音唤醒方法、装置、设备及计算机可读存储介质 | |
CN110875059B (zh) | 收音结束的判断方法、装置以及储存装置 | |
CN113920988B (zh) | 语音唤醒方法、装置及可读存储介质 | |
US20200211545A1 (en) | Voice interaction method, apparatus and device, and storage medium | |
CN111128155B (zh) | 一种智能设备的唤醒方法、装置、设备及介质 | |
CN111128174A (zh) | 一种语音信息的处理方法、装置、设备及介质 | |
CN111081254A (zh) | 一种语音识别方法和装置 | |
CN111179913B (zh) | 一种语音处理方法及装置 | |
CN111739515B (zh) | 语音识别方法、设备、电子设备和服务器、相关系统 | |
CN109068005B (zh) | 一种计时提醒事件的创建方法及装置 | |
CN109559733B (zh) | 语音节奏处理方法和装置 | |
CN111161745A (zh) | 一种智能设备的唤醒方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200117 |