CN114999483A - 语音唤醒处理方法及装置 - Google Patents

语音唤醒处理方法及装置 Download PDF

Info

Publication number
CN114999483A
CN114999483A CN202210606298.5A CN202210606298A CN114999483A CN 114999483 A CN114999483 A CN 114999483A CN 202210606298 A CN202210606298 A CN 202210606298A CN 114999483 A CN114999483 A CN 114999483A
Authority
CN
China
Prior art keywords
voice
equipment
wake
awakening
decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210606298.5A
Other languages
English (en)
Inventor
张新星
陈峰峰
邓宏
袁伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Hongmei Intelligent Technology Co Ltd
Hefei Meiling Union Technology Co Ltd
Original Assignee
Sichuan Hongmei Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Hongmei Intelligent Technology Co Ltd filed Critical Sichuan Hongmei Intelligent Technology Co Ltd
Priority to CN202210606298.5A priority Critical patent/CN114999483A/zh
Publication of CN114999483A publication Critical patent/CN114999483A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本说明书实施例提供一种语音唤醒处理方法及装置,方法由决策设备执行,方法包括:在接收到一个语音设备发送来的唤醒请求时,判断该语音设备所在的房间内是否存在其它语音设备;若存在其它语音设备,则开始计时,在计时时长达到预设时长后判断在计时过程中是否接收到其它语音设备发送来的唤醒请求;若在计时过程中接收到其它语音设备发送来的唤醒请求,则获取每一个发送唤醒请求的语音设备的拾音参数;根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,并向目标语音设备发送唤醒应答指令,以使目标语音设备从唤醒等待状态进入唤醒状态。本发明可以降低家庭内全部语音设备的整体误唤醒的概率。

Description

语音唤醒处理方法及装置
技术领域
本说明书一个或多个实施例涉及语音设备技术领域,尤其是一种语音唤醒处理方法及装置。
背景技术
语音识别技术是当下应用最广泛的人机交互技术,用户通过发起语音指令去控制语音设备执行相应的操作,比如,控制空调开机、关机。语音交互控制的全流程包括:语音唤醒、发送语音指令、设备执行动作、设备语音反馈等几个关键环节。语音唤醒即预先为语音设备设定一个或多个专有的词汇,用户通过该专有词汇可以将处于唤醒等待状态的语音设备激活,进入语音指令识别等待状态,用户可进一步发起各类语音指令,语音设备在收到后,执行对应的指令动作,并通过设备自带的播放部件,反馈指令执行的结果,提示用户。
当用户说出专有词汇时,语音设备可被激活,说出非专有词汇时,语音设备保持唤醒等待,避免用户正常的人际之间的语音交流误触发语音。但是在实际场景中仍然存在语音设备被非专有词汇、甚至被环境噪音唤醒激活的情况,行业内称该类唤醒为误唤醒,概率指标一般在1-3次/72小时不等。误触发会打扰到用户,拉低用户体验。
随着语音识别的广泛应用,越来越多家用电器装配了语音识别系统,各自独立的提供语音人机交互功能。当同一用户家庭中有多个语音设备时,特别是同一房间内有数个体语音设备时,考虑到单个语音设备的独立误唤醒概率,该房间内的语音设备整体误唤醒概率将成倍增加。
发明内容
本说明书一个或多个实施例描述了一种语音唤醒处理方法及装置。
第一方面,本说明书提供了一种语音唤醒处理方法,所述方法由决策设备执行,所述方法包括:
在接收到一个语音设备发送来的唤醒请求时,判断该语音设备所在的房间内是否存在其它语音设备;其中,一个处于唤醒等待状态的语音设备监听到唤醒词后向所述决策设备发送唤醒请求,所述决策设备为一个家庭内的一个语音设备,一个家庭内的各个语音设备具有相同的唤醒词;
若存在其它语音设备,则开始计时,在计时时长达到预设时长后判断在计时过程中是否接收到其它语音设备发送来的唤醒请求;
若在计时过程中接收到其它语音设备发送来的唤醒请求,则获取每一个发送唤醒请求的语音设备的拾音参数;
根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,并向所述目标语音设备发送唤醒应答指令,以使所述目标语音设备从唤醒等待状态进入唤醒状态。
第二方面,本说明书提供了一种语音唤醒处理装置,所述装置安装在决策设备上,所述装置包括:
第一判断模块,用于在接收到一个语音设备发送来的唤醒请求时,判断该语音设备所在的房间内是否存在其它语音设备;其中,一个处于唤醒等待状态的语音设备监听到唤醒词后向所述决策设备发送唤醒请求,所述决策设备为一个家庭内的一个语音设备,一个家庭内的各个语音设备具有相同的唤醒词;
第二判断模块,用于若存在其它语音设备,则开始计时,在计时时长达到预设时长后判断在计时过程中是否接收到其它语音设备发送来的唤醒请求;
第一获取模块,用于若在计时过程中接收到其它语音设备发送来的唤醒请求,则获取每一个发送唤醒请求的语音设备的拾音参数;
目标确定模块,用于根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,并向所述目标语音设备发送唤醒应答指令,以使所述目标语音设备从唤醒等待状态进入唤醒状态。
本说明书实施例提供的语音唤醒处理方法及装置,在接收到一个语音设备发送来的唤醒请求时,决策设备会判断发送唤醒请求的语音设备所在的房间内是否还存在其它的语音设备,如果存在其它的语音设备,则开始计时,在计时结束后判断在计时过程中是否接收到其它语音设备的唤醒请求,如果接收到其它语音设备的唤醒请求,则根据各个发出唤醒请求的语音设备的拾音参数确定目标语音设备,进而向目标语音设备发送唤醒应答指令,这样目标语音设备就会从唤醒等待状态进入到唤醒状态。这个过程用户是感知不到的,不会影响语音设备原本的工作模式,而且在房间内有多个语音设备时还通过本发明实施例提供的方法,将单一语音设备被误触发的异常状态排除掉,降低家庭内全部语音设备的整体误唤醒的概率。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书一个实施例中语音唤醒处理方法的流程示意图;
图2是本说明书一个实施例中四个语音设备接入同一个网络的示意图;
图3是本说明书一个实施例中四个语音设备的房间分配的示意图;
图4是本说明书一个实施例中语音唤醒处理方法的流程示意图;
图5是本说明书一个实施例中语音唤醒处理装置的结构框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
第一方面,本发明提供一种语音唤醒处理方法,所述方法由决策设备执行,参见图1,所述方法包括如下步骤S10~S40:
S10、在接收到一个语音设备发送来的唤醒请求时,判断该语音设备所在的房间内是否存在其它语音设备;
其中,一个处于唤醒等待状态的语音设备监听到唤醒词后向所述决策设备发送唤醒请求,所述决策设备为一个家庭内的一个语音设备,一个家庭内的各个语音设备具有相同的唤醒词。
可理解的是,本发明实施例提供的方法由决策设备执行,而决策设备是一个家庭内的各个语音设备中的一个,因此在执行本发明实施例提供的方法之前,需要先确定出执行设备。
在一个家庭内会有多个语音设备,例如,智能语音冰箱、语音音箱、语音空调、语音电视等。在一个家庭内的各个语音设备的唤醒词都是一样的,也就是说,一个家庭内的各个语音设备都是基于同一个唤醒词进行训练的。而且,在移动终端上可以通过一个应用程序对这个家庭内的各个语音设备进行控制,该应用程序就是下文中提到的预设应用程序。决策设备的确定可以由这个预设应用程序实现。
也就是说,各个语音设备均由所在家庭的用户移动终端上的同一个预设应用程序控制;所述决策设备由所述预设应用程序预先确定;其中,所述预设应用程序确定所述决策设备的过程包括如下步骤S01~S04:
S01、获取接入家庭网络的各个语音设备;
可理解的是,当每一个语音设备接入家庭网络时,在预设应用程序上就会看到这个语音设备的相关信息,例如,设备标识、设备类型、设备名称等。因此预设应用程序可以获得各个接入家庭网络的语音设备的相关信息所形成的设备列表。
S02、获取加入所述家庭网络的每一个语音设备的带电状态数据、运算能力数据和用户使用习惯数据;
可理解的是,在语音设备运行一段时间后,会产生很多数据,例如,用户对语音设备的使用习惯数据、语音设备的带电状态数据,这些数据会记录在语音设备内部的存储器中。预设应用程序会从每一个语音设备中获取到这些数据。同时,预设应用程序还会获取每一个语音设备的运算能力数据。
其中,用户对语音设备的使用习惯数据,例如,用户习惯在一天的哪个时间段看电视、用户习惯在哪个季节打开空调等。语音设备的带电状态数据是指语音设备是否一直带电,还是在一天中的某个时间段带电,还是很少带电等。语音设备的运算能力数据是指能够体现语音设备的运算速度、运算量的数据,因为决策设备在实现自身功能的同时还需要进行唤醒的决策处理,因此这里需要考虑到语音设备的运算能力。
S03、根据每一个语音设备的带电状态数据、运算能力数据和用户使用习惯数据,确定每一个语音设备的决策能力评分;
可理解的是,在计算每一个语音设备的决策能力评分时,不仅需要考虑用户的使用习惯、带电状态,还考虑语音设备的运算能力,即不仅考虑语音设备的外部因素,也考虑语音设备的内部因素,最后可以计算出一个体现语音设备的综合决策能力的评分。
在具体实施时,S03中具体可以采用第一计算式计算每一个语音设备的决策能力评分,所述第一计算式包括:
P1=u*(d2-1/y)
式中,P1为所述决策能力评分;d为语音设备在过去一个月内的平均每天带电时长;y为语音设备的CPU运算能力;u为家庭用户在当前季节对语音设备的使用标记;若家庭用户在当前季节使用该语音设备,则该语音设备对应的使用标记为1;若家庭用户在当前季节不适用该语音设备,则该语音设备对应的使用标记为0。
在上述第一计算式中,u为用户的使用习惯数据。如果家庭用户在当前季节不使用该语音设备,则该语音设备对应的使用标记为0,此时P1为0。而如果家庭用户在当前季节中使用该语音设备,则该语音设备对应的使用标记为1,此时P1=d2-1/y。例如,针对语音空调这一语音设备,有的家庭在冬天时不使用,只有在夏天的时候才使用。
其中,d为语音设备在过去一个月内的平均每天带电时长,该参数既考虑了用户在最近一段时间内的使用情况,也反映了在每一天的平均带电情况。例如,用户在过去一个月内只在晚上才打开语音电视,这样语音电视在过去一个月内的平均带电时长只有几个小时。而语音冰箱一直处于带电状态,此时语音冰箱的在过去一个月内的平均每天带电时长为24小时。参数d是一个关键的参数,语音设备的带电时长越长,语音设备能够进行唤醒决策处理的时间越多,可以减少遗漏唤醒请求的情况发生。d越大,P1越大。
其中,y体现的是语音设备的运算能力,例如,cpu的运算能力。不同的cpu的运算能力的计算方式不同,例如,有的cpu通过字长衡量运算能力,有的cpu通过双精度浮点运算能力来衡量运算能力,具体可以根据cpu的实际情况而确定。y越大,P1越大,但y和P1之间并不是正比的关系。
可见,上述第一计算式可以非常合理的反映出一个语音设备的决策能力。
S04、将所述决策能力评分最高的语音设备作为所述决策设备。
也就是说,在S03中,计算出每一个接入家庭网络的语音设备的决策能力评分,然后选择出决策能力评分最高的语音设备作为决策设备。
在具体实施时,在通过上述方式确定出一个决策设备之后,可以采用该决策设备执行本发明实施例提供的方法。但是如果决策设备掉电,则需要更换其它的语音设备作为决策设备。当然,也可能存在之前确定出的决策设备不带电的情况,此时也需要更换其它的语音设备作为决策设备。
由于在实际场景中可能发生以上情况时,因此所述预设应用程序确定所述决策设备的过程还可以包括:所述预设应用程序通过心跳指令的方式按照预设时间间隔检测当前的决策设备是否处于带电状态;若未处于带电状态,则选择处于带电状态的各个语音设备中决策能力评分最高的一个语音设备作为当前的决策设备。
也就是说,移动终端上的预设应用程序会按照时间间隔检测当前的决策设备是否带电,具体通过心跳指令的方式检测,例如,移动终端上的预设应用程序会每间隔一段时间就向决策设备发送一个心跳指令,如果移动终端能够接收到决策设备的反馈信息,则说明此时决策设备此时带电,如果不能接收到决策设备的反馈信息,说明此时决策设备不带电。
如果移动终端上的预设应用程序经过检测发现当前的决策设备不带电,需要更换其它的语音设备,此时会在各个带电的语音设备中选择出决策能力评分最高的语音设备作为当前的决策设备,这样可以避免因为决策设备不带电而影响唤醒处理。
当然,移动终端上的预设应用程序除了可以自动确定决策设备之外,用户也可以在预设应用程序上对每一个语音设备所在的房间进行标记,即为每一个语音设备设置对应的房间标识。
也就是说,所述预设应用程序可以用于提供配置界面,以使用户对接入家庭网络的每一个语音设备配置对应的房间标识;对应的,S10中所述判断该语音设备所在的房间内是否存在其它语音设备,包括:从所述预设应用程序中获取该语音设备对应的房间标识,将该房间标识作为第一房间标识;判断其它语音设备的房间标识中是否存在与所述第一房间标识相同的房间标识;若存在,则该语音设备所在的房间内存在其它语音设备;否则,该语音设备所在的房间内不存在其它语音设备。
可理解的是,用户可以在预设应用程序的配置界面上对每一个语音设备设置对应的房间标识,这样预设应用程序就可以知道每一个房间内都有哪些语音设备。进一步的,当决策设备判断该语音设备所在的房间内是否存在其它语音设备时,会从移动终端的预设应用程序上获取发送唤醒请求的这个语音设备对应的房间标识即第一房间标识,进而判断其它的语音设备的房间标识中是否存在与第一房间标识相同的房间标识,进而判断出在发送唤醒请求的语音设备所在的房间中是否还存在其它的语音设备。
在实际场景中,如果用户发出了唤醒词,在一个房间内的处于唤醒等待状态的语音设备监听到这个唤醒词之后,会向决策设备发送唤醒请求,进而决策设备判断该语音设备所在的房间内是否还存在其它的语音设备,进而执行后续的步骤。
可理解的是,如果发出唤醒请求的语音设备是决策设备本身,处理方法也是类似的。
S20、若存在其它语音设备,则开始计时,在计时时长达到预设时长后判断在计时过程中是否接收到其它语音设备发送来的唤醒请求;
可理解的是,由于各个语音设备的唤醒词都是一样的,而如果在一个房间内除了发出唤醒请求的预设设备之外,还存在其它语音设备,此时决策设备就会开始计时,当计时时长达到预设时长后停止计时,在计时的过程中有可能会接收到其它语音设备发送来的唤醒请求,也有可能没有接收到其它语音设备发送来的唤醒请求。
S30、若在计时过程中接收到其它语音设备发送来的唤醒请求,则获取每一个发送唤醒请求的语音设备的拾音参数;
可理解的是,如果接收到其它语音设备发送来的唤醒请求时,说明不止一个语音设备针对用户发生的语音做出了反映,此时是误唤醒的可能性会比较小,因此此时需要在各个发出唤醒请求的语音设备中选择一个概率最高的唤醒对象。而如果在计时过程中没有接收到其它语音设备的唤醒请求,则发出唤醒请求的语音设备被误唤醒的可能性是很大。
如果在计时过程中,接收到了其它语音设备发送来的唤醒请求,此时可以获取每一个发送唤醒请求的拾音参数,进而利用拾音参数进行下一步的计算。所谓的拾音参数是指语音设备所采集用户发出的语音时的一些参数。
S40、根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,并向所述目标语音设备发送唤醒应答指令,以使所述目标语音设备从唤醒等待状态进入唤醒状态。
其中,所述拾音参数可以包括拾音角度和拾音声强,如果用户会对着想要唤醒的语音设备发出语音,此时的拾音角度为90°,但是用户没有对着想要唤醒的语音设备发出语音,此时的拾音角度不是90°,可见拾音角度反映的是用户发出语音时语音设备的声音拾取角度。拾音声强是指语音设备所拾取的声音的强度。
基于上述拾音参数,S40中根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,具体过程可以包括如下步骤S41~S43:
S41、针对发送唤醒请求的各个语音设备,判断拾音角度在60~120度范围内的语音设备的数量是否大于1;
其中,60~120度是一个较佳的拾音角度,该拾音角度在60~120度时语音设备是目标语音设备的可能性是很大的。
可理解的是,在该步骤中首先确定出拾音角度在60~120度范围内的语音设备的数量,如果该数量大于1,则需要在这些拾音角度在60~120度范围内的各个语音设备中进一步筛选。
S42、若拾音角度在60~120度范围内的语音设备的数量大于1,则根据每一个拾音角度在60~120度范围内的语音设备的拾音角度和拾音声强,计算该语音设备对应的唤醒评分;一个语音设备的唤醒评分用于表征用户唤醒该语音设备的概率;
在该步骤中,针对拾音角度在60~120度范围内的各个语音设备,根据语音设备的拾音角度和拾音声强,计算每一个语音设备的唤醒评分,从而得知用户想要唤醒该语音设备的概率是多少。
进一步的,该步骤S42中可以采用第二计算式计算该语音设备对应的唤醒评分,所述第二计算式包括:
当r在第一范围内时,P2=a*s+b/|r-90|
当r在第二范围内时,P2=b*s-a*|r-90|+c
式中,P2为所述唤醒评分,s为所述拾音声强,r为所述拾音角度,所述第一范围为:r大于等于60且小于80,或者,r大于100且小于等于120;所述第二范围为:r大于等于80且小于等于100;a和b为预设权重,且a大于b,c为10*a+b/10。
其中,当r在第一范围内时,拾音强度越大,P2越大;拾音角度越接近90,P2越大,所以拾音强度高且拾音角度接近90的语音设备的唤醒评分是比较高的。而且,当r在第一范围内时,拾音声强的权重为a,而a大于b,说明此时更为关注拾音声强,也就是说,在这种情况下拾音声强更为重要。
其中,当r在第二范围内时,拾音强度越大,P2越大,拾音角度越接近,P2越大,所以拾音强度高且拾音角度接近90的语音设备的唤醒评分是比较高的。当r在第二范围内时,拾音角度的权重为a,而a大于b,说明此时更为关注拾音角度,也就是说,在这种情况下,拾音角度跟为重要。
进一步的,当拾音声强相同,而r在第二范围时的唤醒评分应大于r在第一范围内的唤醒评分,为保证此要求,本发明实施例中当r在第二范围内时的计算式中增加了参数c,且令c为10*a+b/10,该值可以保证在拾音声强相同的情况下r在第二范围时的唤醒评分大于r在第一范围内的唤醒评分。
其中,c=30*a+b/30是当r为100时、拾音声强为0时,为保证b*s-a*|r-90|+c大于等于a*s+b/|r-90|而计算得到。在该c值的基础上,当r处于第二范围内的任一值时,都能保证在拾音声强相同的情况下r在第二范围时的唤醒评分大于r在第一范围内的唤醒评分。
S43、将唤醒评分最高的语音设备作为目标语音设备。
可理解的是,一个语音设备的唤醒评分越高,说明用户想要唤醒这个语音设备的概率越大,如果一个语音设备的唤醒评分越低,说明用户想要唤醒这个语音设备的概率越低。因此这里将唤醒评分最高的语音设备作为目标语音设备。
在具体实施时,S40中根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,具体过程还可以包括如下至少一项:
(1)若所述拾音角度在60~120度范围的语音设备的数量为1,则将所述拾音角度在60~120度范围的语音设备作为目标语音设备;
可理解的是,如果拾音角度在60~120度范围内的语音设备的数量只有一个,则这一个语音设备是用户想要唤醒的语音设备的概率是最大的,在这种情况下不需要考虑语音设备的拾音声强,因此此时将这一个语音设备作为目标语音设备。
(2)若所述拾音角度在60~120度范围的语音设备的数量为0,则将所述拾音声强最高的语音设备作为目标语音设备。
可理解的是,如果拾音角度在60~120度范围的语音设备的数量为0,说明用户没有对着任何一个语音设备发出语音,此时不需要考虑拾音角度,此时可以在发出唤醒请求的各个语音设备中选择拾音声强最大的语音设备作为目标语音设备。
可见,在不同的情况下可以依照上述过程确定目标语音设备。
可理解的是,以上均是在计时过程中还接收到其它语音设备发送来的唤醒请求时的处理方法。在实际中如果在计时过程中没有接收到其它语音设备发送来的唤醒请求的话,可以认为发送唤醒请求的语音设备为误触发,此时决策设备可以向发出唤醒请求的语音设备发送终止唤醒应答指令,接收到终止唤醒应答指令的语音设备不会从唤醒等待状态进入唤醒状态,而是继续保持唤醒等待状态。
可理解的是,以上均是针对在发出唤醒请求的语音设备所在的房间还存在其它语音设备的情况。而当发出唤醒请求的语音设备所在房间内没有其它语音设备时,本发明实施例提供的方法还可以包括如下步骤:向发送唤醒请求的语音设备发送唤醒应答指令,以使语音设备进入唤醒状态。
也就是说,在一个房间内只有一个语音设备,而该语音设备向决策设备发出了唤醒请求,此时决策设备认为用户就是想要唤醒这个语音设备,因此决策设备会向该设备发出唤醒应答指令,接收到该指令的语音设备会从唤醒等待状态进入唤醒状态。
可理解的是,本发明实施例中的决策设备可以和发出唤醒请求的语音设备在一个房间内,也可以不和发出唤醒请求的语音设备在一个房间内。
可理解的是,本发明实施例中的各个语音设备接入同一个网络中,例如,通过以太网、蓝牙、WIFI等方式接入同一个家庭网络中。这样各个语音设备可以相互进行通信,传递数据,
举例来说,参见图2,在一个家庭内有语音设备A、语音设备B、语音设备C、语音设备D,语音设备A、语音设备B采用WIFI网络技术,语音设备C采用有线以太网技术,语音设备D采用蓝牙通信技术,均接入家庭网络设备中,并选定了语音设备A为决策设备。
用户在其手机的应用程序中标记了每一个语音设备的房间标识,例如,参见图3,通过APP软件将语音设备A、语音设备B、语音设备C分配在房间A中,将语音设备D分配在房间B中,将房间A和房间B的设备列表及设备ID信息下发至语音设备A。
参见图4,当语音设备B被用户的语音触发,需要唤醒时,首先通过语音设备B网络向决策设备即语音设备A发起唤醒请求,决策设备检查到语音设备B的房间A分组内还有语音设备A和语音设备C,则进入计时等待,计时结束后判断语音设备A和语音设备C是否也发起了唤醒请求。经过判断本次只有语音设备B提交了唤醒请求,所以本次判断为误唤醒,决策设备即向语音设备B发出终止应答指令。
以上流程判断过程中,用户均不会感知,有效降低因多语音设备的误唤醒带来的影响。
可见,本发明实施例提供的方法是针对在一个家庭内存在多个语音设备的情况下误触发的概率成倍增加的问题,提出的一种支持协同纠错的语音唤醒方案,在该方案中需要先进行设备入网、选出决策设备、标记房间,进而再执行本发明实施例提供的上述步骤S1~S4。
可理解的是,本发明实施例提供的语音唤醒处理方法,在接收到一个语音设备发送来的唤醒请求时,决策设备会判断发送唤醒请求的语音设备所在的房间内是否还存在其它的语音设备,如果存在其它的语音设备,则开始计时,在计时结束后判断在计时过程中是否接收到其它语音设备的唤醒请求,如果接收到其它语音设备的唤醒请求,则根据各个发出唤醒请求的语音设备的拾音参数确定目标语音设备,进而向目标语音设备发送唤醒应答指令,这样目标语音设备就会从唤醒等待状态进入到唤醒状态。这个过程用户是感知不到的,不会影响语音设备原本的工作模式,而且在房间内有多个语音设备时还通过本发明实施例提供的方法,嫁给你单一语音设备被误触发的异常状态排除掉,降低家庭内全部语音设备的整体误唤醒的概率。
第二方面,本发明实施例提供一种语音唤醒处理装置,所述装置安装在决策设备上,参见图5,所述装置包括:
第一判断模块,用于在接收到一个语音设备发送来的唤醒请求时,判断该语音设备所在的房间内是否存在其它语音设备;其中,一个处于唤醒等待状态的语音设备监听到唤醒词后向所述决策设备发送唤醒请求,所述决策设备为一个家庭内的一个语音设备,一个家庭内的各个语音设备具有相同的唤醒词;
第二判断模块,用于若存在其它语音设备,则开始计时,在计时时长达到预设时长后判断在计时过程中是否接收到其它语音设备发送来的唤醒请求;
第一获取模块,用于若在计时过程中接收到其它语音设备发送来的唤醒请求,则获取每一个发送唤醒请求的语音设备的拾音参数;
目标确定模块,用于根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,并向所述目标语音设备发送唤醒应答指令,以使所述目标语音设备从唤醒等待状态进入唤醒状态。
在一个实施例中,各个语音设备均由所在家庭的用户移动终端上的同一个预设应用程序控制;所述决策设备由所述预设应用程序预先确定;其中,所述预设应用程序确定所述决策设备的过程包括:
获取接入家庭网络的各个语音设备;
获取加入所述家庭网络的每一个语音设备的带电状态数据、运算能力数据和用户使用习惯数据;
根据每一个语音设备的带电状态数据、运算能力数据和用户使用习惯数据,确定每一个语音设备的决策能力评分;
将所述决策能力评分最高的语音设备作为所述决策设备。
进一步的,所述根据每一个语音设备的带电状态数据、运算能力数据和用户使用习惯数据,确定每一个语音设备的决策能力评分,包括:采用第一计算式计算每一个语音设备的决策能力评分,所述第一计算式包括:
P1=u*(d2-1/y)
式中,P1为所述决策能力评分;d为语音设备在过去一个月内的平均每天带电时长;y为语音设备的CPU运算能力;u为家庭用户在当前季节对语音设备的使用标记;若家庭用户在当前季节使用该语音设备,则该语音设备对应的使用标记为1;若家庭用户在当前季节不适用该语音设备,则该语音设备对应的使用标记为0。
进一步的,所述预设应用程序确定所述决策设备的过程还包括:
所述预设应用程序通过心跳指令的方式按照预设时间间隔检测当前的决策设备是否处于带电状态;若未处于带电状态,则选择处于带电状态的各个语音设备中决策能力评分最高的一个语音设备作为当前的决策设备。
进一步的,所述预设应用程序用于提供配置界面,以使用户对接入家庭网络的每一个语音设备配置对应的房间标识;
对应的,所述判断该语音设备所在的房间内是否存在其它语音设备,包括:从所述预设应用程序中获取该语音设备对应的房间标识,将该房间标识作为第一房间标识;判断其它语音设备的房间标识中是否存在与所述第一房间标识相同的房间标识;若存在,则该语音设备所在的房间内存在其它语音设备;否则,该语音设备所在的房间内不存在其它语音设备。
在一个实施例中,所述拾音参数包括拾音角度和拾音声强;对应的,所述根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,包括:
针对发送唤醒请求的各个语音设备,判断拾音角度在60~120度范围内的语音设备的数量是否大于1;
若拾音角度在60~120度范围内的语音设备的数量大于1,则根据每一个拾音角度在60~120度范围内的语音设备的拾音角度和拾音声强,计算该语音设备对应的唤醒评分;一个语音设备的唤醒评分用于表征用户唤醒该语音设备的概率;
将唤醒评分最高的语音设备作为目标语音设备。
进一步的,所述计算该语音设备对应的唤醒评分,包括:采用第二计算式计算该语音设备对应的唤醒评分,所述第二计算式包括:
当r在第一范围内时,P2=a*s+b/|r-90|
当r在第二范围内时,P2=b*s-a*|r-90|+c
式中,P2为所述唤醒评分;s为所述拾音声强;r为所述拾音角度;所述第一范围为:r大于等于60且小于80,或者,r大于100且小于等于120;所述第二范围为:r大于等于80且小于等于100;a和b为预设权重,且a大于b,c为30*a+b/30。
进一步的,所述根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,还包括如下至少一项:
若所述拾音角度在60~120度范围的语音设备的数量为1,则将所述拾音角度在60~120度范围的语音设备作为目标语音设备;
若所述拾音角度在60~120度范围的语音设备的数量为0,则将所述拾音声强最高的语音设备作为目标语音设备。
在一个实施例中,所述方法还包括如下至少一项:
若发送唤醒请求的语音设备所在的房间内不存在其它语音设备,则向发送唤醒请求的语音设备发送唤醒应答指令,以使语音设备进入唤醒状态;
若在计时过程中没有接收到其它语音设备发送来的唤醒请求,则确定发送唤醒请求的语音设备为误触发,则向发送唤醒请求的语音设备发送终止唤醒应答指令,以使发送唤醒请求的语音设备继续保持在唤醒等待状态。
可理解的是,第二方面提供的装置和第一方面提供的方法是对应的,本方面中有关内容的解释、举例、有益效果等内容可以参见第一方面中的有关内容,此处不再赘述。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、挂件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (10)

1.一种语音唤醒处理方法,其特征在于,所述方法由决策设备执行,所述方法包括:
在接收到一个语音设备发送来的唤醒请求时,判断该语音设备所在的房间内是否存在其它语音设备;其中,一个处于唤醒等待状态的语音设备监听到唤醒词后向所述决策设备发送唤醒请求,所述决策设备为一个家庭内的一个语音设备,一个家庭内的各个语音设备具有相同的唤醒词;
若存在其它语音设备,则开始计时,在计时时长达到预设时长后判断在计时过程中是否接收到其它语音设备发送来的唤醒请求;
若在计时过程中接收到其它语音设备发送来的唤醒请求,则获取每一个发送唤醒请求的语音设备的拾音参数;
根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,并向所述目标语音设备发送唤醒应答指令,以使所述目标语音设备从唤醒等待状态进入唤醒状态。
2.根据权利要求1所述的方法,其特征在于,各个语音设备均由所在家庭的用户移动终端上的同一个预设应用程序控制;所述决策设备由所述预设应用程序预先确定;其中,所述预设应用程序确定所述决策设备的过程包括:
获取接入家庭网络的各个语音设备;
获取加入所述家庭网络的每一个语音设备的带电状态数据、运算能力数据和用户使用习惯数据;
根据每一个语音设备的带电状态数据、运算能力数据和用户使用习惯数据,确定每一个语音设备的决策能力评分;
将所述决策能力评分最高的语音设备作为所述决策设备。
3.根据权利要求2所述的方法,其特征在于,所述根据每一个语音设备的带电状态数据、运算能力数据和用户使用习惯数据,确定每一个语音设备的决策能力评分,包括:采用第一计算式计算每一个语音设备的决策能力评分,所述第一计算式包括:
P1=u*(d2-1/y)
式中,P1为所述决策能力评分;d为语音设备在过去一个月内的平均每天带电时长;y为语音设备的CPU运算能力;u为家庭用户在当前季节对语音设备的使用标记;若家庭用户在当前季节使用该语音设备,则该语音设备对应的使用标记为1;若家庭用户在当前季节不适用该语音设备,则该语音设备对应的使用标记为0。
4.根据权利要求2所述的方法,其特征在于,所述预设应用程序确定所述决策设备的过程还包括:所述预设应用程序通过心跳指令的方式按照预设时间间隔检测当前的决策设备是否处于带电状态;若未处于带电状态,则选择处于带电状态的各个语音设备中决策能力评分最高的一个语音设备作为当前的决策设备。
5.根据权利要求2所述的方法,其特征在于,所述预设应用程序用于提供配置界面,以使用户对接入家庭网络的每一个语音设备配置对应的房间标识;对应的,所述判断该语音设备所在的房间内是否存在其它语音设备,包括:从所述预设应用程序中获取该语音设备对应的房间标识,将该房间标识作为第一房间标识;判断其它语音设备的房间标识中是否存在与所述第一房间标识相同的房间标识;若存在,则该语音设备所在的房间内存在其它语音设备;否则,该语音设备所在的房间内不存在其它语音设备。
6.根据权利要求1所述的方法,其特征在于,所述拾音参数包括拾音角度和拾音声强;对应的,所述根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,包括:
针对发送唤醒请求的各个语音设备,判断拾音角度在60~120度范围内的语音设备的数量是否大于1;
若拾音角度在60~120度范围内的语音设备的数量大于1,则根据每一个拾音角度在60~120度范围内的语音设备的拾音角度和拾音声强,计算该语音设备对应的唤醒评分;一个语音设备的唤醒评分用于表征用户唤醒该语音设备的概率;
将唤醒评分最高的语音设备作为目标语音设备。
7.根据权利要求6所述的方法,其特征在于,所述计算该语音设备对应的唤醒评分,包括:采用第二计算式计算该语音设备对应的唤醒评分,所述第二计算式包括:
当r在第一范围内时,P2=a*s+b/|r-90|
当r在第二范围内时,P2=b*s-a*|r-90|+c
式中,P2为所述唤醒评分;s为所述拾音声强;r为所述拾音角度;所述第一范围为:r大于等于60且小于80,或者,r大于100且小于等于120;所述第二范围为:r大于等于80且小于等于100;a和b为预设权重,且a大于b,c为10*a+b/10。
8.根据权利要求6所述的方法,其特征在于,所述根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,还包括如下至少一项:
若所述拾音角度在60~120度范围的语音设备的数量为1,则将所述拾音角度在60~120度范围的语音设备作为目标语音设备;
若所述拾音角度在60~120度范围的语音设备的数量为0,则将所述拾音声强最高的语音设备作为目标语音设备。
9.根据权利要求1~8任一项所述的方法,其特征在于,所述方法还包括如下至少一项:
若发送唤醒请求的语音设备所在的房间内不存在其它语音设备,则向发送唤醒请求的语音设备发送唤醒应答指令,以使语音设备进入唤醒状态;
若在计时过程中没有接收到其它语音设备发送来的唤醒请求,则确定发送唤醒请求的语音设备为误触发,则向发送唤醒请求的语音设备发送终止唤醒应答指令,以使发送唤醒请求的语音设备继续保持在唤醒等待状态。
10.一种语音唤醒处理装置,其特征在于,所述装置安装在决策设备上,所述装置包括:
第一判断模块,用于在接收到一个语音设备发送来的唤醒请求时,判断该语音设备所在的房间内是否存在其它语音设备;其中,一个处于唤醒等待状态的语音设备监听到唤醒词后向所述决策设备发送唤醒请求,所述决策设备为一个家庭内的一个语音设备,一个家庭内的各个语音设备具有相同的唤醒词;
第二判断模块,用于若存在其它语音设备,则开始计时,在计时时长达到预设时长后判断在计时过程中是否接收到其它语音设备发送来的唤醒请求;
第一获取模块,用于若在计时过程中接收到其它语音设备发送来的唤醒请求,则获取每一个发送唤醒请求的语音设备的拾音参数;
目标确定模块,用于根据发送唤醒请求的各个语音设备各自的拾音参数,确定目标语音设备,并向所述目标语音设备发送唤醒应答指令,以使所述目标语音设备从唤醒等待状态进入唤醒状态。
CN202210606298.5A 2022-05-31 2022-05-31 语音唤醒处理方法及装置 Pending CN114999483A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210606298.5A CN114999483A (zh) 2022-05-31 2022-05-31 语音唤醒处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210606298.5A CN114999483A (zh) 2022-05-31 2022-05-31 语音唤醒处理方法及装置

Publications (1)

Publication Number Publication Date
CN114999483A true CN114999483A (zh) 2022-09-02

Family

ID=83031208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210606298.5A Pending CN114999483A (zh) 2022-05-31 2022-05-31 语音唤醒处理方法及装置

Country Status (1)

Country Link
CN (1) CN114999483A (zh)

Similar Documents

Publication Publication Date Title
CN109671426B (zh) 一种语音控制方法、装置、存储介质及空调
CN109947497A (zh) 应用程序预加载方法、装置、存储介质及移动终端
CN112420041B (zh) 智能设备唤醒阈值的控制方法、装置、智能设备及存储介质
CN109637531B (zh) 一种语音控制方法、装置、存储介质及空调
CN106528290A (zh) 移动终端的资源调度方法及移动终端
CN112311635B (zh) 语音打断唤醒方法、装置及计算机可读存储介质
CN113096658A (zh) 一种终端设备及其唤醒方法、装置和计算机可读存储介质
WO2021204027A1 (zh) 麦克风阵列控制方法、装置、电子设备及计算机存储介质
WO2020078206A1 (zh) 任务调度方法、装置、终端及存储介质
CN111261160B (zh) 一种信号处理方法及装置
WO2019227370A1 (zh) 一种多语音助手控制方法、装置、系统及计算机可读存储介质
WO2023231894A1 (zh) 基于协同纠错的唤醒方法、装置及系统、介质、设备
CN107257408B (zh) 主屏页面显示方法、终端及计算机可读存储介质
CN112585675A (zh) 选择地使用多个语音数据接收装置进行智能服务的方法、装置和系统
CN111624891A (zh) 一种应用于可穿戴设备的控制方法、装置及可穿戴设备
CN114999483A (zh) 语音唤醒处理方法及装置
CN111475212B (zh) 一种设备驱动方法及装置
CN109147783B (zh) 基于k歌系统的语音识别方法、介质及系统
CN105682115A (zh) 信息处理方法及电子设备
WO2023246036A1 (zh) 语音识别设备的控制方法、装置、电子设备及存储介质
CN113129878A (zh) 声控方法及终端装置
CN114999484A (zh) 交互语音设备的选举方法及系统
CN108663942B (zh) 一种语音识别设备控制方法、语音识别设备和中控服务器
CN113190121A (zh) 按键控制方法、系统及设备、计算机可读存储介质
CN111105794B (zh) 设备的语音识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230918

Address after: 621050 No. 303 Jiuzhou Road, Fucheng District, Mianyang, Sichuan.

Applicant after: SICHUAN HONGMEI INTELLIGENT TECHNOLOGY Co.,Ltd.

Applicant after: Hefei Meiling Union Technology Co.,Ltd.

Address before: 621050 No. 303 Jiuzhou Road, Fucheng District, Mianyang, Sichuan.

Applicant before: SICHUAN HONGMEI INTELLIGENT TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right