CN117198285A - 设备唤醒方法、装置、设备、介质及车辆 - Google Patents

设备唤醒方法、装置、设备、介质及车辆 Download PDF

Info

Publication number
CN117198285A
CN117198285A CN202210622109.3A CN202210622109A CN117198285A CN 117198285 A CN117198285 A CN 117198285A CN 202210622109 A CN202210622109 A CN 202210622109A CN 117198285 A CN117198285 A CN 117198285A
Authority
CN
China
Prior art keywords
wake
voice information
voice
word
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210622109.3A
Other languages
English (en)
Inventor
邹勇
周盼
陈伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Co Wheels Technology Co Ltd
Original Assignee
Beijing Co Wheels Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Co Wheels Technology Co Ltd filed Critical Beijing Co Wheels Technology Co Ltd
Priority to CN202210622109.3A priority Critical patent/CN117198285A/zh
Publication of CN117198285A publication Critical patent/CN117198285A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本公开涉及一种设备唤醒方法、装置、设备、介质及车辆。其中,设备唤醒方法包括:如果在休眠状态下接收到语音信息,获取所述语音信息对应的文本内容以及所述语音信息对应的声纹特征;根据所述语音信息对应的文本内容、所述语音信息对应的声纹特征以及预设的至少一种关联关系,判别所述语音信息是否对应预设唤醒指令;其中,所述关联关系包括用户预设的唤醒词和所述用户的声纹特征的关联关系;在所述语音信息对应预设唤醒指令的情况下,执行与所述预设唤醒指令对应的设备唤醒操作。本公开技术方案能够有效提升设备唤醒的安全性和可靠性,并且可以较好满足用户的个性化唤醒需求,可有效提升用户的设备唤醒体验。

Description

设备唤醒方法、装置、设备、介质及车辆
技术领域
本公开涉及设备控制技术领域,尤其涉及一种设备唤醒方法、装置、设备、介质及车辆。
背景技术
现有诸如手机、车载系统、机器人等电子设备均已广泛应用于人们的日常生活中。出于节电等目的,电子设备在一段时间内不使用或者在用户的设置下可处于休眠状态,在用户唤醒后再进入正常运行状态。现有的唤醒方式大多采用统一的唤醒指令或者唤醒按键,不仅安全性较差,而且难以满足个性化的用户需求,用户体验不佳。
发明内容
为了改善或解决上述技术问题至少之一,本公开提供了一种设备唤醒方法、装置、设备、介质及车辆。
本公开提供了一种设备唤醒方法,应用于电子设备,包括:
如果在休眠状态下接收到语音信息,获取所述语音信息对应的文本内容以及所述语音信息对应的声纹特征;
根据所述语音信息对应的文本内容、所述语音信息对应的声纹特征以及预设的至少一种关联关系,判别所述语音信息是否对应预设唤醒指令;其中,所述关联关系包括用户预设的唤醒词和所述用户的声纹特征的关联关系;
在所述语音信息对应预设唤醒指令的情况下,执行与所述预设唤醒指令对应的设备唤醒操作。
在一些实施例中,根据所述语音信息对应的文本内容、所述语音信息对应的声纹特征以及预设的至少一种关联关系,判别所述语音信息是否对应预设唤醒指令的步骤,包括:
判断所述语音信息对应的文本内容和所述语音信息对应的声纹特征是否属于所述预设的至少一种关联关系;
如果是,确定所述语音信息对应预设唤醒指令。
在一些实施例中,判断所述语音信息对应的文本内容和所述语音信息对应的声纹特征是否属于所述预设的至少一种关联关系的步骤,包括:
从所述预设的至少一种关联关系中查找是否存在包含有所述语音信息对应的文本内容的目标关联关系;
如果存在所述目标关联关系,判断所述语音信息对应的声纹特征是否与所述目标关联关系中的声纹特征匹配;
如果匹配,确定所述语音信息对应的文本内容和所述语音信息对应的声纹特征属于所述预设的至少一种关联关系。
在一些实施例中,判断所述语音信息对应的文本内容和所述语音信息对应的声纹特征是否属于所述预设的至少一种关联关系的步骤,包括:
从所述预设的至少一种关联关系中查找是否存在包含有所述语音信息对应的声纹特征的目标关联关系;
如果存在所述目标关联关系,判断所述语音信息对应的文本内容是否与所述目标关联关系中的唤醒词匹配;
如果匹配,确定所述语音信息对应的文本内容和所述语音信息对应的声纹特征属于所述预设的至少一种关联关系。
在一些实施例中,所述关联关系是按照如下步骤预设的:
响应于唤醒词注册指令,获取用户输入的语音唤醒词;
判别所述语音唤醒词的音频质量是否合格;
在所述语音唤醒词的音频质量合格的情况下,将所述语音唤醒词对应的文本识别结果作为所述用户预设的唤醒词,并获取所述用户的声纹特征;
针对所述用户预设的唤醒词和所述用户的声纹特征建立关联关系。
在一些实施例中,获取用户输入的语音唤醒词的步骤,包括:
发起用于引导用户语音输入唤醒词的提示,并接收用户输入的语音唤醒词。
在一些实施例中,判别所述语音唤醒词的音频质量是否合格的步骤,包括:
对所述语音唤醒词进行语音识别,得到所述语音唤醒词的文本识别结果;
向所述用户确认所述文本识别结果是否准确;
响应于所述用户的确认反馈,确定所述语音唤醒词的音频质量合格。
在一些实施例中,获取用户输入的语音唤醒词的步骤,包括:
发起用于引导用户文字输入唤醒词的提示,并接收用户输入的文字唤醒词;
发起用于引导用户语音录入所述文字唤醒词的提示,并接收所述用户输入的语音唤醒词。
在一些实施例中,判别所述语音唤醒词的音频质量是否合格的步骤,包括:
对所述语音唤醒词进行语音识别,得到所述语音唤醒词的文本识别结果;
判别所述语音唤醒词的文本识别结果和所述文字唤醒词是否一致;
如果一致,确定所述语音唤醒词的音频质量合格。
在一些实施例中,获取所述用户的声纹特征的步骤,包括:
对所述用户输入的语音唤醒词进行声纹识别,得到所述用户的声纹特征;
或者,
引导所述用户阅读指定语句,基于所述用户阅读所述指定语句所录入的音频进行声纹识别,得到所述用户的声纹特征。
在一些实施例中,所述方法还包括:
在所述语音唤醒词的音频质量不合格的情况下,提醒所述用户重新输入语音唤醒词。
在一些实施例中,执行与所述预设唤醒指令对应的设备唤醒操作的步骤,包括:
在所述语音信息对应的预设唤醒指令还用于指示执行指定操作的情况下,先后执行唤醒操作和所述指定操作;其中,所述指定操作为除唤醒操作之外的操作。
本公开还提供了一种设备唤醒装置,包括:
获取模块,用于如果在休眠状态下接收到语音信息,获取所述语音信息对应的文本内容以及所述语音信息对应的声纹特征;
判别模块,用于根据所述语音信息对应的文本内容、所述语音信息对应的声纹特征以及预设的至少一种关联关系,判别所述语音信息是否对应预设唤醒指令;其中,所述关联关系包括用户预设的唤醒词和所述用户的声纹特征的关联关系;
唤醒模块,用于在所述语音信息对应预设唤醒指令的情况下,执行与所述预设唤醒指令对应的设备唤醒操作。
本公开还提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序或指令;
所述处理器通过调用所述存储器存储的程序或指令,用于执行上述任一项设备唤醒方法的步骤。
本公开还提供了一种计算机可读存储介质,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行上述任一项设备唤醒方法的步骤。
本公开还提供了一种车辆,所述车辆上设置有处理器以及用于存储程序或指令的存储器,所述处理器通过调用所述存储器存储的程序或指令,用于执行上述任一项设备唤醒方法的步骤。
本公开实施例提供的技术方案,能够获取休眠状态下接收到的语音信息对应的文本内容及声纹特征,再结合预设的至少一种关联关系(用户预设的唤醒词和所述用户的声纹特征的关联关系)判别语音信息是否对应预设唤醒指令,只有在语音信息对应预设唤醒指令的情况下,才会执行与预设唤醒指令对应的设备唤醒操作。这种设备唤醒方式需要考虑语音对应的文本内容及声纹信息两方面因素,能够有效提升设备唤醒的安全性和可靠性,而且用户可以预先设置唤醒词与用户声纹特征的关联关系,能够较好满足用户的个性化唤醒需求,可有效提升用户的设备唤醒体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种设备唤醒方法的流程图;
图2为本公开实施例提供的一种关联关系的设置方法流程图;
图3为本公开实施例提供的一种设备唤醒装置的结构框图;
图4为本公开实施例提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
相关技术中仅通过统一的唤醒指令或者唤醒按键进行设备唤醒,安全性和可靠性均较差。诸如,可能出现人员B直接唤醒人员A的设备,给人员B的设备信息安全性带来不良影响,又诸如,可能出现人员A可能误触唤醒按键,导致设备在不需要的情况下被唤醒。另外,上述设备唤醒方式较为单一,所有用户都采用统一的唤醒指令或者按键进行设备唤醒,难以满足个性化需求,用户的设备唤醒体验也较差。为改善以上问题至少之一,本公开实施例提供了一种设备唤醒方法、装置、设备及介质,用户可以预先设置唤醒词与用户声纹特征的关联关系,在用户对处于休眠状态下的电子设备进行唤醒时可发起语音,电子设备可以基于用户语音对应的文本内容及声纹信息两方面因素以及预设的关联关系判别用户语音是否对应预设唤醒指令,在判别结果为是时才执行相应的设备唤醒操作,不仅能够有效提升设备唤醒的安全性和可靠性,而且用户可以根据需求而灵活设置唤醒词,并且该唤醒词与用户自身的声纹特征关联,因此能够较好满足用户的个性化唤醒需求,可有效提升用户的设备唤醒体验。为便于理解,以下对本公开实施例进行阐述说明。
首先,本公开实施例提供了一种设备唤醒方法,该方法可应用于电子设备,电子设备诸如可以为手机、车机、机器人、智能可穿戴设备等,在此不进行限制。图1为本公开实施例提供的一种设备唤醒方法的流程图。本方法适用于需要对处于休眠状态下的电子设备进行唤醒的情况,本方法可以由设备唤醒装置来执行,该设备唤醒装置可以采用软件和/或硬件的方式实现。如图1所示,该方法主要包括以下步骤S102~步骤S106:
步骤S102,如果在休眠状态下接收到语音信息,获取语音信息对应的文本内容以及语音信息对应的声纹特征。
电子设备可以在达到一定的触发条件后处于休眠状态,该触发条件诸如可以是指定时长内未监测到用户操作、用户发起休眠指令、用户执行锁屏操作等,在此不进行限定,出于休眠状态的电子设备可以将所有运行的实时数据都存储在内存上,并关闭一切不必要的硬件,以此达到省电目的。处于休眠状态的电子设备通常不会响应用户的操作,只有在被唤醒后才可响应用户操作。
在本公开实施例中,用户可以通过语音唤醒设备,处于休眠状态下的电子设备在接收到语音信息(也即用户语音)时,可以对语音信息进行语音识别和声纹识别,以此获取语音信息对应的文本内容以及语音信息对应的声纹特征。应当理解的是,每个用户的声纹特征均不相同,声纹特征可用于表征或标识说话人的身份。
在实际应用中,可以同时对语音信息进行语音识别和声纹识别,得到语音信息对应的文本内容以及语音信息对应的声纹特征,也可以先后对语音信息进行语音识别及声纹识别,在此不进行限制。
步骤S104,根据语音信息对应的文本内容、语音信息对应的声纹特征以及预设的至少一种关联关系,判别语音信息是否对应预设唤醒指令;其中,关联关系包括用户预设的唤醒词和用户的声纹特征的关联关系。预设唤醒指令即为用户预先设置的能够唤醒设备的指令,该指令可指示具有唤醒权限的唤醒词、具有唤醒权限的用户声纹特征以及唤醒词及声纹特征的对应关系等信息中的一种或多种,具体的唤醒词以及具体的声纹特征可取决于用户,在此不进行限制。
在实际应用中,可以在电子设备上预先设置至少一种关联关系,具体的,设置唤醒词和用户的声纹特征的关联关系,出于安全性考虑,在本公开实施例中不只是基于唤醒词进行设备唤醒,而且还需要结合声纹特征。诸如,假设用户A设定了唤醒词A,且用户A具有声纹特征A,唤醒词A与声纹特征A具有关联关系(绑定),只有用户A语音说出唤醒词A时,才可唤醒电子设备,倘若用户B语音说出唤醒词A,由于其不具有声纹特征A,则无法唤醒电子设备;倘若用户A的语音中未包括唤醒词A,则也无法唤醒电子设备。应当注意的是,以上仅为示例性说明,不应当被视为限制。在实际应用中,用户可以根据自身需求设置唤醒词,一个用户可以设置一个或多个唤醒词,也即,一个用户的声纹特征可以与一个或多个唤醒词具有关联关系。
在实际应用中,电子设备可以存储预设的至少一种关联关系,在获取到语音信息对应的文本内容及声纹特征后,可判别该文本内容与声纹特征是否符合预设的关联关系,如果符合,则确定语音信息对应预设唤醒指令。
步骤S106,在语音信息对应预设唤醒指令的情况下,执行与预设唤醒指令对应的设备唤醒操作。
在一些实施示例中,可认为不同的关联关系对应同一个预设唤醒指令,电子设备在确认接收到预设唤醒指令时,只用于执行设备唤醒操作,诸如令电子设备呈现为休眠之前的原有状态。在一些实施示例中,可认为不同的关联关系对应不同的预设唤醒指令,也即可存在多种能够唤醒电子设备的预设唤醒指令,不同的预设唤醒指令对应不同的设备唤醒方式,不仅可以唤醒设备,而且还可以直接驱使设备执行指定操作。也即,在语音信息对应的预设唤醒指令还用于指示执行指定操作的情况下,电子设备可先后执行唤醒操作和指定操作;其中,指定操作为除唤醒操作之外的操作。诸如,预设的一种关联关系为唤醒词“打开导航页面”与用户A的声纹特征关联,则当接收到用户A“打开导航页面”的语音信息时,处于休眠状态下的电子设备不仅被唤醒,还直接跳转至导航页面,也即执行导航页面的打开操作。又诸如,预设的一种关联关系为唤醒词“播放音乐”与用户B的声纹特征关联,则当接收到用户B“播放音乐”的语音信息时,处于休眠状态下的电子设备不仅被唤醒,还直接跳转至音乐播放界面开始播放音乐,也即执行音乐播放操作。以上仅为示例,不应当被视为限制。可以理解的是,用户可以根据自身的设备使用习惯,将常用指令设置为唤醒词,通过语音输入该唤醒词,不仅可以直接唤醒设备,而且可以令设备直接执行该指令对应的操作,非常方便快捷。
综上,本公开实施例提供的上述设备唤醒方式需要考虑语音对应的文本内容及声纹信息两方面因素,能够有效提升设备唤醒的安全性和可靠性,而且用户可以预先设置唤醒词与用户声纹特征的关联关系,能够较好满足用户的个性化唤醒需求,可有效提升用户的设备唤醒体验。
在实际应用中,上述根据语音信息对应的文本内容、语音信息对应的声纹特征以及预设的至少一种关联关系,判别语音信息是否对应预设唤醒指令的步骤,可以参照如下步骤执行:判断语音信息对应的文本内容和语音信息对应的声纹特征是否属于预设的至少一种关联关系;如果是,确定语音信息对应预设唤醒指令。也即,可根据预设的至少一种关联关系,判断语音信息对应的文本内容与声纹特征是否关联,以此来判别语音信息是否对应预设唤醒指令,换言之,以此来判别该语音信息是否能够唤醒设备。
进一步,本公开实施例给出了判断语音信息对应的文本内容和语音信息对应的声纹特征是否属于预设的至少一种关联关系的两种可实现方式,具体可参照如下方式一和方式二实现:
方式一:可以参照如下步骤A1~A3实现:
步骤A1,从预设的至少一种关联关系中查找是否存在包含有语音信息对应的文本内容的目标关联关系。
由于每种关联关系都是声纹特征与用户预设的唤醒词的对应关系,因此可从预设的至少一种关联关系中查找包含有语音信息对应的文本内容的关联关系,也即基于预设的关联关系来判别该语音信息对应的文本内容是否为预先记录的唤醒词,并将查找到的关联关系作为目标关联关系。示例性地,语音信息对应的文本内容与目标关联关系中的唤醒词一致。
步骤A2,如果存在目标关联关系,判断语音信息对应的声纹特征是否与目标关联关系中的声纹特征匹配。
在查找到目标关联关系后,再判别语音信息对应的声纹特征是否与目标关联关系中的声纹特征匹配,也即,根据声纹特征来判别用户身份是否一致。
步骤A3,如果匹配,确定语音信息对应的文本内容和语音信息对应的声纹特征属于预设的至少一种关联关系。
通过上述方式,可以首先从预设的关联关系中判别该语音信息对应的文本内容是否为预设的唤醒词,如果是,则再比对电子设备记录的预设唤醒词所关联的声纹特征与接收到的语音信息对应的声纹特征是否属于同一用户,如果属于,则可确定语音信息对应的文本内容和语音信息对应的声纹特征属于预设的至少一种关联关系。
方式二:可以参照如下步骤B1~B3实现:
步骤B1,从预设的至少一种关联关系中查找是否存在包含有语音信息对应的声纹特征的目标关联关系。
由于每种关联关系都是声纹特征与用户预设的唤醒词的对应关系,因此可从预设的至少一种关联关系中查找包含有语音信息对应的声纹特征的关联关系,也即基于预设的关联关系来判别该语音信息对应的声纹特征是否为预先记录的声纹特征,并将查找到的关联关系作为目标关联关系。示例性地,语音信息对应的声纹特征与目标关联关系中的声纹特征所指示的用户身份一致。
步骤B2,如果存在目标关联关系,判断语音信息对应的文本内容是否与目标关联关系中的唤醒词匹配。
在查找到目标关联关系后,再判别语音信息对应的文本内容是否与目标关联关系中的唤醒词匹配,在一些实施示例中,如果该语音信息对应的文本内容与唤醒词一致,则认为匹配;在另一些实施示例中,如果该语音信息对应的文本内容包括唤醒词,则认为匹配。
步骤B3,如果匹配,确定语音信息对应的文本内容和语音信息对应的声纹特征属于预设的至少一种关联关系。
通过上述方式,可以首先从预设的关联关系中判别该语音信息对应的声纹特征是否属于预设的声纹特征,如果是,则再比对电子设备预设的声纹特征所关联的唤醒词与接收到的语音信息对应的文本内容是否匹配,如果匹配,则可确定语音信息对应的文本内容和语音信息对应的声纹特征属于预设的至少一种关联关系。
可以理解的是,上述方式一和方式二的主要区别在于针对语音信息对应的文本内容和声纹特征的判别顺序不一致,最后均可达到判断语音信息对应的文本内容和语音信息对应的声纹特征是否属于预设的至少一种关联关系的效果,在实际应用中,可以根据需求而灵活选择方式一或方式二,在此不进行限制。
进一步,本公开实施例给出了如图2所示的一种关联关系的设置方法流程图,主要包括如下步骤S202~步骤S210,该方法主要描述如何通过电子设备预先设置唤醒词及声纹特征的关联关系。
步骤S202,响应于唤醒词注册指令,获取用户输入的语音唤醒词。在实际应用中,可以在注册引导阶段,通过电子设备呈现的交互界面引导用户注册唤醒词,获取用户输入的语音唤醒词(也即,采集唤醒词)有两种实施示例:
实施示例一:发起用于引导用户语音输入唤醒词的提示,并接收用户输入的语音唤醒词。诸如,可以通过屏幕图文提示或者语音提示等方式引导用户直接采用语音的方式输入唤醒词。
实施示例二:发起用于引导用户文字输入唤醒词的提示,并接收用户输入的文字唤醒词;发起用于引导用户语音录入文字唤醒词的提示,并接收用户输入的语音唤醒词。诸如,可以首先引导用户输入文字唤醒词,然后再引导用户语音录入唤醒词,也即引导用户将文字唤醒词读一遍,从而采集到语音唤醒词。
步骤S204,判别语音唤醒词的音频质量是否合格;并在语音唤醒词的音频质量合格的情况下,执行步骤S206,在语音唤醒词的音频质量不合格的情况下,执行步骤S210。可以理解的是,为了充分保障后续可以准确录入唤醒词与声纹特征的关联关系,在此需要保证音频质量,只有在音频质量合格的情况下才会录入并存储用户预设的唤醒词与声纹特征的关联关系。在一些实施示例中,以电子设备能够准确识别出语音唤醒词作为音频指令合格标准。诸如,倘若电子设备可以对语音唤醒词进行语音识别,得到准确的文本识别结果,即可认为电子设备能够准确识别出语音唤醒词,此时可认为音频质量合格。以下给出两种判别音频质量是否合格的实施示例:
实施示例(一):对语音唤醒词进行语音识别,得到语音唤醒词的文本识别结果;向用户确认文本识别结果是否准确;响应于用户的确认反馈,确定语音唤醒词的音频质量合格。
也即,电子设备可以首先调用ASR(Automatic Speech Recognition,自动语音识别)模块进行语音识别,然后直接向用户确认文本识别结果是否准确,诸如可以通过在界面上展示文本识别结果的方式以供用户确认,倘若接收到用户的确认反馈消息,则可确定用户输入的语音唤醒词的音频质量合格,也即可保证后续能够准确识别出用户输入的语音唤醒词,以便后续可以进一步与预设关联关系比对,从而判别用户的语音信息是否对应预设唤醒指令。
实施示例(二):对语音唤醒词进行语音识别,得到语音唤醒词的文本识别结果;判别语音唤醒词的文本识别结果和文字唤醒词是否一致;如果一致,确定语音唤醒词的音频质量合格。
上述实施示例(二)可以在上述实施示例二的基础上实现,在上述实施示例二中,电子设备在采集语音唤醒词时已经获取到用户输入的准确的文字唤醒词,因此电子设备可以在对语音唤醒词进行语音识别后,直接判别语音识别得到的文本识别结果与文字唤醒词是否一致,如果一致则说明电子设备可以准确识别出语音唤醒词,以便后续可以进一步与预设关联关系比对,从而判别用户的语音信息是否对应预设唤醒指令。
步骤S206,将语音唤醒词对应的文本识别结果作为用户预设的唤醒词,并获取用户的声纹特征。
在一些实施方式中,可以直接对用户输入的语音唤醒词进行声纹识别,得到用户的声纹特征;这种方式较为方便快捷。在另一些实施方式中,可以引导用户阅读指定语句,基于用户阅读指定语句所录入的音频进行声纹识别,得到用户的声纹特征。在实际应用中可以根据需求而灵活选用上述实施方式,诸如在用户输入的语音唤醒词较短的情况下,为了能够更好地分析及提取其声纹特征,则可以引导用户阅读指定语句,从而准确可靠地进行声纹识别。本公开实施例对指定语句不进行限制,任何便于分析声纹特征的语句均可。另外,在获取到声纹特征后,也可以将声纹特征存储在声纹库中,每个声纹特征都具有用于表征用户身份的特定标识。
步骤S208,针对用户预设的唤醒词和用户的声纹特征建立关联关系。也即,可将用户预设的唤醒词和用户的声纹特征绑定,绑定后的唤醒词和声纹特征即可视为预设唤醒指令。电子设备在后续监测到预设唤醒指令的情况下,才会执行相应的唤醒操作。
步骤S210,提醒用户重新输入语音唤醒词。如果在步骤S204中判别语音唤醒词的音频质量不合格,则可以采用图文或语音方式提醒用户重新输入语音唤醒词。在实际应用中,为了便于用户改进,还可以给用户提供音频质量不合格的原因,诸如无法正确识别语音唤醒词、未成功采集到语音唤醒词、背景音嘈杂等。
通过上述方式,用户可以预先设置唤醒词与声纹特征的关联关系,对于一个电子设备而言,可以预先录入至少一种关联关系,且可以对应至少一种用户。诸如,以智能电视为例,可录入用户A-唤醒词A1、用户A-唤醒词A2、用户B-唤醒词B1、用户C-唤醒词C1、用户C-唤醒词C2等多种关联关系,多种关联关系可对应同一用户,也可对应不同用户。用户A、用户B和用户C均为具有唤醒权限的人,通过语音输入预先录入的唤醒词,即可快速便捷地唤醒设备。用户可以根据自身需求和习惯而灵活设置唤醒词,诸如成人可以设置较为正式的唤醒词,儿童可以设置较为轻快活泼的唤醒词,所有唤醒词均可录入电子设备中,电子设备不仅能够满足多样化的用户需求,而且由于唤醒词与声纹特征绑定,进一步提升了唤醒设备的安全性,可以有效防止其他用户非法唤醒并使用设备。
电子设备在录入上述关联关系之后,在处于休眠状态下接收到语音信息时,即可通过语音识别和声纹识别的方式获取语音信息对应的文本内容和声纹特征,并判断是否属于预设的关联关系,如果属于,则确定语音信息对应预设唤醒指令,并发出唤醒信号,执行与预设唤醒指令相应的设备唤醒操作。
综上所述,本公开实施例提供的上述设备唤醒方法,需要考虑语音对应的文本内容及声纹信息两方面因素,能够有效提升设备唤醒的安全性和可靠性,而且用户可以预先设置唤醒词与用户声纹特征的关联关系,电子设备可以同时录入多种关联关系,能够较好满足用户自身的个性化唤醒需求以及不同用户的多样化需求,可有效提升用户的设备唤醒体验。
对应于本公开实施例提供的设备唤醒方法,本公开实施例还提供了一种设备唤醒装置,图3为本公开实施例提供的一种设备唤醒装置的结构框图,如图3所示,该设备唤醒装置包括:
获取模块302,用于如果在休眠状态下接收到语音信息,获取语音信息对应的文本内容以及语音信息对应的声纹特征;
判别模块304,用于根据语音信息对应的文本内容、语音信息对应的声纹特征以及预设的至少一种关联关系,判别语音信息是否对应预设唤醒指令;其中,关联关系包括用户预设的唤醒词和用户的声纹特征的关联关系;
唤醒模块306,用于在语音信息对应预设唤醒指令的情况下,执行与预设唤醒指令对应的设备唤醒操作。
上述设备唤醒装置需要考虑语音对应的文本内容及声纹信息两方面因素,能够有效提升设备唤醒的安全性和可靠性,而且用户可以预先设置唤醒词与用户声纹特征的关联关系,能够较好满足用户的个性化唤醒需求,可有效提升用户的设备唤醒体验。
在一些实施例中,判别模块304具体用于:判断所述语音信息对应的文本内容和所述语音信息对应的声纹特征是否属于所述预设的至少一种关联关系;如果是,确定所述语音信息对应预设唤醒指令。
在一些实施例中,判别模块304具体用于:从所述预设的至少一种关联关系中查找是否存在包含有所述语音信息对应的文本内容的目标关联关系;如果存在所述目标关联关系,判断所述语音信息对应的声纹特征是否与所述目标关联关系中的声纹特征匹配;如果匹配,确定所述语音信息对应的文本内容和所述语音信息对应的声纹特征属于所述预设的至少一种关联关系。
在一些实施例中,判别模块304具体用于:从所述预设的至少一种关联关系中查找是否存在包含有所述语音信息对应的声纹特征的目标关联关系;如果存在所述目标关联关系,判断所述语音信息对应的文本内容是否与所述目标关联关系中的唤醒词匹配;如果匹配,确定所述语音信息对应的文本内容和所述语音信息对应的声纹特征属于所述预设的至少一种关联关系。
在一些实施例中,所述装置包括关系预设模块,用于响应于唤醒词注册指令,获取用户输入的语音唤醒词;判别所述语音唤醒词的音频质量是否合格;在所述语音唤醒词的音频质量合格的情况下,将所述语音唤醒词对应的文本识别结果作为所述用户预设的唤醒词,并获取所述用户的声纹特征;针对所述用户预设的唤醒词和所述用户的声纹特征建立关联关系。
在一些实施例中,关系预设模块具体用于:发起用于引导用户语音输入唤醒词的提示,并接收用户输入的语音唤醒词。
在一些实施例中,关系预设模块具体用于:对所述语音唤醒词进行语音识别,得到所述语音唤醒词的文本识别结果;向所述用户确认所述文本识别结果是否准确;响应于所述用户的确认反馈,确定所述语音唤醒词的音频质量合格。
在一些实施例中,关系预设模块具体用于:发起用于引导用户文字输入唤醒词的提示,并接收用户输入的文字唤醒词;发起用于引导用户语音录入所述文字唤醒词的提示,并接收所述用户输入的语音唤醒词。
在一些实施例中,关系预设模块具体用于:对所述语音唤醒词进行语音识别,得到所述语音唤醒词的文本识别结果;判别所述语音唤醒词的文本识别结果和所述文字唤醒词是否一致;如果一致,确定所述语音唤醒词的音频质量合格。
在一些实施例中,关系预设模块具体用于:对所述用户输入的语音唤醒词进行声纹识别,得到所述用户的声纹特征;或者,引导所述用户阅读指定语句,基于所述用户阅读所述指定语句所录入的音频进行声纹识别,得到所述用户的声纹特征。
在一些实施例中,所述装置还包括提醒模块,用于在所述语音唤醒词的音频质量不合格的情况下,提醒所述用户重新输入语音唤醒词。
在一些实施例中,唤醒模块306具体用于:在所述语音信息对应的预设唤醒指令还用于指示执行指定操作的情况下,先后执行唤醒操作和所述指定操作;其中,所述指定操作为除唤醒操作之外的操作。
以上实施例公开的设备唤醒装置能够执行以上各实施例公开的设备唤醒方法,具有相同或相应的有益效果,为避免重复,在此不再赘述。
本公开实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储程序或指令,程序或指令使计算机执行以上各实施例公开的车辆氛围灯的控制方法的步骤,实现对应的有益效果。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本公开实施例可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等),执行本公开各个实施例所述的方法。
本公开实施例还提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序或指令;处理器通过调用存储器存储的程序或指令,用于执行上述任一种设备唤醒方法的步骤,实现对应的有益效果。
本公开实施例还提供了一种车辆,所述车辆上设置有处理器以及用于存储程序或指令的存储器,所述处理器通过调用所述存储器存储的程序或指令,用于执行上述任一种设备唤醒方法的步骤,实现对应的有益效果。诸如,可以采用上述设备唤醒方法唤醒车辆中的设备,该设备诸如可以是车辆中的空调、车载显示屏等设备,本公开实施例对车辆中可被唤醒的设备不进行限制。
图4为本公开实施例提供的电子设备的硬件结构示意图。如图4所示,电子设备包括一个或多个处理器401和存储器402。
处理器401可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器402可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器401可以运行所述程序指令,以实现上文所述的本公开的实施例的页面处理方法,和/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备还可以包括:输入装置403和输出装置404,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
此外,该输入装置403还可以包括例如键盘、鼠标等等。
该输出装置404可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置404可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图4中仅示出了该电子设备中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备还可以包括任何其他适当的组件。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (16)

1.一种设备唤醒方法,其特征在于,应用于电子设备,包括:
如果在休眠状态下接收到语音信息,获取所述语音信息对应的文本内容以及所述语音信息对应的声纹特征;
根据所述语音信息对应的文本内容、所述语音信息对应的声纹特征以及预设的至少一种关联关系,判别所述语音信息是否对应预设唤醒指令;其中,所述关联关系包括用户预设的唤醒词和所述用户的声纹特征的关联关系;
在所述语音信息对应预设唤醒指令的情况下,执行与所述预设唤醒指令对应的设备唤醒操作。
2.根据权利要求1所述的方法,其特征在于,根据所述语音信息对应的文本内容、所述语音信息对应的声纹特征以及预设的至少一种关联关系,判别所述语音信息是否对应预设唤醒指令的步骤,包括:
判断所述语音信息对应的文本内容和所述语音信息对应的声纹特征是否属于所述预设的至少一种关联关系;
如果是,确定所述语音信息对应预设唤醒指令。
3.根据权利要求2所述的方法,其特征在于,判断所述语音信息对应的文本内容和所述语音信息对应的声纹特征是否属于所述预设的至少一种关联关系的步骤,包括:
从所述预设的至少一种关联关系中查找是否存在包含有所述语音信息对应的文本内容的目标关联关系;
如果存在所述目标关联关系,判断所述语音信息对应的声纹特征是否与所述目标关联关系中的声纹特征匹配;
如果匹配,确定所述语音信息对应的文本内容和所述语音信息对应的声纹特征属于所述预设的至少一种关联关系。
4.根据权利要求2所述的方法,其特征在于,判断所述语音信息对应的文本内容和所述语音信息对应的声纹特征是否属于所述预设的至少一种关联关系的步骤,包括:
从所述预设的至少一种关联关系中查找是否存在包含有所述语音信息对应的声纹特征的目标关联关系;
如果存在所述目标关联关系,判断所述语音信息对应的文本内容是否与所述目标关联关系中的唤醒词匹配;
如果匹配,确定所述语音信息对应的文本内容和所述语音信息对应的声纹特征属于所述预设的至少一种关联关系。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述关联关系是按照如下步骤预设的:
响应于唤醒词注册指令,获取用户输入的语音唤醒词;
判别所述语音唤醒词的音频质量是否合格;
在所述语音唤醒词的音频质量合格的情况下,将所述语音唤醒词对应的文本识别结果作为所述用户预设的唤醒词,并获取所述用户的声纹特征;
针对所述用户预设的唤醒词和所述用户的声纹特征建立关联关系。
6.根据权利要求5所述的方法,其特征在于,获取用户输入的语音唤醒词的步骤,包括:
发起用于引导用户语音输入唤醒词的提示,并接收用户输入的语音唤醒词。
7.根据权利要求6所述的方法,其特征在于,判别所述语音唤醒词的音频质量是否合格的步骤,包括:
对所述语音唤醒词进行语音识别,得到所述语音唤醒词的文本识别结果;
向所述用户确认所述文本识别结果是否准确;
响应于所述用户的确认反馈,确定所述语音唤醒词的音频质量合格。
8.根据权利要求5所述的方法,其特征在于,获取用户输入的语音唤醒词的步骤,包括:
发起用于引导用户文字输入唤醒词的提示,并接收用户输入的文字唤醒词;
发起用于引导用户语音录入所述文字唤醒词的提示,并接收所述用户输入的语音唤醒词。
9.根据权利要求8所述的方法,其特征在于,判别所述语音唤醒词的音频质量是否合格的步骤,包括:
对所述语音唤醒词进行语音识别,得到所述语音唤醒词的文本识别结果;
判别所述语音唤醒词的文本识别结果和所述文字唤醒词是否一致;
如果一致,确定所述语音唤醒词的音频质量合格。
10.根据权利要求5所述的方法,其特征在于,获取所述用户的声纹特征的步骤,包括:
对所述用户输入的语音唤醒词进行声纹识别,得到所述用户的声纹特征;
或者,
引导所述用户阅读指定语句,基于所述用户阅读所述指定语句所录入的音频进行声纹识别,得到所述用户的声纹特征。
11.根据权利要求5所述的方法,其特征在于,所述方法还包括:
在所述语音唤醒词的音频质量不合格的情况下,提醒所述用户重新输入语音唤醒词。
12.根据权利要求1所述的方法,其特征在于,执行与所述预设唤醒指令对应的设备唤醒操作的步骤,包括:
在所述语音信息对应的预设唤醒指令还用于指示执行指定操作的情况下,先后执行唤醒操作和所述指定操作;其中,所述指定操作为除唤醒操作之外的操作。
13.一种设备唤醒装置,其特征在于,包括:
获取模块,用于如果在休眠状态下接收到语音信息,获取所述语音信息对应的文本内容以及所述语音信息对应的声纹特征;
判别模块,用于根据所述语音信息对应的文本内容、所述语音信息对应的声纹特征以及预设的至少一种关联关系,判别所述语音信息是否对应预设唤醒指令;其中,所述关联关系包括用户预设的唤醒词和所述用户的声纹特征的关联关系;
唤醒模块,用于在所述语音信息对应预设唤醒指令的情况下,执行与所述预设唤醒指令对应的设备唤醒操作。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序或指令;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如权利要求1至12任一项所述方法的步骤。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如权利要求1至12任一项所述方法的步骤。
16.一种车辆,其特征在于,所述车辆上设置有处理器以及用于存储程序或指令的存储器,所述处理器通过调用所述存储器存储的程序或指令,用于执行如权利要求1至12任一项所述方法的步骤。
CN202210622109.3A 2022-06-01 2022-06-01 设备唤醒方法、装置、设备、介质及车辆 Pending CN117198285A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210622109.3A CN117198285A (zh) 2022-06-01 2022-06-01 设备唤醒方法、装置、设备、介质及车辆

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210622109.3A CN117198285A (zh) 2022-06-01 2022-06-01 设备唤醒方法、装置、设备、介质及车辆

Publications (1)

Publication Number Publication Date
CN117198285A true CN117198285A (zh) 2023-12-08

Family

ID=89002242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210622109.3A Pending CN117198285A (zh) 2022-06-01 2022-06-01 设备唤醒方法、装置、设备、介质及车辆

Country Status (1)

Country Link
CN (1) CN117198285A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117894321A (zh) * 2024-03-15 2024-04-16 富迪科技(南京)有限公司 一种语音交互方法、语音交互提示系统、装置
CN118136003A (zh) * 2024-05-07 2024-06-04 广汽埃安新能源汽车股份有限公司 基于个性化语音唤醒的车辆人机交互方法、装置、电子设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117894321A (zh) * 2024-03-15 2024-04-16 富迪科技(南京)有限公司 一种语音交互方法、语音交互提示系统、装置
CN117894321B (zh) * 2024-03-15 2024-05-17 富迪科技(南京)有限公司 一种语音交互方法、语音交互提示系统、装置
CN118136003A (zh) * 2024-05-07 2024-06-04 广汽埃安新能源汽车股份有限公司 基于个性化语音唤醒的车辆人机交互方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US10733978B2 (en) Operating method for voice function and electronic device supporting the same
WO2018188586A1 (zh) 一种用户注册方法、装置及电子设备
CN106782554B (zh) 基于人工智能的语音唤醒方法和装置
CN117198285A (zh) 设备唤醒方法、装置、设备、介质及车辆
CN109448725A (zh) 一种语音交互设备唤醒方法、装置、设备及存储介质
CN107886944B (zh) 一种语音识别方法、装置、设备及存储介质
CN109410952A (zh) 一种语音唤醒方法、装置及系统
CN108831477B (zh) 一种语音识别方法、装置、设备及存储介质
CN108766431B (zh) 一种基于语音识别的自动唤醒方法及电子设备
CN110718225A (zh) 一种语音控制方法、终端以及存储介质
CN109686368B (zh) 语音唤醒应答处理方法及装置、电子设备及存储介质
CN111784971B (zh) 报警处理方法和系统、计算机可读存储介质和电子设备
CN108595406B (zh) 一种用户状态的提醒方法、装置、电子设备及存储介质
CN105744074A (zh) 一种在移动终端中进行语音操作方法和装置
CN112740321A (zh) 唤醒设备的方法、装置、存储介质及电子设备
CN110544468A (zh) 应用唤醒方法、装置、存储介质及电子设备
CN112417412A (zh) 一种银行账户余额查询方法、装置及系统
CN111754989B (zh) 一种语音误唤醒的规避方法及电子设备
CN112767939A (zh) 一种智能设备唤醒方法、装置、计算机设备及存储介质
CN113808584B (zh) 语音唤醒方法、装置、电子设备及存储介质
CN110473542B (zh) 语音指令执行功能的唤醒方法、装置及电子设备
CN117636872A (zh) 音频处理方法、装置、电子设备和可读存储介质
CN111862943A (zh) 语音识别方法和装置、电子设备和存储介质
CN109087647A (zh) 声纹识别处理方法、装置、电子设备及存储介质
CN111641751B (zh) 终端设备的屏幕解锁方法、装置、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination