CN115691485A

CN115691485A - 设备唤醒方法、相关装置及通信系统

Info

Publication number: CN115691485A
Application number: CN202110844001.4A
Authority: CN
Inventors: 闻琛; 李明雨; 赵伟; 冯晓兵; 陈航; 曾旺; 刘杰
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2021-07-26
Filing date: 2021-07-26
Publication date: 2023-02-03
Also published as: WO2023005844A1

Abstract

本申请提供一种设备唤醒方法、相关装置及通信系统。在该方法中，当检测到用户需要唤醒其它电子设备时，智能眼镜可以采集图像。该图像为用户视野范围内的图像。智能眼镜可以根据该图像确定目标唤醒设备，并向目标唤醒设备发送唤醒指令。接收到唤醒指令的电子设备可以进入唤醒状态。上述方法可以有效减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

Description

设备唤醒方法、相关装置及通信系统

技术领域

本申请涉及终端技术领域，尤其涉及一种设备唤醒方法、相关装置及通信系统。

背景技术

随着电子设备的智能化，越来越多的电子设备具有语音交互的功能。用户可以通过唤醒词在不接触电子设备的情况下唤醒电子设备，并通过语音指令指示电子设备完成相应的任务。但在一个房间中存在多个具有语音交互功能的电子设备(尤其是同一个品牌的多个电子设备)的场景中，若用户说出唤醒词，这多个电子设备可能均监听到唤醒词而均被唤醒。上述误唤醒会对用户产生干扰，降低用户的使用体验。

发明内容

本申请提供一种设备唤醒方法、相关装置及通信系统，可以有效减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

第一方面，本申请提供一种设备唤醒系统。该设备唤醒系统包括图像采集装置和多个电子设备。其中，图像采集装置，可用于检测第一用户输入，并在检测到第一用户输入时，采集第一图像。图像采集装置，还可用于从多个电子设备中选出第一图像包含的目标电子设备，并向目标电子设备发送唤醒指令；唤醒指令用于触发目标电子设备进入唤醒状态。该目标电子设备，可用于响应接收到的唤醒指令，进入唤醒状态。

上述多个电子设备可以是具有语音交互功能，且语音交互功能开启的电子设备。具有语音交互功能可以表示电子设备可以识别用户的语音指令并执行语音指令对应的操作。

由上述设备唤醒系统可知，图像采集装置可以通过自己采集的图像确定目标电子设备，并指示目标电子设备进入唤醒状态。上述目标电子设备为图像采集装置确定出的用户希望唤醒的电子设备。也即是说，用户可以借助图像采集装置来唤醒自己希望唤醒的电子设备。在用户说出唤醒词进行设备唤醒的场景中，上述目标电子设备可以进入唤醒状态，来响应用户的语音指令。这样可以减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

结合第一方面，在一些实施例中，上述图像采集装置可以是智能眼镜。

可以理解的，用户希望唤醒一个电子设备设备时，通常会望向这一个电子设备，并说出语音指令。那么，若用户佩戴有智能眼镜，智能眼镜采集的图像即为用户视野范围内的图像。智能眼镜根据自己采集的图像可以更准确地判断出用户希望唤醒的电子设备是哪一个。

结合第一方面，在一些实施例中，上述第一用户输入可以为包含唤醒词的语音输入。或者，上述第一用户输入可以为作用在图像采集装置的第一位置上的用户操作。

其中，当监听到唤醒词，图像采集装置可以进行图像采集，得到上述第一图像，并根据上述第一图像确定目标电子设备。当用户说出唤醒词，除了图像采集装置可以监听到唤醒词，上述多个电子设备也可以监听到唤醒词。当监听到唤醒词，上述多个电子设备可以检测设备唤醒系统中是否存在上述图像采集装置。在一种可能的实现方式中，存在于上述设备唤醒系统中的电子设备可以存在于本地设备列表中。该本地设备列表可以存储于设备唤醒系统中的一个或多个电子设备中。可选的，该本地设备列表也可以存储在云服务器中。本地设备列表中的电子设备均可以获取该本地设备列表。即本地设备列表中的电子设备均可以确定上述设备唤醒系统中包含哪些电子设备。

上述多个电子设备可以通过确定上述本地设备列表中是否包含上述图像采集装置，来确定上述设备唤醒系统中是否存在上述图像采集装置。若上述本地设备列表中包含上述图像采集装置，上述多个电子设备可以确定上述设备唤醒系统中存在上述图像采集装置。若确定出上述设备唤醒系统中存在上述图像采集装置，上述多个电子设备可以进一步确定该图像采集装置是否处于佩戴状态。若确定出该图像采集装置处于佩戴状态，上述多个电子设备可以等待唤醒指令，而不立即进入唤醒状态。当上述多个电子设备中的一个电子设备接收到唤醒指令，这一个电子设备可以进入唤醒状态。在上述等待唤醒指令的过程中，上述多个电子设备可以不响应监听到的唤醒词、语音指令等。其中，上述图像采集装置可以为智能眼镜。

在一些实施例中，在接收到上述唤醒指令之前，目标电子设备监听到唤醒词，但未监听到语音指令(如在用户仅说出唤醒词的场景中)。那么，当进入唤醒状态，上述目标电子设备可以输出针对上述唤醒词的语音响应。该针对唤醒词的语音响应可以例如是“我在”。或者，在接收到上述唤醒指令之前，目标电子设备既未监听到唤醒词，也未监听到语音指令(如在用户未说出唤醒词，而通过作用在上述第一位置上的用户操作来实现设备唤醒的场景中)。那么，当进入唤醒状态，上述目标电子设备也可以输出针对上述唤醒词的语音响应。也即是说，当进入唤醒状态但未监听到语音指令的情况下，目标电子设备均可以输出针对上述唤醒词的语音响应，来提示用户该目标电子设备已进入唤醒状态。这样，用户可以知道哪个电子设备被唤醒，进而通过语音指令指示进入唤醒状态的电子设备执行相应的操作。当进入唤醒状态，目标电子设备可以识别语音指令，并执行该语音指令对应的用户操作。

在一些实施例中，若在接收到上述唤醒指令之前，目标电子设备监听到语音指令，那么，目标电子设备可以在进入唤醒状态后直接输出针对该语音指令的语音响应，并执行该语音指令对应的操作。例如，在用户一次性说出唤醒词和语音指令的场景中，或者，在用户在上述第一位置上进行用户操作的同时或在第一位置上进行用户操作之前说出语音指令的场景中，目标电子设备均可能在接收到唤醒指令之前就监听到了语音指令。其中，目标电子设备可以检测接收到唤醒指令之前的第一时间段内以及接收到唤醒指令之后采集的声音信号中是否包含语音指令。这样，可以减少用户在目标电子设备收到唤醒指令之前说出语音指令时，目标电子设备由于未检测到用户的语音指令而未响应该语音指令的情况。

在一些实施例中，若上述多个电子设备确定出设备唤醒系统中不存在上述图像采集装置(即本地设备列表中不包含图像采集装置)，或者，确定出设备唤醒系统中存在上述图像采集装置但该图像采集装置未处于佩戴状态，上述多个电子设备可以协商选出一个电子设备。上述协商选出的一个电子设备可以进入唤醒状态。其它电子设备可以不进入唤醒状态。在一种可能的实现方式中，上述多个电子设备可以根据接收到包含唤醒词的声音信号的强度，协商选取出接收到包含唤醒词的声音信号的强度最大的电子设备。该接收到包含唤醒词的声音信号强度最大的电子设备可以进入唤醒状态。

由上述实施例可知，当语音交互功能开启的多个电子设备监听到唤醒词，这多个电子设备可以判断用户是否会通过图像采集装置来进行设备唤醒。在确定用户会通过图像采集装置来进行设备唤醒的情况下，这多个电子设备可以等待唤醒指令，在接收到唤醒指令之后才进入唤醒状态。这样这多个电子设备不会在监听到唤醒词之后全部进入唤醒状态，出现误唤醒的情况。并且，接收到唤醒指令的电子设备为用户希望唤醒的电子设备的可能性最大。这可以为用户使用电子设备的语音交互功能带来更好的使用体验。

在一些实施例中，上述图像采集装置可以为智能眼镜。上述第一位置可以为智能眼镜的镜腿上的一个位置。

结合第一方面，在一些实施例中，上述图像采集装置从多个电子设备中选出第一图像包含的目标电子设备的具体实现方式可以为：确定第一图像包含的电子设备的类型、识别准确率、视角偏差中的至少一项；识别准确率用于指示第一图像包含的电子设备的类型的识别结果的准确率，视角偏差用于指示电子设备在第一图像中的位置与第一图像的中心的距离；

将多个电子设备中包含于第一图像，且优先级最高的电子设备确定为目标电子设备；优先级是根据类型、识别准确率和视角偏差中的一项或多项确定的；电子设备的类型在依据类型确定的唤醒排序中的优先顺序与电子设备的优先级正相关，电子设备的识别准确率与电子设备的优先级正相关，电子设备的视角偏差与电子设备的优先级负相关。

可以理解的，在考虑电子设备的类型与上述电子设备的优先级的关系的情况下，若上述识别准确率和视角偏差等特征的取值不变，电子设备的类型在依据类型确定的唤醒排序中越靠前，电子设备的优先级越高。在考虑电子设备的识别准确率与上述电子设备的优先级的关系的情况下，若上述电子设备的类型和视角偏差等特征的取值不变，电子设备的识别准确率越高，电子设备的优先级越高。在考虑电子设备的识别准确率与上述电子设备的优先级的关系的情况下，若上述电子设备的类型和识别准确率等特征的取值不变，电子设备的视角偏差越小，电子设备的优先级越高。

由上述实施例可知，电子设备的识别准确率越高，该电子设备能与本地设备列表中的电子设备匹配得上的概率越大，那么该电子设备被成功唤醒的概率也越大。电视设备的视角偏差越小，该电子设备的位置越接近用户视野中心，那么该电子设备是用户希望唤醒的电子设备的概率越大。根据上述类型、识别准确率和视角偏差中的一项或多项可以准确地确定用户希望唤醒的电子设备。这样可以有效减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

第二方面，本申请提供一种设备唤醒系统。该设备唤醒系统可包括图像采集装置和处理设备。其中，图像采集装置，可用于检测第一用户输入，并在检测到第一用户输入时，采集第一图像。图像采集装置，还可用于向处理设备发送第一指令，第一指令可包括第一图像，第一指令可用于指示处理设备从多个电子设备中选出第一图像包含的目标电子设备。处理设备，可用于响应第一指令，从多个电子设备中选出第一图像包含的目标电子设备，并向目标电子设备发送唤醒指令。唤醒指令可用于触发目标电子设备进入唤醒状态。

由上述设备唤醒系统可知，图像采集装置可以在用户需要进行设备唤醒时进行图像采集，并将采集得到的图像发送给处理设备。处理设备可以通过来自图像采集装置的图像确定确定目标电子设备，并指示目标电子设备进入唤醒状态。上述目标电子设备为图像采集装置确定出的用户希望唤醒的电子设备。也即是说，用户可以借助图像采集装置和处理设备来唤醒自己希望唤醒的电子设备。在用户说出唤醒词进行设备唤醒的场景中，上述目标电子设备可以进入唤醒状态，来响应用户的语音指令。这样可以减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

可以理解的，图像采集装置可以不用进行目标电子设备确定的操作，这可以节省图像采集装置的功耗。上述处理设备可以是具有强算力的电子设备，例如手机、云服务器等等。

结合第二方面，在一些实施例中，上述图像采集装置可以是智能眼镜。

结合第二方面，在一些实施例中，第一用户输入为包含唤醒词的语音输入；或者，第一用户输入为作用在图像采集装置的第一位置上的用户操作。

其中，当监听到唤醒词，图像采集装置可以进行图像采集，得到上述第一图像，并根据上述第一图像确定目标电子设备。除了图像采集装置和处理设备，上述设备唤醒系统还可以包括上述多个电子设备。当用户说出唤醒词，除了图像采集装置可以监听到唤醒词，上述多个电子设备也可以监听到唤醒词。

当监听到唤醒词，上述多个电子设备可以检测设备唤醒系统中是否存在上述图像采集装置。在一种可能的实现方式中，存在于上述设备唤醒系统中的电子设备可以存在于本地设备列表中。该本地设备列表可以存储于设备唤醒系统中的一个或多个电子设备中。可选的，该本地设备列表也可以存储在云服务器中。本地设备列表中的电子设备均可以获取该本地设备列表。即本地设备列表中的电子设备均可以确定上述设备唤醒系统中包含哪些电子设备。

上述多个电子设备可以通过确定上述本地设备列表中是否包含上述图像采集装置，来确定上述设备唤醒系统中是否存在上述图像采集装置。若上述本地设备列表中包含上述图像采集装置，上述多个电子设备可以确定上述设备唤醒系统中存在上述图像采集装置。若确定出上述设备唤醒系统中存在上述图像采集装置，上述多个电子设备可以进一步确定该图像采集装置是否处于佩戴状态。若确定出该图像采集装置处于佩戴状态，上述多个电子设备可以等待唤醒指令，而不立即进入唤醒状态。当上述多个电子设备中的一个电子设备接收到唤醒指令，这一个电子设备可以进入唤醒状态。在上述等待唤醒指令的过程中，上述多个电子设备可以不响应监听到的唤醒词、语音指令等。

结合第二方面，在一些实施例中，上述处理设备从多个电子设备中选出第一图像包含的目标电子设备的具体方法可以为：确定第一图像包含的电子设备的类型、识别准确率、视角偏差中的至少一项；识别准确率用于指示第一图像包含的电子设备的类型的识别结果的准确率，视角偏差用于指示电子设备在第一图像中的位置与第一图像的中心的距离。将多个电子设备中包含于第一图像，且优先级最高的电子设备确定为目标电子设备；优先级是根据类型、识别准确率和视角偏差中的一项或多项确定的；电子设备的类型在依据类型确定的唤醒排序中的优先顺序与电子设备的优先级正相关，电子设备的识别准确率与电子设备的优先级正相关，电子设备的视角偏差与电子设备的优先级负相关。

结合第二方面，在一些实施例中，上述处理设备可以是上述多个电子设备中的一个。即上述处理设备可以是语音交互功能开启的电子设备。若处理设备根据来自图像采集装置的第一图像确定出自己为目标电子设备，处理设备可以进入唤醒状态。即处理设备可以不用发送唤醒指令。

结合第二方面，在一些实施例中，上述图像采集装置在采集上述第一图像后，可以识别第一图像中包含的电子设备，并将识别出的电子设备的信息发送给处理设备。上述电子设备的信息可以包括以下一项或多项：类型、识别准确率、视角偏差。处理设备可以根据上述电子设备的信息确定第一图像中包含的电子设备的优先级，并从本地设备列表中选出包含于第一图像且优先级最高的电子设备。该被选出的电子设备即为目标电子设备。

结合第二方面，在一些实施例中，上述图像采集装置在采集上述第一图像后，可以确定第一图像中包含的电子设备的优先级，并将该优先级发送给处理设备。处理设备可以根据第一图像中包含的电子设备的优先级，从本地设备列表中选出包含于第一图像且优先级最高的电子设备。该被选出的电子设备即为目标电子设备。

第三方面，本申请提供一种设备唤醒方法。在该方法中，获取第一图像，从多个电子设备总选出第一图像包含的目标电子设备，向该目标电子设备发送唤醒指令。该唤醒指令可用于触发目标电子设备进入唤醒状态。

结合第三方面，在一些实施例中，上述第三方面的方法可以由图像采集装置执行。其中，上述获取第一图像的过程可以为：当检测到第一用户输入，图像采集装置采集第一图像。上述检测到第一用户输入具体可以为监听到唤醒词，或者，检测到作用在图像采集装置的第一位置上的用户操作。上述图像采集装置可以为智能眼镜。

可以理解的，图像采集装置可以通过检测上述第一用户输入，来确定用户是否需要进行设备唤醒。当确定用户需要进行设备唤醒，图像采集装置可以进行图像采集。即上述第一图像可以是图像采集装置在确定用户需要进行设备唤醒的情况下采集得到的。

由上述实施例可知，图像采集装置可以通过自己采集的图像确定目标电子设备，并指示目标电子设备进入唤醒状态。上述目标电子设备为图像采集装置确定出的用户希望唤醒的电子设备。也即是说，用户可以借助图像采集装置来唤醒自己希望唤醒的电子设备。在用户说出唤醒词进行设备唤醒的场景中，上述目标电子设备可以进入唤醒状态，来响应用户的语音指令。这样可以减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

结合第三方面，在一些实施例中，上述第三方面的方法可以由处理设备执行。其中，上述获取第一图像的过程可以为：接收来自图像采集装置的第一指令。该第一指令可包括图像采集装置采集的第一图像。该第一指令可用于指示处理设备从多个电子设备中选出第一图像包含的目标电子设备。

由上述实施例可知，处理设备可以根据来自图像采集装置的图像确定目标电子设备，并指示目标电子设备进入唤醒状态。上述目标电子设备为图像采集装置确定出的用户希望唤醒的电子设备。也即是说，在用户说出唤醒词进行设备唤醒的场景中，上述目标电子设备可以进入唤醒状态，而其它语音交互功能开启的电子设备不会进入唤醒状态。这样可以减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

结合第三方面，在一些实施例中，上述从多个电子设备中选出第一图像包含的目标电子设备的具体方法可以为：确定第一图像包含的电子设备的类型、识别准确率、视角偏差中的至少一项；识别准确率用于指示第一图像包含的电子设备的类型的识别结果的准确率，视角偏差用于指示电子设备在第一图像中的位置与第一图像的中心的距离。将多个电子设备中包含于第一图像，且优先级最高的电子设备确定为目标电子设备；优先级是根据类型、识别准确率和视角偏差中的一项或多项确定的；电子设备的类型在依据类型确定的唤醒排序中的优先顺序与电子设备的优先级正相关，电子设备的识别准确率与电子设备的优先级正相关，电子设备的视角偏差与电子设备的优先级负相关。

第四方面，本申请提供一种设备唤醒方法。在该方法中，当检测到第一用户输入，图像采集装置可以采集第一图像。该图像采集装置可以向处理设备发送第一指令。该第一指令可包括第一图像。该第一指令可用于指示处理设备从多个电子设备中选出第一图像包含的目标电子设备。该目标电子设备可以是处理设备发送唤醒指令的对象。该唤醒指令可用于触发目标电子设备进入唤醒状态。

上述第一用户输入可以为包含唤醒词的语音输入，或者，为作用在上述图像采集装置的第一位置上的用户操作。

在一些实施例中，上述图像采集装置可以为智能眼镜。

由上述实施例可知，图像采集装置可以在用户需要进行设备唤醒时进行图像采集，并将采集得到的图像发送给处理设备。图像采集装置可以指示处理设备确定目标电子设备。那么，在用户说出唤醒词进行设备唤醒的场景中，上述目标电子设备可以进入唤醒状态，来响应用户的语音指令。而其它语音交互功能开启的电子设备可以不进入唤醒状态。这样可以减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

第五方面，本申请提供一种设备唤醒方法。在该方法中，第一电子设备可以监听到唤醒词。响应于唤醒词，第一电子设备可以检测设备唤醒系统中是否存在智能眼镜，且智能眼镜是否处于佩戴状态。如果设备唤醒系统中存在智能眼镜，且智能眼镜处于佩戴状态，第一电子设备可以等待接收唤醒指令。该唤醒指令可以用于触发第一电子设备进入唤醒状态。第一电子设备接收到唤醒指令，进入唤醒状态。

在一种可能的实现方式中，存在于上述设备唤醒系统中的电子设备可以存在于本地设备列表中。该本地设备列表可以存储于设备唤醒系统中的一个或多个电子设备中。可选的，该本地设备列表也可以存储在云服务器中。本地设备列表中的电子设备均可以获取该本地设备列表。即本地设备列表中的电子设备均可以确定上述设备唤醒系统中包含哪些电子设备。

当监听到唤醒词，上述第一电子设备可以通过确定上述本地设备列表中是否包含上述图像采集装置，来确定上述设备唤醒系统中是否存在智能眼镜。若上述本地设备列表中包含智能眼镜，第一电子设备可以确定上述设备唤醒系统中存在智能眼镜。若确定出上述设备唤醒系统中存在智能眼镜，第一电子设备可以进一步确定智能眼镜是否处于佩戴状态。若确定出智能眼镜处于佩戴状态，第一电子设备可以等待唤醒指令，而不立即进入唤醒状态。当第一电子设备接收到唤醒指令，第一电子设备可以进入唤醒状态。在上述等待唤醒指令的过程中，第一电子设备可以不响应监听到的唤醒词、语音指令等。

在一些实施例中，上述第一电子设备被确定为目标电子设备，并接收到唤醒指令。在接收到上述唤醒指令之前，目标电子设备监听到唤醒词，但未监听到语音指令(如在用户仅说出唤醒词的场景中)。那么，当进入唤醒状态，上述目标电子设备可以输出针对上述唤醒词的语音响应。该针对唤醒词的语音响应可以例如是“我在”。或者，在接收到上述唤醒指令之前，目标电子设备既未监听到唤醒词，也未监听到语音指令(如在用户未说出唤醒词，而通过作用在上述第一位置上的用户操作来实现设备唤醒的场景中)。那么，当进入唤醒状态，上述目标电子设备也可以输出针对上述唤醒词的语音响应。也即是说，当进入唤醒状态但未监听到语音指令的情况下，目标电子设备均可以输出针对上述唤醒词的语音响应，来提示用户该目标电子设备已进入唤醒状态。这样，用户可以知道哪个电子设备被唤醒，进而通过语音指令指示进入唤醒状态的电子设备执行相应的操作。当进入唤醒状态，目标电子设备可以识别语音指令，并执行该语音指令对应的用户操作。

在一些实施例中，上述第一电子设备被确定为目标电子设备，并接收到唤醒指令。若在接收到上述唤醒指令之前，目标电子设备监听到语音指令，那么，目标电子设备可以在进入唤醒状态后直接输出针对该语音指令的语音响应，并执行该语音指令对应的操作。例如，在用户一次性说出唤醒词和语音指令的场景中，或者，在用户在上述第一位置上进行用户操作的同时或在第一位置上进行用户操作之前说出语音指令的场景中，目标电子设备均可能在接收到唤醒指令之前就监听到了语音指令。其中，目标电子设备可以检测接收到唤醒指令之前的第一时间段内以及接收到唤醒指令之后采集的声音信号中是否包含语音指令。这样，可以减少用户在目标电子设备收到唤醒指令之前说出语音指令时，目标电子设备由于未检测到用户的语音指令而未响应该语音指令的情况。

在一些实施例中，若第一电子设备确定出设备唤醒系统中不存在智能眼镜(即本地设备列表中不包含智能眼镜)，或者，确定出设备唤醒系统中存在智能眼镜但智能眼镜未处于佩戴状态，第一电子设备和其它语音交互功能开启的电子设备可以协商选出一个电子设备。上述协商选出的一个电子设备可以进入唤醒状态。其它电子设备可以不进入唤醒状态。在一种可能的实现方式中，第一电子设备和其它语音交互功能开启的电子设备可以根据接收到包含唤醒词的声音信号的强度，协商选取出接收到包含唤醒词的声音信号的强度最大的电子设备。该接收到包含唤醒词的声音信号强度最大的电子设备可以进入唤醒状态。

由上述实施例可知，当语音交互功能开启的多个电子设备监听到唤醒词，这多个电子设备可以判断用户是否会通过智能眼镜来进行设备唤醒。在确定用户会通过智能眼镜来进行设备唤醒的情况下，这多个电子设备可以等待唤醒指令，在接收到唤醒指令之后才进入唤醒状态。这样这多个电子设备不会在监听到唤醒词之后全部进入唤醒状态，出现误唤醒的情况。并且，接收到唤醒指令的电子设备为用户希望唤醒的电子设备的可能性最大。这可以为用户使用电子设备的语音交互功能带来更好的使用体验。

第六方面，本申请提供一种电子设备。该电子设备可包括存储器和处理器。其中，存储器可用于存储计算机程序。处理器可用于调用计算机程序，使得电子设备执行如第三方面或第四方面或第五方面中任一可能的实现方式。

第七方面，本申请提供一种芯片，该芯片应用于电子设备，该芯片包括一个或多个处理器，该处理器用于调用计算机指令以使得该电子设备执行如第三方面或第四方面或第五方面中任一可能的实现方式。

第八方面，本申请提供一种包含指令的计算机程序产品，其特征在于，当上述计算机程序产品在电子设备上运行时，使得该电子设备执行如第三方面或第四方面或第五方面中任一可能的实现方式。

第九方面，本申请提供一种计算机可读存储介质，包括指令，其特征在于，当上述指令在电子设备上运行时，使得该电子设备执行如第三方面或第四方面或第五方面中任一可能的实现方式。

可以理解地，上述第六方面提供的电子设备、第七方面提供的芯片、第八方面提供的计算机程序产品和第九方面提供的计算机可读存储介质均用于执行本申请实施例所提供的方法。因此，其所能达到的有益效果可参考对应方法中的有益效果，此处不再赘述。

附图说明

图1是本申请实施例提供的一种电子设备的结构示意图；

图2是本申请实施例提供的一种设备唤醒的场景示意图；

图3是本申请实施例提供的一种通信系统的结构示意图；

图4是本申请实施例提供的另一种通信系统的结构示意图；

图5是本申请实施例提供的一种设备唤醒的场景示意图；

图6是本申请实施例提供的智能眼镜采集到的图像的示意图；

图7是本申请实施例提供的一种设备唤醒的场景示意图；

图8是本申请实施例提供的智能眼镜采集到的图像的示意图；

图9A和图9B是本申请实施例提供的一种设备唤醒的场景示意图；

图10是本申请实施例提供的一种电子设备进入唤醒状态的方法流程图；

图11是本申请实施例提供的一种智能眼镜的结构示意图；

图12是本申请实施例提供的一种设备唤醒方法的流程图。

具体实施方式

下面将结合附图对本申请实施例中的技术方案进行清楚、详尽地描述。其中，在本申请实施例的描述中，除非另有说明，“/”表示或的意思，例如，A/B可以表示A或B；文本中的“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况，另外，在本申请实施例的描述中，“多个”是指两个或多于两个。

以下，术语“第一”、“第二”仅用于描述目的，而不能理解为暗示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征，在本申请实施例的描述中，除非另有说明，“多个”的含义是两个或两个以上。

为了减少语音唤醒电子设备时误唤醒的情况，本申请实施例提供一种设备唤醒方法及相关装置。下面先介绍本申请实施例涉及的电子设备。

图1示例性示出了一种电子设备100的结构示意图。

如图1所示，电子设备100可以包括处理器110，外部存储器接口120，内部存储器121，通用串行总线(universal serial bus，USB)接口130，充电管理模块140，电源管理模块141，电池142，天线1，天线2，移动通信模块150，无线通信模块160，音频模块170，扬声器170A，受话器170B，麦克风170C，耳机接口170D，传感器模块180，按键190，马达191，指示器192，摄像头193，显示屏194，以及用户标识模块(subscriber identification module，SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A，陀螺仪传感器180B，气压传感器180C，磁传感器180D，加速度传感器180E，距离传感器180F，接近光传感器180G，指纹传感器180H，温度传感器180J，触摸传感器180K，环境光传感器180L，骨传导传感器180M等。

可以理解的是，本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中，电子设备100可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件，软件或软件和硬件的组合实现。

处理器110可以包括一个或多个处理单元，例如：处理器110可以包括应用处理器(application processor，AP)，调制解调处理器，图形处理器(graphics processingunit，GPU)，图像信号处理器(image signal processor，ISP)，控制器，存储器，视频编解码器，数字信号处理器(digital signal processor，DSP)，基带处理器，和/或神经网络处理器(neural-network processing unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。

其中，控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号，产生操作控制信号，完成取指令和执行指令的控制。

在一些实施例中，处理器110可包括语音唤醒模块和语音指令识别模块。其中，语音唤醒模块和语音指令识别模块可以集成在不同的处理器芯片中，由不同的芯片执行。例如，语音唤醒模块可以集成在功耗较低的协处理器或DSP芯片中，语音指令识别模块可以集成在AP或NPU或其他芯片中。这样，可以在语音唤醒模块识别到预设的唤醒词后，再启动语音指令识别的模块所在的芯片触发语音指令识别功能，从而节省电子设备的功耗。或者，语音唤醒模块和语音指令识别模块可以集成在相同的处理器芯片中，由同一芯片执行相关功能。例如，语音唤醒模块和语音指令识别模块均可集成在AP芯片或NPU或其他芯片中。

处理器110还可以包括语音指令执行模块。在上述语音指令识别模块识别到语音指令后，语音指令执行模块可以执行语音指令对应的操作。例如，播放音乐、拨打电话、发送短信等等。

可以理解的，包含上述语音唤醒模块、语音指令识别模块和语音指令执行模块的电子设备是具有语音交互能力的电子设备。上述具有语音交互能力可以表示，电子设备可以响应用户的语音指令，并执行该语音指令对应的操作。

处理器110中还可以设置存储器，用于存储指令和数据。在一些实施例中，处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据，可从所述存储器中直接调用。避免了重复存取，减少了处理器110的等待时间，因而提高了系统的效率。

USB接口130是符合USB标准规范的接口，具体可以是Mini USB接口，Micro USB接口，USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电，也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机，通过耳机播放音频。该接口还可以用于连接其他电子设备，例如AR设备等。

充电管理模块140用于从充电器接收充电输入。其中，充电器可以是无线充电器，也可以是有线充电器。在一些有线充电的实施例中，充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中，充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时，还可以通过电源管理模块141为电子设备供电。

电源管理模块141用于连接电池142，充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入，为处理器110，内部存储器121，外部存储器，显示屏194，摄像头193，和无线通信模块160等供电。在其他一些实施例中，电源管理模块141也可以设置于处理器110中。在另一些实施例中，电源管理模块141和充电管理模块140也可以设置于同一个器件中。

电子设备100的无线通信功能可以通过天线1，天线2，移动通信模块150，无线通信模块160，调制解调处理器以及基带处理器等实现。

天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用，以提高天线的利用率。例如：可以将天线1复用为无线局域网的分集天线。在另外一些实施例中，天线可以和调谐开关结合使用。

移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器，开关，功率放大器，低噪声放大器(low noise amplifier，LNA)等。移动通信模块150可以由天线1接收电磁波，并对接收的电磁波进行滤波，放大等处理，传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大，经天线1转为电磁波辐射出去。在一些实施例中，移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中，移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。

无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks，WLAN)(如无线保真(wireless fidelity，Wi-Fi)网络)，蓝牙(bluetooth，BT)，全球导航卫星系统(global navigation satellite system，GNSS)，调频(frequency modulation，FM)，近距离无线通信技术(near field communication，NFC)，红外技术(infrared，IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波，将电磁波信号调频以及滤波处理，将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号，对其进行调频，放大，经天线2转为电磁波辐射出去。

电子设备100通过GPU，显示屏194，以及应用处理器等实现显示功能。GPU为图像处理的微处理器，连接显示屏194和应用处理器。GPU用于执行数学和几何计算，用于图形渲染。处理器110可包括一个或多个GPU，其执行程序指令以生成或改变显示信息。

显示屏194用于显示图像，视频等。在一些实施例中，电子设备100可以包括1个或N个显示屏194，N为大于1的正整数。

电子设备100可以通过ISP，摄像头193，视频编解码器，GPU，显示屏194以及应用处理器等实现拍摄功能。

ISP用于处理摄像头193反馈的数据。例如，拍照时，打开快门，光线通过镜头被传递到摄像头感光元件上，光信号转换为电信号，摄像头感光元件将所述电信号传递给ISP处理，转化为肉眼可见的图像。ISP还可以对图像的噪点，亮度，肤色进行算法优化。ISP还可以对拍摄场景的曝光，色温等参数优化。在一些实施例中，ISP可以设置在摄像头193中。

摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device，CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor，CMOS)光电晶体管。感光元件把光信号转换成电信号，之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB，YUV等格式的图像信号。在一些实施例中，电子设备100可以包括1个或N个摄像头193，N为大于1的正整数。

数字信号处理器用于处理数字信号，除了可以处理数字图像信号，还可以处理其他数字信号。例如，当电子设备100在频点选择时，数字信号处理器用于对频点能量进行傅里叶变换等。

视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样，电子设备100可以播放或录制多种编码格式的视频，例如：动态图像专家组(moving picture experts group，MPEG)1，MPEG2，MPEG3，MPEG4等。

NPU为神经网络(neural-network，NN)计算处理器，通过借鉴生物神经网络结构，例如借鉴人脑神经元之间传递模式，对输入信息快速处理，还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用，例如：图像识别，人脸识别，语音识别，文本理解等。

外部存储器接口120可以用于连接外部存储卡，例如Micro SD卡，实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信，实现数据存储功能。例如将音乐，视频等文件保存在外部存储卡中。

内部存储器121可以用于存储计算机可执行程序代码，所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令，从而执行电子设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中，存储程序区可存储操作系统，至少一个功能所需的应用程序(比如声音播放功能，图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据，电话本等)等。此外，内部存储器121可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件，闪存器件，通用闪存存储器(universal flash storage，UFS)等。

电子设备100可以通过音频模块170，扬声器170A，受话器170B，麦克风170C，耳机接口170D，以及应用处理器等实现音频功能。例如音乐播放，录音等。

音频模块170用于将数字音频信息转换成模拟音频信号输出，也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中，音频模块170可以设置于处理器110中，或将音频模块170的部分功能模块设置于处理器110中。

扬声器170A，也称“喇叭”，用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐，或收听免提通话。

受话器170B，也称“听筒”，用于将音频电信号转换成声音信号。

麦克风170C，也称“话筒”，“传声器”，用于将声音信号转换为电信号。当拨打电话或发送语音信息时，用户可以通过人嘴靠近麦克风170C发声，将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中，电子设备100可以设置两个麦克风170C，除了采集声音信号，还可以实现降噪功能。在另一些实施例中，电子设备100还可以设置三个，四个或更多麦克风170C，实现采集声音信号，降噪，还可以识别声音来源，实现定向录音功能等。

在一些实施例中，麦克风170C可以与低功耗处理器连接。该低功耗处理器中可集成有语音唤醒模块。麦克风170C可以将采集的声音信号发送给该低功耗处理器。低功耗处理器中的语音唤醒模块可以检测该声音信号中是否包含预设的唤醒词。若包含，该低功耗处理器可以唤醒应用处理器。应用处理器中可集成有语音指令识别模块和语音指令执行模块。当应用处理器被唤醒，麦克风170C采集的声音信号可以经过上述低功耗处理器发送给应用处理器。应用处理器中的语音指令识别模块可以识别该声音信号中的语音指令。进一步的，语音指令执行模块可以执行该语音指令对应的操作。

在电子设备100的语音交互功能开启的情况下，麦克风170C和上述低功耗处理器可以实时处于工作状态。由于麦克风170C采集的声音信号需要先经过低功耗处理器判断是否包含预设的唤醒词。在声音信号包含预设的唤醒词的情况下，应用处理器才被唤醒。这可以节省电子设备100的功耗。

耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130，也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform，OMTP)标准接口，美国蜂窝电信工业协会(cellular telecommunications industry association of the USA，CTIA)标准接口。

压力传感器180A用于感受压力信号，可以将压力信号转换成电信号。在一些实施例中，压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多，如电阻式压力传感器，电感式压力传感器，电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A，电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194，电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中，作用于相同触摸位置，但不同触摸操作强度的触摸操作，可以对应不同的操作指令。例如：当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时，执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时，执行新建短消息的指令。

陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中，可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即，x，y和z轴)的角速度。

气压传感器180C用于测量气压。

磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。

加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态，应用于横竖屏切换，计步器等应用。

距离传感器180F，用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中，拍摄场景，电子设备100可以利用距离传感器180F测距以实现快速对焦。

接近光传感器180G可以包括例如发光二极管(LED)和光检测器，例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时，可以确定电子设备100附近有物体。当检测到不充分的反射光时，电子设备100可以确定电子设备100附近没有物体。

环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合，检测电子设备100是否在口袋里，以防误触。

指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁，访问应用锁，指纹拍照，指纹接听来电等。

温度传感器180J用于检测温度。在一些实施例中，电子设备100利用温度传感器180J检测的温度，执行温度处理策略。例如，当温度传感器180J上报的温度超过阈值，电子设备100执行降低位于温度传感器180J附近的处理器的性能，以便降低功耗实施热保护。在另一些实施例中，当温度低于另一阈值时，电子设备100对电池142加热，以避免低温导致电子设备100异常关机。

触摸传感器180K，也称“触控面板”。触摸传感器180K可以设置于显示屏194，由触摸传感器180K与显示屏194组成触摸屏，也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器，以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中，触摸传感器180K也可以设置于电子设备100的表面，与显示屏194所处的位置不同。

骨传导传感器180M可以获取振动信号。在一些实施例中，骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏，接收血压跳动信号。在一些实施例中，骨传导传感器180M也可以设置于耳机中，结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号，解析出语音信号，实现语音功能。

按键190包括开机键，音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入，产生与电子设备100的用户设置以及功能控制有关的键信号输入。

马达191可以产生振动提示。

指示器192可以是指示灯，可以用于指示充电状态，电量变化，也可以用于指示消息，未接来电，通知等。

SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195，或从SIM卡接口195拔出，实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口，N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡，Micro SIM卡，SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同，也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互，实现通话以及数据通信等功能。在一些实施例中，电子设备100采用eSIM，即：嵌入式SIM卡。eSIM卡可以嵌在电子设备100中，不能和电子设备100分离。

电子设备100可以是手机、平板电脑、笔记本电脑、音箱、电视、路由器、可穿戴设备(如智能眼镜、智能手表、智能手环等)、智能家居设备(如冰箱、洗衣机、空调、电灯等)等等。本申请实施例对电子设备100的具体类型不作限定。

现在许多电子设备中安装有语音识别应用，例如语音助手应用。安装有语音助手应用的电子设备具有语音交互功能。其中，当语音交互功能开启，电子设备可以实时采集环境中的声音，并检测声音中是否包含唤醒词。唤醒词可用于唤醒电子设备。上述唤醒电子设备可以表示，触发电子设备调用集成有语音指令识别模块和语音指令执行模块的处理器(如应用处理器)来识别采集到的声音中的语音指令，并执行语音指令对应的操作。

在一些实施例中，电子设备处于休眠状态。该休眠状态可以表示电子设备的应用处理器处于休眠状态。在处于休眠状态时，电子设备的麦克风和低功耗处理器可以实时处于工作状态。当检测到环境中的声音中包含唤醒词，电子设备的应用处理器可以被唤醒来执行语音指令对应的操作(例如音箱在休眠状态时被唤醒并根据用户的语音指令播放音乐)。在一些实施例中，电子设备的应用处理器处于工作状态。其中，电子设备的麦克风和低功耗处理器可以实时处于工作状态。当检测到环境中的声音中包含唤醒词，电子设备的应用处理器可以接收麦克风采集的声音，识别该声音中包含的语音指令并执行语音指令对应的操作(例如音箱在播放音乐时监听到唤醒词并根据用户的语音指令开启空调)。

在一些实施例中，一个房间中包括多个具有语音交互功能的电子设备。如图2所示，一个房间中包括手机、音箱和电视。手机、音箱和电视均具有语音交互功能，且语音交互功能均开启。用户希望通过语音指令指示音箱播放音乐。用户可以说“小艺小艺，我要听歌”。其中，“小艺小艺”为预设的唤醒词。“我要听歌”为语音指令。由于手机、音箱和电视均可以采集环境中的声音，那么这多个电子设备均可以监听到唤醒词。进而，这多个电子设备均可以被唤醒。当被唤醒，这多个电子设备均可以识别到上述语音指令“我要听歌”，并执行该语音指令对应的操作，即播放音乐。

如图2所示，当用户说出“小艺小艺，我要听歌”，手机可以语音回答“没问题”，并调用播放音乐的应用来播放音乐。音箱可以语音回答“没问题”，并调用播放音乐的应用来播放音乐。电视也可以回答“没问题”，并调用播放音乐的应用来播放音乐。可以看出，用户希望唤醒的电子设备是音箱。手机和电视被误唤醒。上述误唤醒会对用户产生干扰，降低用户使用电子设备的语音交互功能的使用体验。

在一种可能的实现方式中，多个具有语音交互功能的电子设备中均存储有设备优先级排序。该设备优先级排序可以为：音箱>电视>平板电脑>手机。这多个电子设备在监听到唤醒词(如“小艺小艺”)之后可以互相通信，并根据上述设备优先级排序确定出这多个电子设备中排序在最前的电子设备，例如电视。进一步的，电视可以对上述唤醒词进行应答，并唤醒应用处理器来执行用户的语音指令。电视对上述唤醒词进行应答的方法可以例如是语音回答“我在”。上述多个电子设备中排序在后的电子设备不会对上述唤醒词进行应答。

本申请实施例对上述设备优先级排序不作具体限定。

上述多个电子设备在监听到唤醒词之后互相通信的方法可以是基于蓝牙的通信方法。那么上述多个电子设备之间的距离在蓝牙通信的距离范围内。其中，当用户说出唤醒词，这里多个电子设备均可以监听到该唤醒词。本申请实施例对上述多个电子设备在协商哪个电子设备对上述唤醒词进行响应时的通信方法不作限定。

上述方法可以减少多个电子设备均对唤醒词进行应答的情况。但根据上述设备优先级排序，这多个电子设备协商确定出的对唤醒词进行应答的电子设备不一定是用户希望唤醒的电子设备。也即是说，上述方法难以满足用户的实际需求。利用上述方法对电子设备进行唤醒仍可能存在误唤醒的问题。

本申请实施例提供一种设备唤醒方法。在该方法中，用户可以借助智能眼镜来唤醒自己希望唤醒的电子设备。具体的，智能眼镜处于佩戴状态时，可以检测用户是否需要唤醒其它电子设备。若检测到用户需要唤醒其它电子设备，智能眼镜可以进行图像采集。该采集得到的图像即为用户视野范围内的图像。智能眼镜可以对该图像进行图像识别处理，确定出该图像中包含的电子设备类型。智能眼镜可以利用排序算法对该图像中包含的电子设备进行优先级排序。智能眼镜可以获取本地设备列表，并向上述优先级排序最高且存在于本地设备列表中的电子设备发送唤醒指令。具有语音交互功能的电子设备接收到上述唤醒指令后可以被唤醒，而其它未接收到唤醒指令的电子设备则不响应用户的语音指令。

可以理解的，用户希望唤醒一个电子设备设备时，通常会望向这一个电子设备，并说出语音指令。那么，若用户佩戴有智能眼镜，智能眼镜可以采集用户视野范围内的图像，并根据该图像判断用户希望唤醒的电子设备是哪一个。当确定了用户希望唤醒的电子设备，智能眼镜可以向该电子设备发送唤醒指令。当接收到该唤醒指令，电子设备可以被唤醒，识别用户的语音指令并执行该语音指令对应的操作。

由上述方法可以看出，在一个存在多个具有语音交互功能的电子设备的场景中，用户可以借助智能眼镜来唤醒自己希望唤醒的电子设备。这可以有效减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

上述方法涉及智能眼镜与其它电子设备的通信，为了便于理解本申请提供的设备唤醒方法，下面介绍本申请提供的一种通信系统。

图3示例性示出了通信系统10的示意图。

通信系统10可以包括多个电子设备，这多个电子设备之间可以建立有通信连接108。例如，如图3所示，通信系统10可以包括智能眼镜101、手机102、耳机103、平板电脑104、路由器105、音箱106和电视107。不限于图3所示的电子设备，通信系统10还可以包括其它类型的电子设备。例如，桌面型计算机、膝上型计算机、手持计算机、增强现实(augmentedreality，AR)设备、虚拟现实(virtual reality，VR)设备、人工智能(artificialintelligence,AI)设备、车机、游戏机、其他智能穿戴设备等，还可以包括物联网(internetof things，IOT)设备或智能家居设备如智能热水器、智能灯具、智能空调等等。本申请实施例对此不作限定。这些电子设备的结构可以参考前述图1所示电子设备100的结构示意图。

在通信系统10中，各电子设备之间可建立有通信连接108，该通信连接108可以为近场通信连接。该近场通信连接可以是有线连接，如通用串行总线(uniersalserialbus，USB)连接，或者是无线连接，如蓝牙通信连接、Wi-Fi通信连接、无线保真点对点(wirelessfidelity peer-to-peer，Wi-Fi P2P)通信连接等等。本申请实施例对上述近场通信连接的具体方式不作限定。

基于图3所示的通信系统10，这里对本申请实施例涉及的本地设备列表进行介绍。

在一些实施例中，本地设备列表可包含接入同一个通信网络的电子设备。例如一个家庭中接入同一个家庭Wi-Fi的电子设备。本地设备列表中的多个电子设备之间是建立有通信连接的。示例性的，上述通信系统10具有一个本地设备列表。通信系统10中包含的电子设备即为该本地设备列表中的电子设备。即加入上述通信连接108的电子设备可以被增加至上述本地设备列表中。退出上述通信连接108的电子设备可以从上述本地设备列表中移除。该本地设备列表可以被存储至通信系统10包含的一个或多个电子设备中，或者可以被存储至云端服务器中。

通信系统10中的电子设备均可以获取、更新该本地设备列表。例如，通信系统10中的任意一个电子设备均可以根据自己检测到加入或退出通信连接108的电子设备的情况更新本地设备列表。若上述本地设备列表存储在通信系统10的多个电子设备中，本地设备列表可以在这多个电子设备中同步被更新。这样，通信系统10中的电子设备获取到的本地设备列表是一致的。

在一些实施例中，本地设备列表可以是由上述通信系统10中的一个电子设备创建的。该一个电子设备可以例如是手机102。增加至上述本地设备列表中的电子设备可以是经过可信身份认证的电子设备。上述可信身份认证可以是已存在于本地设备列表中电子设备(如手机102)实现的。例如，响应于同意将音箱106增加至本地设备列表中的用户操作，手机102可以将音箱106增加至本地设备列表中。本申请实施例对上述可信身份认证的具体实现方式不作限定。上述可信身份认证的过程可以例如是为电子设备配网的实现过程。

本申请实施例对上述通信系统10中各电子设备的通信连接方式不作限定。

在一种可能的实现方式中，通信系统10中的电子设备可以建立如图4所示的通信连接108。其中，手机102、平板电脑104、音箱106和电视107可以与路由器105建立Wi-Fi通信连接。上述与路由器105建立Wi-Fi通信连接的电子设备可以通过路由器105接入网络，实现上网的功能。也即是说，手机102、平板电脑104、路由器105、音箱106和电视107处于同一个局域网(如同一个家庭Wi-Fi)中。本地设备列表中的电子设备可包含在这一个局域网中的电子设备。智能眼镜101和耳机103可以与手机102建立蓝牙通信连接。当智能眼镜101和耳机103通过蓝牙的方式与手机102连接，而手机102处于上述局域网中，手机102可以更新上述本地设备列表。具体的，手机102可以将智能眼镜101和耳机103增加至本地设备列表中。那么，本地设备列表中的电子设备可以包括图4所示的智能眼镜101、手机102、耳机103、平板电脑104、路由器105、音箱106和电视107。

若智能眼镜101结束与手机102的蓝牙通信连接，而手机102处于上述局域网中，手机102可以更新上述本地设备列表。具体的，手机102可以将智能眼镜101从本地设备列表中移除。若手机102结束与路由器105的Wi-Fi通信连接(如用户拿着手机出门后)，而路由器105处于上述局域网中，路由器105可以更新上述本地设备列表。具体的，路由器105可以将手机105从本地设备列表中移除。其中，在手机102被移除本地设备列表后，仍存在与本地设备列表中的电子设备可以检测通过手机102加入通信连接108的电子设备(如智能眼镜101、耳机103)是否与通信系统10中手机102以外的电子设备连接。若检测出智能眼镜101和耳机103仅与手机102连接，智能眼镜101和耳机103可以从本地设备列表中被移除。若检测出智能眼镜101和耳机103还与其它电子设备(如平板电脑104)连接，智能眼镜101和耳机103仍可存在于本地设备列表中。

由上述实现方式可以看出，本地设备列表中的电子设备可以是基于路由器105所建立的局域网中的电子设备(如手机102、平板电脑104、音箱106、电视107)，以及与该局域网中的电子设备通过其它无线连接的方法连接的电子设备(如智能眼镜101、耳机103)。

在一些实施例中，手机102中安装有用于控制其它电子设备的应用(application，APP)。该APP可以例如是智能家居APP。本地设备列表中的电子设备可以是手机102可通过该智能家居APP控制的电子设备(如路由器105、音箱106、电视107)，以及其它与手机102连接但不可通过该智能家居APP控制的电子设备(如智能眼镜101、耳机103)。在一种可能的实现方式中，手机102以及可通过智能家居APP控制的电子设备均与路由器105连接。响应于作用在智能家居APP的用户操作，手机102可以通过路由器105向上述可通过智能家居APP控制的电子设备发送控制指令。可选的，手机102也可以直接与上述可通过智能家居APP控制的电子设备通信，而无需路由器105转发。本申请实施例对手机102通过智能家居APP控制其它电子设备的实现方式不作限定。

可以理解的，图3和图4所示的通信系统的结构示意图仅为本申请实施例的示例性说明，不应对本申请构成限定。

下面具体介绍本申请实施例涉及的用户借助智能眼镜唤醒电子设备的场景示意图。

如图5所示，一个家庭中的电子设备可包括智能眼镜101、手机102、路由器105、音箱106、电视107。其中，手机102、音箱106和电视107均与路由器105建立Wi-Fi通信连接。用户佩戴有智能眼镜101。智能眼镜101与手机102建立蓝牙通信连接。由前述实施例可知，智能眼镜101、手机102、路由器105、音箱106、电视107可以组成一个通信系统。该通信系统具有的本地设备列表中的电子设备包含智能眼镜101、手机102、路由器105、音箱106、电视107。

在图5所示的场景中，用户希望唤醒音箱106并通过语音指令指示音箱106播放音乐。其中，用户佩戴智能眼镜101并望着音箱106说出“小艺小艺，我要听歌”。手机102、音箱106和电视107均为具有语音交互功能且语义交互功能开启的电子设备。用于唤醒手机102、音箱106和电视107的唤醒词是相同的，例如均为“小艺小艺”。手机102、音箱106和电视107均可以通过麦克风采集用户的语音输入。上述语音输入中包括唤醒词“小艺小艺”和语音指令“我要听歌”。

在一种可能的实现方式中，当监听到唤醒词，手机102、音箱106和电视107均可以从唤醒词监听状态进入预唤醒状态。

上述唤醒词监听状态可以为电子设备采集环境声音，并识别环境声音中是否包含唤醒词的状态。在上述唤醒词监听状态，电子设备的麦克风和低功耗处理器可以实时工作。其中麦克风可用于采集环境声音。低功耗处理器可用于识别环境声音中是否包含唤醒词。

上述预唤醒状态可以为电子设备监听到唤醒词后，检测本地设备列表中是否存在智能眼镜且智能眼镜是否被佩戴的状态。也即是说，当监听到唤醒词，手机102、音箱106和电视107可以检测本地设备列表中是否存在智能眼镜101以及智能眼镜101是否被佩戴，而不是响应该唤醒词立即被唤醒。在上述预唤醒状态，电子设备可以等待接收唤醒指令，且不对监听到的唤醒词、语音指令等进行响应。

需要进行说明的，在未处于上述唤醒状态时(如处于上述唤醒词监听状态)，若接收到唤醒指令，电子设备可以进入唤醒状态。

若检测到本地设备列表中不存在智能眼镜101，例如家庭中不存在智能眼镜101或智能眼镜101未与手机102连接，手机102、音箱106和电视107均可以从上述预唤醒状态进入唤醒状态。或者，手机102、音箱106和电视107之间可以通信，协商并确定出一个电子设备来响应上述唤醒词。其中，被选取出的这一个电子设备可以从上述预唤醒状态进入唤醒状态。其它电子设备则可以从上述预唤醒状态再次进入上述唤醒词监听状态。即其它电子设备不响应上述唤醒词。

上述唤醒状态可以表示电子设备的语音识别应用处于被唤醒的状态。在上述唤醒状态，电子设备可以启动语音识别应用。具体的，电子设备可以启动应用处理器来识别语音指令，并执行语音指令对应的操作。需要进行说明的是，在上述唤醒状态，电子设备也可以实时监听环境声音中是否包含唤醒词。在一种可能的实现方式中，电子设备进入唤醒状态后，若在预设时间段内未在环境声音中识别到语音指令，电子设备可以从唤醒状态进入唤醒词监听状态。

若检测到本地设备列表中存在智能眼镜101，但智能眼镜101未被佩戴，手机102、音箱106和电视107均可以从上述预唤醒状态进入唤醒状态。或者，手机102、音箱106和电视107之间可以通信，协商并确定出一个电子设备来响应上述唤醒词。

可以理解的，在上述本地设备列表中不存在智能眼镜101的情况下，或者在本地设备列表中存在智能眼镜101但智能眼镜101未被佩戴的情况下，用户均无法借助智能眼镜101来唤醒自己希望唤醒的电子设备。那么具有语音交互功能的电子设备在监听到唤醒词之后可能均会被唤醒，或者协商确定出一个最有可能是用户希望唤醒的电子设备来响应唤醒词。

若检测到本地设备列表中存在智能眼镜101，且智能眼镜101处于佩戴状态，手机102、音箱106和电视107可以等待唤醒指令。其中，手机102、音箱106和电视107可以在预设时间段内等待唤醒指令。若在预设时间段内接收到唤醒指令，则接收到唤醒指令的电子设备可以从预唤醒状态进入唤醒状态。若在预设时间段内未接收到唤醒指令，则电子设备可以从预唤醒状态再次进入唤醒词监听状态。

智能眼镜101处于佩戴状态时，可以检测用户是否需要唤醒其它电子设备。

在一种可能的实现方式中，智能眼镜101具有麦克风和低功耗处理器。在处于佩戴状态时，智能眼镜101的麦克风和低功耗处理器可以处于工作状态。其中智能眼镜101可以通过麦克风采集环境声音，并通过低功耗处理器识别该环境声音中是否包含唤醒词。当监听到唤醒词，智能眼镜101可以确定用户需要唤醒其它电子设备。进一步的，智能眼镜101可以通过摄像头采集图像。该采集得到的图像即为用户视野范围内的图像。智能眼镜可以对该图像进行图像识别处理，确定出该图像中包含的电子设备类型。

在上述用户戴智能眼镜101并望着音箱106说出“小艺小艺，我要听歌”的场景中，智能眼镜101采集到的图像可以如图6所示。图像中的电子设备包含音箱106和电视107。其中，音箱106位于图像的中央。电视107位于图像的右边缘。智能眼镜可以利用排序算法对该图像中的电子设备进行优先级排序。例如，上述优先级排序得到的结果为音箱106的优先级高于电视107的优先级。

进一步的，智能眼镜101可以获取本地设备列表，并向上述优先级排序最高且存在于本地设备列表中的电子设备发送唤醒指令。由于音箱106和电视107均存在于本地设备列表，且在上述优先级排序中，音箱106的优先级高于电视107的优先级，智能眼镜101可以确定音箱106为用户希望唤醒的电子设备。那么，智能眼镜101可以向音箱106发送唤醒指令。

如图5所示，当接收到唤醒指令，音箱106可以从上述预唤醒状态进入唤醒状态。其中，音箱106可以通过语音指令识别模块来识别唤醒词之后的声音中所包含的信息。上述唤醒词之后的声音中包含语音指令“我要听歌”。音箱106的语音指令识别模块可以识别该语音指令。然后，音箱106可以通过语音指令执行模块执行该语音指令对应的操作，即播放音乐。示例性的，音箱106可以语音回答“没问题”，并开始播放音乐。本申请实施例对上述音箱106语音回答的内容不作限定。

上述智能眼镜对图像进行图像识别处理的方法、利用排序算法对图像中的电子设备进行优先级排序的方法将在后续实施例中具体说明，这里先不展开介绍。

在一种可能的实现方式中，由于智能眼镜101与手机102连接，智能眼镜101可以将图像中包含的电子设备的优先级排序的结果发送给手机102。手机102可以获取本地设备列表，并根据本地设备列表和上述优先级排序的结果确定用户希望唤醒的电子设备。上述用户希望唤醒的电子设备即为上述优先级排序最高且存在于本地设备列表中的电子设备。手机可以向用户希望唤醒的电子设备发送唤醒指令。其中，手机102可以通过路由器102向用户希望唤醒的电子设备发送唤醒指令，或者直接向用户希望唤醒的电子设备发送唤醒指令。

本申请实施例对智能眼镜101或手机102向用户希望唤醒的电子设备发送唤醒指令的方法不作限定。

可选的，上述对图像进行图像识别处理的过程和/或利用排序算法对图像中的电子设备进行优先级排序的过程也可以由手机102来实现。上述方法可以有效节省智能眼镜101的计算资源和功耗。

在另一种可能的实现方式中，智能眼镜101可以与路由器105连接。智能眼镜101在检测到用户需要唤醒其它电子设备设备时，可以采集图像。当得到图像，上述对图像进行图像识别处理的过程和/或利用排序算法对图像中的电子设备进行优先级排序的过程和/或确定用户希望唤醒的电子设备并向用户希望唤醒的电子设备发送唤醒指令的过程也可以由路由105来实现。这可以有效节省智能眼镜101的计算资源和功耗。

由图5和图6所示的场景可以看出，当智能眼镜处于佩戴状态时，具有语音交互功能的电子设备在监听到唤醒词后不会立即进入唤醒状态。智能眼镜可用于判断用户希望唤醒的电子设备是哪个。当确定了用户希望唤醒的电子设备，智能眼镜或与智能眼镜连接的电子设备(如手机或路由器)可以向用户希望唤醒的电子设备发送唤醒指令。接收到唤醒指令的电子设备可以进入唤醒状态。而监听到唤醒词但未接收到唤醒指令的电子设备则不进入唤醒状态。利用上述场景中的设备唤醒方法，用户可以借助智能眼镜来唤醒自己希望唤醒的电子设备。这可以有效减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

图7和图8示例性示出了本申请实施例涉及的另一个用户借助智能眼镜唤醒电子设备的场景。

如图7所示，一个家庭中的电子设备可包括智能眼镜101、手机102、路由器105、音箱106、电视107。这多个电子设备之间的连接关系可以参考前述图5所示实施例的介绍。这里不再赘述。

在图7所示的场景中，用户已经借助智能眼镜101唤醒音箱106，并通过语音指令指示音箱106播放音乐。进一步的，用户希望唤醒手机102并通过语音指令指示手机102发送短信。如图7所示，音箱106已经响应用户用于播放音乐的语音指令(如“我要听歌”)播放音乐。用户佩戴智能眼镜101望着手机102说出“小艺小艺，给老张发短信”。手机102、音箱106和电视107均可以通过麦克风采集用户的语音输入。上述语音输入中包括唤醒词“小艺小艺”和语音指令“给老张发短信”。

在一种可能的实现方式中，在监听到唤醒词之前，手机102、音箱106和电视107均处于唤醒词监听状态。当监听到唤醒词，手机102、音箱106和电视107均可以从唤醒词监听状态进入预唤醒状态。

在另一种可能的实现方式中，音箱106在图5所示的场景中接收到唤醒指令进入唤醒状态后，还未退出唤醒状态。即在监听到图7所示的唤醒词之前，手机102和电视107处于唤醒词监听状态。音箱106处于唤醒状态。当监听到唤醒词，手机和电视107可以从唤醒词监听状态进入预唤醒状态。音箱106可以从唤醒状态进入预唤醒状态。

在该预唤醒状态，手机102、音箱106和电视107均可以获取本地设备列表，检测出本地设备列表中存在智能眼镜101且智能眼镜101处于佩戴状态。那么，手机102、音箱106和电视107可以等待唤醒指令，而不立即进入唤醒状态。

智能眼镜101检测到用户需要唤醒其它电子设备后，确定本地设备列表中哪一个电子设备是用户希望唤醒的电子设备的方法可以参考前述图5所示的实施例。

其中，智能眼镜101可以采集图像。该图像即为用户视野范围内的图像。如图8所示，该图像中的电子设备包括手机102。参考前述实施例的方法，手机102即为用户希望唤醒的电子设备。

手机102可以接收到唤醒指令。当接收到唤醒指令，手机102可以进入唤醒状态，识别唤醒词之后的声音中所包含的信息。上述唤醒词之后的声音中包含语音指令“给老张发短信”。手机102的语音指令识别模块可以识别该语音指令。然后，手机102可以通过语音指令执行模块执行该语音指令对应的操作，即发送短信。示例性的，手机102可以在联系人应用中查找是否存在联系人名称为“老张”的联系方式。若存在，手机102可以语音回答“好的，请说短信内容”。本申请实施例对上述手机102语音回答的内容不作限定。

音箱106和电视107在进入预唤醒状态后的预设时间段内未接收到唤醒指令，可以从预唤醒状态进入唤醒词监听状态。

在一些实施例中，智能眼镜101可以将采集到的图像发送给手机102，并指示手机102确定哪个电子设备为用户希望唤醒的电子设备。手机102可以对图像进行图像识别处理，并利用排序算法对识别出来包含在图像中的电子设备进行优先级排序，来确定用户希望唤醒的电子设备。若手机102确定出用户希望唤醒的电子设备为自己(即手机102)，手机102可以进入唤醒状态，而不用发送唤醒指令。若手机102确定出用户希望唤醒的电子设备不是自己，手机102可以向确定出的用户希望唤醒的电子设备发送唤醒指令。

由图7和图8所示的场景可以看出，用户可以借助智能眼镜唤醒自己希望唤醒的电子设备。这可以有效减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

在一些实施例中，用户在佩戴智能眼镜101时，可以通过触碰智能眼镜101的预设位置(如镜腿的一个位置)来触发智能眼镜101识别自己希望唤醒的电子设备，并向自己希望唤醒的电子设备发送唤醒指令。其中，用户可以在触碰智能眼镜101的预设位置后直接说出语音指令，而不用说出唤醒词。接收到上述唤醒指令的电子设备可以识别用户的语音指令并执行该语音指令对应的操作。上述方法不仅可以减少误唤醒的情况，而且可以简化用户通过语音操控电子设备的用户操作，提高用户的使用体验。

图9A和图9B示例性示出了本申请实施例涉及的另一个用户借助智能眼镜唤醒电子设备的场景。

如图9A所示，一个家庭中的电子设备可包括智能眼镜101、手机102、路由器105、音箱106、电视107。这多个电子设备之间的连接关系可以参考前述图5所示实施例的介绍。这里不再赘述。

在图9A和图9B所示的场景中，用户希望唤醒音箱106并通过语音指令指示音箱106播放音乐。其中，用户可以佩戴智能眼镜101，望着音箱106并触碰智能眼镜101的预设位置(如镜腿上的一个位置)。

在一种可能的实现方式中，当检测到作用在智能眼镜101的预设位置的触碰操作，智能眼镜101可以确定用户需要唤醒其它电子设备。进一步的，智能眼镜101可以通过摄像头采集图像。该图像即为用户视野范围内的图像。智能眼镜可以对该图像进行图像识别处理，确定出该图像中包含的电子设备类型。进一步的，智能眼镜可以利用排序算法对该图像中的电子设备进行优先级排序。智能眼镜101在图9A所示的场景采集得到的图像可以参考前述图6所示的图像(包含音箱106和电视107)。例如，上述优先级排序得到的结果为音箱106的优先级高于电视107的优先级。

本申请实施例对上述智能眼镜101的预设位置不作限定。

智能眼镜101可以获取本地设备列表，并向上述优先级排序最高且存在与本地设备列表中的电子设备发送唤醒指令。由于音箱106和电视107均存在于本地设备列表，且在上述优先级排序中，音箱106的优先级高于电视107的优先级，智能眼镜101可以确定音箱106为用户希望唤醒的电子设备。那么，智能眼镜101可以向音箱106发送唤醒指令。

在一种可能的实现方式中，在未监听到唤醒词但接收到上述唤醒指令的情况下，电子设备可以直接进入唤醒状态。如图9A所示，手机102、音箱106和电视107均处于唤醒词监听状态。当接收到上述来自智能眼镜101的唤醒指令，音箱106可以进入唤醒状态。

当进入唤醒状态，音箱106可以通过语音指令识别模块识别接收到唤醒指令后的环境声音中的信息。若未从环境声音中识别出语音指令，音箱106可以语音回答“我在”，来提示用户自己已被唤醒，可以执行用户的语音指令。本申请实施例对上述音箱106接收到唤醒指令后的语音回答的内容不作限定。若从环境声音中识别出语音指令，如“我要听歌”，音箱106可以语音回答“没问题”，并开始播放音乐。

如图9B所示，用户听到音箱106语音回答“我在”之后，可以向音箱106下发语音指令“我要听歌”。音箱106可以通过语音指令识别模块识别该语音指令，并通过语音指令执行模块执行该语音指令对应的操作，即播放音乐。例如，音箱106在识别到语音指令“我要听歌”之后，可以语音回答“没问题”，并开始播放音乐。

可选的，当进入唤醒状态，音箱106可以通过语音指令识别模块识别从接收到唤醒指令之前的时刻A开始，采集到的环境声音中的信息。示例性的，用户可能在望着音箱106并触摸智能眼镜101的预设位置的同时，说出语音指令“我要听歌”。也即是说，用户可能在音箱106接收到唤醒指令之前就说出了语音指令。那么，音箱106从接收到唤醒指令之前的一段时间内开始采集的环境声音中进行语音指令识别，可以减少语音指令漏识别的情况，提高用户的使用体验。

需要进行说明的是，智能眼镜101可以与手机102或与路由器105连接。上述对图像进行图像识别处理的过程和/或利用排序算法对图像中的电子设备进行优先级排序的过程也可以由手机102或由路由器105来实现。这可以有效节省智能眼镜101的计算资源和功耗。

由上述图9A和图9B所示的场景可知，用户希望通过语音控制电子设备时，可以佩戴智能眼镜望着该电子设备，并触碰智能眼镜的预设位置，说出语音指令。智能眼镜在确定用户希望唤醒其它电子设备时可以判断本地设备列表中哪一个电子设备是用户希望唤醒的电子设备，并唤醒用户希望唤醒的电子设备。在该场景中用户可直接下发语音指令而无需说出唤醒词。这不仅可以减少误唤醒的情况，而且可以简化用户通过语音操控电子设备的用户操作，提高用户的使用体验。

在一些实施例中，用户在佩戴智能眼镜101时，可以通过触碰智能眼镜101的预设位置(如镜腿的一个位置)来触发智能眼镜101识别自己希望唤醒的电子设备。并且，用户可以在说出语音指令之前，说出唤醒词。那么，接收到唤醒指令的电子设备可以进入唤醒状态。若监听到唤醒词，进入唤醒状态的电子设备可以通过语音指令识别模块识别唤醒词之后的声音中是否包含语音指令。进一步的，当识别到语音指令，该电子设备可以通过语音指令执行模块执行该语音指令对应的操作。

在一些实施例中，当监听到唤醒词，智能眼镜101可以采集图像，并根据该图像确定用户希望唤醒的电子设备。在用户A和用户B均在家中，且用户A佩戴智能眼镜，用户B说出唤醒词进行设备唤醒的场景下，智能眼镜101采集的图像中可能不存在电子设备。当监听到唤醒词(即用户B的语音输入)，智能眼镜101可以采集图像，并对该图像进行图像识别处理。当识别到图像中不存在电子设备，智能眼镜101可以向本地设备列表中的电子设备(如手机102、音箱106、电视107等)发送指示消息。该指示消息可用于指示智能眼镜101将不会发送唤醒指令。当监听到上述唤醒词(即用户B的语音输入)，语音交互功能开启的电子设备(如手机102、音箱106、电视107等)可以查看本地设备列表中是否包含智能眼镜，并判断智能眼镜是否处于佩戴状态。若本地设备列表中存在智能眼镜且智能眼镜处于佩戴状态，语音交互功能开启的电子设备可以等待唤醒指令。当接收到上述来自智能眼镜的指示消息，语音交互功能开启的电子设备可以均进入唤醒状态，或者语音交互功能开启的电子设备中的一个进入唤醒状态。示例性的，语音交互功能开启的电子设备可以根据接收到包含唤醒词的声音信号的强度，协商选取出接收到包含唤醒词的声音信号的强度最大的电子设备。该接收到包含唤醒词的声音信号强度最大的电子设备可以进入唤醒状态。而其它设备可以从预唤醒状态进入唤醒词监听状态。

也即是说，若未佩戴智能眼镜的用户通过唤醒词来唤醒设备，且佩戴智能眼镜的用户的视野范围不存在语音交互功能开启的电子设备，语音交互功能开启的电子设备中至少有一个电子设备可以响应上述唤醒词进入唤醒状态。这样可以避免未佩戴智能眼镜的用户与佩戴智能眼镜的用户处于同一个环境时，未佩戴智能眼镜的用户无法通过唤醒词来唤醒设备的情况。

由前述实施例可知，具有语音交互功能且语音交互功能处于开启状态的电子设备可以时时监听环境声音中是否包含唤醒词。当监听到唤醒词，电子设备可以进入预唤醒状态。

下面具体介绍电子设备监听环境声音中是否包含唤醒词的实现方法。

在一些实施例中，电子设备可以通过麦克风采集环境声音。其中，当用户在电子设备附近说出唤醒语音(如“小艺小艺”)，环境声音中可包含唤醒语音。在采集到该环境声音后，电子设备可以从该环境声音中分离出用户的唤醒语音。接着，电子设备可以从该唤醒语音中，利用声学模型从用户的语音信号中解码出音素序列。在从该唤醒语音中解码出音素序列后，电子设备可以判断该解码出的音素序列是否与已存储的唤醒词音素序列匹配。若是，则表明该唤醒语音中包含唤醒词。当确定环境声音中包含唤醒词，电子设备可以进入预唤醒状态。本申请实施例对上述唤醒语音不作具体限定。

在另一些实施例中，电子设备可以通过麦克风采集环境声音。其中，当用户在电子设备附近说出唤醒语音(如“小艺小艺”)，环境声音中可包含唤醒语音。在采集到该环境声音后，电子设备可以从该环境声音中分离出用户的唤醒语音。接着，电子设备可以从该唤醒语音中，利用声学模型从用户的语音信号中解码出音素序列。然后，通过语音模型以及语音模型的发音字典，电子设备可以从解码出来的音素序列中进一步解码出文字信息。在解码出文字信息后，电子设备可以判断从唤醒语音中解码出的文字信息是否包含已存储的唤醒词文本。若是，则表明该唤醒语音中包含唤醒词。当确定环境声音中包含唤醒词，电子设备可以进入预唤醒状态。

在一种可能的实现方式中，电子设备可以从用户的唤醒语音中提取出唤醒词和用户的声纹特征。当唤醒词与已存储的唤醒词模板匹配，且用户的声纹特征与已存储的声纹特征模板匹配时，电子设备可以进入预唤醒状态。这可以实现由特定的用户才能唤醒电子设备并通过语音指令控制电子设备，提高了电子设备的信息安全。

本申请实施例对电子设备监听环境声音中是否包含唤醒词的具体方法不作限定。

在一些实施例中，处于唤醒词监听状态或处于预唤醒状态的电子设备在接收到唤醒指令后可以进入唤醒状态。上述唤醒指令可以是由智能眼镜或者其它与智能眼镜建立有通信连接的电子设备发送的。上述唤醒指令可用于指示电子设备进入唤醒状态。

在唤醒状态，电子设备可以启动语音识别应用。具体的，启动语音识别应用可以为电子设备启动应用处理器中的语音指令识别模块和语音指令执行模块。电子设备可以通过语音指令识别模块来识别环境声音中用户的语音指令，并通过语音指令执行模块来执行语音指令对应的操作。电子设备在唤醒状态也可实时监听环境声音中是否包含唤醒词。若处于唤醒状态的电子设备监听到唤醒词，该电子设备可以从唤醒状态进入预唤醒状态。

可以理解的，处于唤醒词监听状态和处于唤醒状态的电子设备均可以实时监听环境声音中是否包含唤醒词。但处于唤醒词监听状态的电子设备无法识别用户的语音指令以及执行语音指令对应的用户操作。例如，在处于唤醒词监听状态时，电子设备的应用处理器处于休眠状态。

在一些实施例中，具有语音交互功能且语音交互功能处于开启状态的电子设备在监听到唤醒词后，可以通过判断本地设备列表中是否存在智能眼镜以及智能眼镜是否处于佩戴状态，来确定自己是否立即进入唤醒状态。可以理解的，当本地设备列表中存在智能眼镜且智能眼镜处于佩戴状态时，用户借助智能眼镜唤醒电子设备的可能性较高。若本地设备列表中不存在智能眼镜(如用户没有智能眼镜)或者本地设备列表中存在智能眼镜但智能眼镜未处于佩戴状态，用户借助智能眼镜唤醒电子设备的可能性较低。那么监听到唤醒词进入预唤醒状态的电子设备可以根据本申请实施例提供的通过唤醒词直接唤醒电子设备的方法来确定是否进入唤醒状态。

下面具体介绍本申请实施例提供的电子设备根据是否存在智能眼镜来确定自己是否进入唤醒状态的方法流程图。

如图10所示，该方法可包括步骤S101～S106。其中：

S101、电子设备监听到唤醒词。

电子设备可以为存在于本地设备列表中，语音交互功能处于开启状态的电子设备中的任一个。电子设备采集环境声音并识别环境声音中是否存在唤醒词的实现方法可以参考前述实施例，这里不再赘述。

当监听到唤醒词，电子设备可以进入预唤醒状态。

S102、电子设备查询本地设备列表中是否存在智能眼镜。

在预唤醒状态，电子设备可以获取本地设备列表。本地设备列表更新和存储的方法可以参考前述实施例。示例性的，手机、音箱、电视等电子设备均与路由器连接，接入同一个家庭Wi-Fi。手机、音箱、电视和路由器均存在于一个本地设备列表中。若智能眼镜与手机建立蓝牙通信连接，本地设备列表中包含的电子设备可以增加智能眼镜。这样，电子设备(如手机、音箱、电视)可以查询到本地设备列表中存在智能眼镜。

可以理解的，若用户没有智能眼镜，或者智能眼镜未与本地设备列表中任一个电子设备建立通信连接(如智能眼镜处于关机状态)，那么本地设备列表中不存在智能眼镜。

S103、若查询到本地设备列表中存在智能眼镜，电子设备可以判断智能眼镜是否处于佩戴状态。

可以理解的，智能眼镜处于佩戴状态时采集的图像，可以相当于用户视野范围内的图像。若智能眼镜未处于佩戴状态，那么智能眼镜采集的图像不能认为是用户视野范围内的图像。也即是说，处于佩戴状态的智能眼镜才能较准确地判断出用户希望唤醒的电子设备。

在查询到本地设备列表中存在智能眼镜后，电子设备可以进一步判断智能眼镜是否处于佩戴状态。在一种可能的实现方式中，智能眼镜与手机建立有蓝牙通信连接。音箱、电视等电子设备可以通过手机获取智能眼镜的佩戴状态。其中，手机可以向智能眼镜发送消息，来询问智能眼镜是否处于佩戴状态。

智能眼镜可以进行佩戴检测。示例性的，智能眼镜可以通过陀螺仪传感器和加速度传感器来检测自己的姿态确定自己是否处于佩戴状态。或者，智能眼镜可以通过眼动跟踪技术来确定自己是否处于佩戴状态。本申请实施例对智能眼镜进行佩戴检测的方法不作限定。其中，佩戴检测的具体实现方法可以参考现有技术。本申请实施例对此不作赘述。

响应于上述来自手机用于询问智能眼镜是否处于佩戴状态的消息，智能眼镜可以将佩戴检测的结果发送给手机。这样，手机、音箱、电视等电子设备可以获取智能眼镜的佩戴状态。

在一些实施例中，步骤S103是可选的。示例性的，电子设备在确定本地设备列表中存在智能眼镜后，可以直接执行下述步骤S104。

S104、若智能眼镜处于佩戴状态，电子设备可以判断在预设时间段内是否接收到唤醒指令。

当判断出智能眼镜处于佩戴状态，电子设备可以等待唤醒指令。其中，智能眼镜在确定用户希望唤醒的电子设备后，可以向用户希望唤醒的电子设备发送唤醒指令。

在一些实施例中，电子设备可以在判断出智能眼镜处于佩戴状态后，等待预设时间段。若在预设时间段内接收到唤醒指令，电子设备可以执行下述步骤S105。若在预设时间段内未接收到唤醒指令，电子设备可以执行下述步骤S106。本申请实施例对上述预设时间段的长度不作限定。

S105、若在预设时间段内接收到唤醒指令，或者若本地设备列表中不存在智能眼镜，或者若本地设备列表中存在智能眼镜但智能眼镜未处于佩戴状态，电子设备可以进入唤醒状态。

若电子设备在预设时间段内接收到唤醒指令，则该电子设备是目标唤醒设备(即用户希望唤醒的电子设备)。响应于唤醒指令，电子设备可以进入唤醒状态。

在本地设备列表中不存在智能眼镜的情况下，或者在本地设备列表中存在智能眼镜但智能眼镜未处于佩戴状态的情况下，用户不会借助智能眼镜来唤醒其它电子设备。那么，响应于监听到的唤醒词，电子设备可以进入唤醒状态。

可选的，若本地设备列表中不存在智能眼镜，或者若本地设备列表中存在智能眼镜但智能眼镜未处于佩戴状态，监听到唤醒词的多个电子设备之间可以通信，协商确定这多个电子设备中的一个电子设备进入唤醒状态，其它电子设备可以不进入唤醒状态。

在一种可能的实现方式中，这多个电子设备可以确定自己监听到唤醒词对应的声音信号的强度。可以理解的，一个电子设备接收到的声音信号的强度越大，这一个电子设备与用户之间的距离越近。这多个电子设备均可以互相发送包含自己接收到的声音信号的强度的信息。进一步的，这多个电子设备可以协商确定出接收到的声音信号的强度最大的电子设备。该接收到的声音信号的强度最大的电子设备可以进入唤醒状态，其它电子设备可以不进入唤醒状态。

本申请实施例对电子设备在判断出用户不会通过智能眼镜来唤醒电子设备的情况下(如本地设备列表中不存在智能眼镜的情况，或者本地设备列表中存在智能眼镜但智能眼镜未处于佩戴状态的情况)，响应监听到的唤醒词的方法不作限定。其中，具体的实现方法可以参考本申请实施例提供的一个环境内存在多个语音交互功能开启的电子设备时，这多个电子设备响应监听到的唤醒词的实现方法。本申请实施例对此不作赘述。

S106、若在预设时间段未接收到唤醒指令，电子设备可以进入唤醒词监听状态。

若电子设备判断出智能眼镜处于佩戴状态，但在预设时间段内未接收到唤醒指令，则该电子设备不是目标唤醒设备。该电子设备可以从预唤醒状态进入唤醒词监听状态。

由上述图10所示的方法可知，语音交互功能开启的电子设备在监听到唤醒词后，可以先判断用户是否会借助智能眼镜进行设备唤醒。若判断出用户会借助智能眼镜进行设备唤醒，电子设备可以等待唤醒指令。若判断出用户不会借助智能眼镜进行设备唤醒，电子设备可以对监听到的唤醒词进行响应。这样，当用户佩戴有智能眼镜时，可以借助智能眼镜唤醒自己希望唤醒的电子设备。当用户未佩戴智能眼镜时，可以通过唤醒词直接唤醒电子设备。

在一些实施例中，具有语音交互功能的电子设备上可具有智能唤醒开关。或者，用于控制上述具有语音交互功能的电子设备上的智能家居APP中具有智能唤醒控件。该智能唤醒控件可用于关闭或者开启上述智能唤醒开关。其中，当上述智能唤醒开关开启，电子设备可以在监听到唤醒词后执行如图10所示的方法。这样，无论用户是否佩戴智能眼镜，均可方便地唤醒电子设备。其中，借助智能眼镜，用户可以更准确地唤醒自己希望唤醒的电子设备。

下面结合前述借助智能眼镜进行设备唤醒的场景介绍本申请实施例提供的一种智能眼镜的结构示意图。

如图11所示，智能眼镜可以包括用户行为识别模块1101、图像采集模块1102、图像识别模块1103、设备优先级确定模块1104和设备唤醒模块1105。这多个模块可以通过总线相互耦合。其中：

用户行为识别模块1101可用于检测用户是否需要唤醒其它电子设备。

用户行为识别模块1101可以包括但不限于：压力传感器、语音识别传感器、倾角传感器。

在一种可能的实现方式中，用户行为识别模块1101可以通过语音识别传感器识别采集到的环境声音中是否包含预设的唤醒词。当监听到环境声音中包含预设的唤醒词，用户行为识别模块1101可以确定用户需要唤醒其它电子设备。那么，智能眼镜可以通过图像采集模块1102进行图像采集。

其中，智能眼镜中可存储有上述预设的唤醒词。若用于唤醒与智能眼镜在同一个本地设备列表中语音交互功能开启的电子设备的唤醒词被更新(例如用户重新设置唤醒词)，智能眼镜中存储的唤醒词也可以同步更新。示例性的，智能眼镜与手机建立有通信连接。手机中安装有控制音箱、电视等电子设备的智能家居APP。响应于作用在该智能家居APP中用于重新设置音箱的唤醒词的用户操作，用于唤醒音箱的唤醒词可以被修改。手机中可存储有修改后用于唤醒音箱的唤醒词。智能眼镜可以从手机获取上述修改后用于唤醒音箱的唤醒词。本申请实施例对智能眼镜获取用于唤醒电子设备的唤醒词的方法不作限定。

在一种可能的实现方式中，用户行为识别模块1101可以通过压力传感器检测智能眼镜的预设位置上是否有用户的触碰操作。例如，当检测到作用在镜腿上一个位置被触碰两次的用户操作，用户行为识别模块1101可以确定用户需要唤醒其它电子设备。那么，智能眼镜可以通过图像采集模块1102进行图像采集。

本申请实施例对用户行为识别模块1101检测用户是否需要唤醒其它电子设备的具体实现方法不作限定。例如，用户行为识别模块1101还可以通过判断用户是否按照预设的方式眨眼等，来检测用户是否需要唤醒电子设备。

需要进行说明的是，智能眼镜还可包含佩戴检测模块(图11中未示出)。在用户行为识别模块1101进行检测前，佩戴检测模块可以检测智能眼镜是否处于佩戴状态。若检测到智能眼镜处于佩戴状态，用户行为识别模块1101可以进行检测。若检测到智能眼镜未处于佩戴状态，智能眼镜可以处于休眠状态。智能眼镜处于休眠状态可以表示，智能眼镜中除了佩戴检测模块以外的组件均处于休眠状态。这可以节省智能眼镜的功耗。其中，佩戴检测模块检测智能眼镜是否处于佩戴状态的实现方法可以参考前述实施例。这里不再赘述。

图像采集模块1102可用于采集图像。

图像采集模块1102可包含但不限于摄像头。

当智能眼镜处于佩戴状态，智能眼镜通过图像采集模块1102采集的图像，可以相当于用户视野范围内的图像(例如前述实施例中图6和图8所示的图像)。本申请实施例对图像采集模块1102中的摄像头在智能眼镜上的安装位置不作限定。

图像识别模块1103可用于对图像进行图像识别处理，确定出该图像中包含的电子设备。

图像识别模块1103中可包括设备识别模型。该设备识别模型可以是神经网络模型。该设备识别模型可以是离线训练得到的。其中，该设备识别模型的输入可以包括图像。该图像中可包含一个或多个电子设备。该设备识别模型的输出可以包括但不限于以下特征：电子设备的类型、识别准确率、视角偏差。

智能眼镜在出厂前可以存储训练好的设备识别模型。可选的，上述设备识别模型可以更新。智能眼镜可以从用于训练上述设备识别模型的服务器中获取更新的设备识别模型。

图像识别模块1103可以通过该设备识别模型确定图像中电子设备的类型、识别准确率和视角偏差等等特征。其中，电子设备的类型可以包括该电子设备的类别以及该电子设备的具体型号。例如，图像识别模块1103确定出图6所示音箱106的类型为音箱Sound X，电视107的类型为智慧屏S Pro 65的电子设备。音箱为音箱106的类别，Sound X为音箱106的具体型号。识别准确率可以表示识别图像中一个电子设备的类型的准确率。一个电子设备的识别准确率越高，这一个电子设备的类型实际为图像识别模块1103确定的类型的可能性越大。例如，图像识别模块1103确定出图6所示音箱106为音箱Sound X的识别准确率越高，音箱106为音箱Sound X的可能性越大。视角偏差可用于表示电子设备在用户视野范围内与用户视野中心的距离。电子设备的视角偏差越小，该电子设备的位置越接近用户视野中心。电子设备的视角偏差越大，该电子设备的位置越接近用户视野范围的边缘。可以理解的，电子设备的视角偏差可以通过该电子设备在上述图像采集模块1102采集的图像中的位置确定。电子设备在图像中的位置越接近图像的中心，电子设备的视角偏差越小。电子设备在图像中的位置与图像的中心距离越远，电子设备的视角偏差越大。

本申请实施例对上述设备识别模型的具体训练方法不作限定。

在一些实施例中，上述设备识别模型的输出也可以包括但不限于以下特征：电子设备的类别、识别准确率、视角偏差。即图像识别模块1103在识别图像中包含的电子设备时，可以仅识别电子设备的类别(如类别为音箱的电子设备)，而不用精确至电子设备的型号。那么在后续过程中，设备优先级确定模块1104也可以根据电子设备的类别、识别准确率和视角偏差来确定电子设备的优先级。

当得到确定图像中电子设备的类型、识别准确率和视角偏差等特征，图像识别模块1103可以将这些特征传递至设备优先级确定模块1104。

设备优先级确定模块1104可用于对图像识别模块1103确定出的图像中包含的电子设备进行优先级排序。

设备优先级确定模块1104可以利用排序算法对图像中包含的电子设备进行优先级排序。

在一种可能的实现方式中，上述排序算法可以为：Y＝β₁*type+β₂*α+β₃*θ。其中，Y可以表示电子设备的优先级。Y的值越大，电子设备的优先级越高。type可以可以表示根据电子设备的类型确定的类型优先级取值。α可以表示电子设备的识别准确率。θ可以表示电子设备的视角偏差。β₁、β₂、β₃可以分别表示电子设备的类型优先级取值、识别准确率、视角偏差的权重。β₁、β₂、β₃均为小于1的正数。β₁、β₂、β₃之和可以为1。β₁、β₂、β₃的取值可以根据经验值设定。可选的，β₁、β₂、β₃的取值可以根据优化算法更新，使得优先级最高的电子设备为用户希望唤醒的电子设备。本申请实施例对上述β₁、β₂、β₃的取值不作具体限定。

可以理解的，响应于监听到的唤醒词，多个语音交互功能的电子设备根据类别可以存在被唤醒的优先级排序。例如，音箱>电视>平板电脑>手机。也即是说，对于上述排序算法中的特征type的取值可以具有下述大小的分布：音箱的type>电视的type>平板电脑的type>手机的type。本申请实施例对上述依据电子设备的类型确定的被唤醒的优先级排序不作限定。

电子设备的识别准确率越高，该电子设备能与本地设备列表中的电子设备匹配得上的概率越大，那么该电子设备被成功唤醒的概率也越大。

电子设备的视角偏差越小，该电子设备的位置越接近用户视野中心，那么该电子设备是用户希望唤醒的电子设备的概率越大。

不限于上述电子设备的类型、识别准确率、视角偏差，上述图像识别模块1103还可从图像中提取更多图像中包含的电子设备的特征。设备优先级确定模块1104可以根据更多或更少的特征来确定各电子设备的优先级。例如，设备优先级确定模块1104也可以根据电子设备的类别、识别准确率、视角偏差这三个特征中的一个或多个特征来确定电子设备的优先级。

在一些实施例中，用户唤醒不同的电子设备的唤醒词可能是不同的。在智能眼镜检测出用户需要唤醒其它电子设备且监听到唤醒词的情况下，设备优先级确定模块1104可以先对图像中包含的电子设备进行筛选。其中，若用于唤醒一个电子设备的唤醒词与智能眼镜监听到的唤醒词不匹配，设备优先级确定模块1104可以将这一个电子设备排除。进一步的，设备优先级确定模块1104可以对图像中未被排除的电子设备进行优先级排序。可选的，若用于唤醒一个电子设备的唤醒词与智能眼镜监听到的唤醒词不匹配，设备优先级确定模块1104可以将这一个电子设备的优先级确定为最低的优先级。这样，可以避免由于智能眼镜根据采集的图像进行设备识别出现错误时，无法唤醒用户希望唤醒的情况。

可选的，上述对图像中包含的电子设备进行筛选也可以由上述图像识别模块1103来实现。

示例性的，图像识别模块1103对图6所示的图像进行图像识别，并将该图像中音箱106和电视107的类型、识别准确率、视角偏差传递至设备优先级确定模块1104。设备优先级确定模块1104对这两个电子设备进行优先级排序，可以得到下列表1所示的优先级列表：

优先级列表
	音箱106
电视107

表1

由表1可知，音箱106的优先级高于电视107的优先级。上述优先级列表中可以通过电子设备的类型(如音箱Sound X)来表示该电子设备。本申请实施例对优先级列表中表示电子设备的内容不作限定。

当得到上述优先级列表，设备优先级确定模块1104可以将上述优先级列表传递至设备唤醒模块1105。

设备唤醒模块1105可用于根据本地设备列表以及图像中包含的电子设备的优先级，确定目标唤醒设备(即用户希望唤醒的电子设备)，并向该目标唤醒设备发送唤醒指令。

当接收到上述优先级列表，设备唤醒模块1105可以按照优先级从高到低的顺序，将优先级列表中的电子设备与本地设备列表中的电子设备进行匹配。根据上述优先级列表和本地设备列表，设备唤醒模块1105可以将优先级列表中优先级最高且存在于本地设备列表中的电子设备确定为目标唤醒设备。设备唤醒模块1105可以向该目标唤醒设备发送唤醒指令。其中，该唤醒指令可以是智能眼镜直接发送给目标唤醒设备的。或者，该唤醒指令也可以是经过手机或路由器等于智能眼镜连接的电子设备转发给目标唤醒设备的。本申请实施例对此不作限定。

示例性的，在如图5所示的场景中，智能眼镜的设备唤醒模块1105可以获得下列表2所示的本地设备列表：

本地设备列表
	手机102
音箱106
	电视107
智能眼镜101
	……

表2

由表1和表2可知，设备唤醒模块1105可以将音箱106确定为目标唤醒设备，并向音箱106发送唤醒指令。

在一些实施例中，本地设备列表中包含多个类型相同的电子设备。示例性的，本地设备列表中包含音箱106。该音箱106具体为音箱Sound X。除了音箱106，本地设备列表中还包含一个音箱Sound X。即本地设备列表中包含两个音箱Sound X。若设备唤醒模块1105确定出的目标唤醒设备为音箱Sound X，设备唤醒模块1105可以向本地设备列表中包含的两个音箱Sound X发送指示消息。该指示消息可用于指示这两个音箱Sound X协商确定出一个进入唤醒状态。在一种可能的实现方式中，当接收到该指示消息，这两个音箱Sound X可以通过各自接收到包含唤醒词的声音信号的强度来确定谁进入唤醒状态。可以理解的，接收到包含唤醒词的声音信号的强度越高，电子设备与用户之间距离越近，该电子设备为用户希望唤醒的电子设备的可能性越大。那么，接收到包含唤醒词的声音信号的强度最大的音箱Sound X可以进入唤醒状态。

由图11所示的智能眼镜的结构示意图可知，智能眼镜可以通过采集用户视野范围内的图像来判断用户希望唤醒的电子设备是哪一个。这样，用户可以借助智能眼镜来唤醒自己希望唤醒的电子设备，减少误唤醒的情况。

在一些实施例中，智能眼镜可以仅包含上述用户行为识别模块1101、图像采集模块1102、图像识别模块1103和设备优先级确定模块1104。上述设备唤醒模块1105可以包含于手机或路由器等与智能眼镜连接的电子设备中。这里以设备唤醒模块1105包含于手机为例进行说明。智能眼镜可以与手机建立蓝牙通信连接。当智能眼镜通过设备优先级确定模块1104得到优先级列表。智能眼镜可以将该优先级列表发送给手机。手机中的设备唤醒模块1105可以确定目标唤醒设备，并向目标唤醒设备发送唤醒指令。设备唤醒模块1105确定目标唤醒设备的方法可以参考前述实施例。

在上述实施例中，智能眼镜可以不用确定目标唤醒设备，并向目标唤醒设备发送唤醒指令。这可以降低对智能眼镜计算能力和存储能力的要求，节省智能眼镜的功耗。

在一些实施例中，智能眼镜可以仅包含上述用户行为识别模块1101、图像采集模块1102和图像识别模块1103。上述设备优先级确定模块1104和设备唤醒模块1105可以包含于手机或路由器等与智能眼镜连接的电子设备中。这里以设备优先级确定模块1104和设备唤醒模块1105包含于手机为例进行说明。智能眼镜可以与手机建立蓝牙通信连接。当智能眼镜通过图像识别模块1103确定出图像中电子设备的类型、识别准确率和视角偏差等等特征，智能眼镜可以将这些特征发送给手机。手机可以通过设备优先级确定模块1104确定图像中电子设备的优先级，得到优先级列表。进一步的，根据优先级列表和本地设备列表，手机中的设备唤醒模块1105可以确定目标唤醒设备，并向目标唤醒设备发送唤醒指令。

在上述实施例中，智能眼镜可以不用确定电子设备的优先级和目标唤醒设备，并向目标唤醒设备发送唤醒指令。这可以降低对智能眼镜计算能力和存储能力的要求，节省智能眼镜的功耗。

在一些实施例中，智能眼镜可以仅包含上述用户行为识别模块1101和图像采集模块1102。上述图像识别模块1103、设备优先级确定模块1104和设备唤醒模块1105可以包含于手机或路由器等与智能眼镜连接的电子设备中。这里以图像识别模块1103、设备优先级确定模块1104和设备唤醒模块1105包含于手机为例进行说明。智能眼镜可以与手机建立蓝牙通信连接。当智能眼镜通过图像采集模块1102采集得到图像，可以将该图像发送给手机。当接收到该图像，手机可以通过图像识别模块1103、设备优先级确定模块1104和设备唤醒模块1105可以确定出目标唤醒设备，并向目标唤醒设备发送唤醒指令。手机确定出目标唤醒设备的具体方法可以参考前述实施例。这里不再赘述。

在上述实施例中，智能眼镜可以不用存储设备识别模块，对图像进行图像识别处理，并且不用确定电子设备的优先级和目标唤醒设备，向目标唤醒设备发送唤醒指令。这可以降低对智能眼镜计算能力和存储能力的要求，节省智能眼镜的功耗。

在一些实施例中，上述判断用户是否需要唤醒其它电子设备的操作也可以是由其它与智能眼镜连接的电子设备(如手机)完成的。例如，手机监听到唤醒词，手机可以向智能眼镜发送采集图像的指令。智能眼镜采集图像后可以将图像发送给手机。手机可以根据该图像确定目标唤醒设备。可选的，智能眼镜采集图像后也可以根据该图像确定目标唤醒设备。

图12示例性示出了本申请实施例提供的一种设备唤醒方法的流程图。

如图12所示，该方法可包括步骤S201～S207。其中：

S201、智能眼镜检测到用户需要唤醒其它电子设备。

当智能眼镜处于佩戴状态，智能眼镜可以检测用户是否需要唤醒其它电子设备(如手机、音箱、电视等)。其中，智能眼镜可以包含前述实施例的用户行为识别模块1101。智能眼镜可以通过用户行为识别模块1101检测用户是否需要唤醒其它电子设备。具体的实现方法可以参考前述实施例。这里不再赘述。

S202、智能眼镜采集图像，并确定图像中包含的电子设备的类型、识别准确率、视角偏差。

当检测到用户需要唤醒其它电子设备，智能眼镜可以采集图像。其中，智能眼镜可以包含前述实施例的图像采集模块1102和图像识别模块1103。智能眼镜可以通过图像采集模块1102采集图像。该图像即为用户视野范围内的图像。智能眼镜可以通过图像识别模块1103确定出该图像中包含的电子设备的类型、识别准确率和视角偏差。具体的实现方法可以参考前述实施例。这里不再赘述。

S203、智能眼镜可以向手机发送电子设备的类型、识别准确率、视角偏差。

S204、手机可以对图像中包含的电子设备进行优先级排序。电子设备的优先级可根据一下一项或多项确定：电子设备的类型、识别准确率、视角偏差。

手机可包含前述实施例的设备优先级确定模块1104。手机可以通过设备优先级确定模块1104对图像中包含的电子设备进行优先级排序，得到优先级排序的结果。该优先级排序的结果可以为前述实施例的优先级列表。

S205、手机获取本地设备列表，将优先级排序的结果中优先级最高且存在于本地设备列表中的电子设备确定为目标唤醒设备。

手机可包含前述实施例的设备唤醒模块1105。当接收到上述优先级排序的结果，手机可以通过设备唤醒模块1105确定目标唤醒设备，并执行下述步骤S206。

S206、手机向目标唤醒设备发送唤醒指令。

在一些实施例中，手机即为目标唤醒设备。那么，当确定目标唤醒设备为自己后，手机可以进入唤醒状态。

在一些实施例中，目标唤醒设备为手机以外的其他电子设备，手机可以直接向目标唤醒设备发送唤醒指令。可选的，手机与目标唤醒设备均与路由器连接。手机可以将唤醒指令发送给该路由器。该路由器可以将唤醒指令发送给目标唤醒设备。

S207、当接收到唤醒之后，目标唤醒设备进入唤醒状态，识别语音指令并执行语音指令对应的操作。

不限于上述手机，智能眼镜还可以将电子设备的优先级排序的结果发送给其它与自己连接的电子设备(如路由器)，并由该电子设备确定目标唤醒设备以及向目标唤醒设备发送唤醒指令。

在一些实施例中，智能眼镜在确定图像中包含的电子设备的类型、识别准确率、视角偏差后，还可以对图像中包含的电子设备进行优先级排序，并确定目标目标唤醒设备，向目标唤醒设备发送唤醒指令。也即是说，上述步骤S204、上述步骤S205和上述步骤S206均可以有智能眼镜完成。

在一些实施例中，智能眼镜在进行图像采集后，可以将采集得到的图像发送给手机。手机可以识别图像中包含的电子设备。即上述步骤S202中识别图像中包含的电子设备可以是由手机完成的。这可以降低对智能眼镜计算能力和存储能力的要求，节省智能眼镜的功耗。

由图12所示的方法可知，用户可以借助智能眼镜来唤醒自己希望唤醒的电子设备。该方法可以有效减少误唤醒的情况，为用户使用电子设备的语音交互功能带来更好的使用体验。

在一些实施例中，不限于上述智能眼镜，用户还可以借助其它类型的图像采集装置来辅助实现设备唤醒。示例性的，该图像采集装置可以是监控摄像头等等。

上述图像采集装置可以检测第一用户输入，并在检测到第一用户输入时，采集第一图像。通过检测上述第一用户输入，图像采集装置可以判断用户是否需要进行设备唤醒。在判断出用户需要进行设备唤醒的情况下，图像采集装置可以进行图像采集，得到上述第一图像。可以理解的，在用户需要进行设备唤醒的情况下，上述第一图像中包含用户希望唤醒的电子设备的可能性更高。

上述图像采集装置可以从多个电子设备中选出第一图像包含的目标电子设备。其中，图像采集装置可以先识别第一图像中包含的电子设备，得到第一图像中包含的电子设备的信息。上述电子设备的信息可以包括但不限于类型、识别准确率和视角偏差。图像采集装置可以根据上述电子设备的信息对第一图像中包含的电子设备进行优先级排序，得到第一图像中包含的电子设备的优先级。进一步的，图像采集装置可以判断第一图像中包含的电子设备是否存在于设备唤醒系统。

上述设备唤醒系统中的电子设备可以存在于本地设备列表中。本地设备列表可以存储于设备唤醒系统中的一个或多个电子设备中。可选的，该本地设备列表也可以存储在云服务器中。本地设备列表中的电子设备均可以获取该本地设备列表并更新该本地设备列表。一个电子设备可以通过已经存在于该本地设备列表中的电子设备，被增加至该本地设备列表或者从该本地设备列表中被删除。示例性的，一个电子设备和存在于该本地设备列表中的另一个电子设备建立通信连接，并完成了这另一个电子设备指示的可信身份认证。这另一个电子设备可以更新该本地设备列表，将这一个电子设备增加至该本地设备列表。即这一个电子设备可以加入上述设备唤醒系统。上述本地设备列表被更新后，存在于本地设备列表中的电子设备均可以获得更新后的本地设备列表。上述设备唤醒系统中电子设备的通信连接方式可以参考前述图3和图4所示通信系统的介绍。这里不再赘述。

那么，图像采集装置可以获取本地设备列表，并判断第一图像中包含的电子设备是否存在与上述本地设备列表中。图像采集装置可以将本地设备列表中包含于第一图像，且优先级最高的电子设备确定为上述目标电子设备，并指示该目标电子设备进入唤醒状态。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种设备唤醒系统，其特征在于，所述设备唤醒系统包括图像采集装置和多个电子设备，其中，

所述图像采集装置，用于检测第一用户输入，并在检测到第一用户输入时，采集第一图像；

所述图像采集装置，还用于从所述多个电子设备中选出所述第一图像包含的目标电子设备，并向所述目标电子设备发送唤醒指令；所述唤醒指令用于触发所述目标电子设备进入唤醒状态；

所述目标电子设备，用于响应接收到的所述唤醒指令，进入所述唤醒状态。

2.根据权利要求1所述的设备唤醒系统，其特征在于，所述第一用户输入为包含唤醒词的语音输入；或者，所述第一用户输入为作用在所述图像采集装置的第一位置上的用户操作。

3.根据权利要求1或2所述的设备唤醒系统，其特征在于，所述图像采集装置为智能眼镜；

所述多个电子设备，还用于监听唤醒词；

所述多个电子设备，还用于在监听到所述唤醒词时检测所述设备唤醒系统中是否存在所述图像采集装置，且所述图像采集装置是否处于佩戴状态；

所述多个电子设备，还用于在确定出所述设备唤醒系统中存在所述图像采集装置，且所述图像采集装置处于佩戴状态时，等待接收所述唤醒指令，并响应于接收到的所述唤醒指令进入所述唤醒状态。

4.根据权利要求1-3中任一项所述的设备唤醒系统，其特征在于，所述图像采集装置具体用于：

确定所述第一图像包含的电子设备的类型、识别准确率、视角偏差中的至少一项；所述识别准确率用于指示所述第一图像包含的电子设备的类型的识别结果的准确率，所述视角偏差用于指示所述电子设备在所述第一图像中的位置与所述第一图像的中心的距离；

将所述多个电子设备中包含于所述第一图像，且优先级最高的电子设备确定为所述目标电子设备；所述优先级是根据所述类型、所述识别准确率和所述视角偏差中的一项或多项确定的；所述电子设备的所述类型在依据类型确定的唤醒排序中的优先顺序与所述电子设备的所述优先级正相关，所述电子设备的所述识别准确率与所述电子设备的所述优先级正相关，所述电子设备的所述视角偏差与所述电子设备的所述优先级负相关。

5.根据权利要求1或2或4所述的设备唤醒系统，其特征在于，所述图像采集装置为智能眼镜。

6.一种设备唤醒系统，其特征在于，所述设备唤醒系统包括图像采集装置和处理设备，其中，

所述图像采集装置，还用于向所述处理设备发送第一指令，所述第一指令包括所述第一图像，所述第一指令用于指示所述处理设备从多个电子设备中选出所述第一图像包含的目标电子设备；

所述处理设备，用于响应所述第一指令，从所述多个电子设备中选出所述第一图像包含的目标电子设备，并向所述目标电子设备发送唤醒指令，所述唤醒指令用于触发所述目标电子设备进入唤醒状态。

7.根据权利要求6所述的设备唤醒系统，其特征在于，所述第一用户输入为包含唤醒词的语音输入；或者，所述第一用户输入为作用在所述图像采集装置的第一位置上的用户操作。

8.根据权利要求6或7所述的设备唤醒系统，其特征在于，所述设备唤醒系统还包括所述多个电子设备，其中，

所述多个电子设备，用于响应所述唤醒指令，进入所述唤醒状态。

9.根据权利要求8所述的设备唤醒系统，其特征在于，所述图像采集装置为智能眼镜，所述多个电子设备还用于：

监听唤醒词；

在监听到所述唤醒词时检测所述设备唤醒系统中是否存在所述图像采集装置，且所述图像采集装置是否处于佩戴状态；

在所述设备唤醒系统中存在所述图像采集装置，且所述图像采集装置处于佩戴状态的情况下，等待接收所述唤醒指令。

10.根据权利要求6-9中任一项所述的设备唤醒系统，其特征在于，所述处理设备具体用于：

11.根据权利要求6-8或10中任一项所述的设备唤醒系统，其特征在于，所述图像采集装置为智能眼镜。

12.一种设备唤醒方法，其特征在于，所述方法包括：

获取第一图像；

从多个电子设备中选出所述第一图像包含的目标电子设备；

向所述目标电子设备发送唤醒指令；所述唤醒指令用于触发所述目标电子设备进入唤醒状态。

13.根据权利要求12所述的方法，其特征在于，所述方法由图像采集装置执行；

所述获取第一图像，具体包括：

当检测到第一用户输入，采集所述第一图像。

14.根据权利要求13所述的方法，其特征在于，所述检测到第一用户输入，具体包括：

监听到唤醒词；或者，

检测到作用在所述图像采集装置的第一位置上的用户操作。

15.根据权利要求12所述的方法，其特征在于，所述方法由处理设备执行；

所述获取第一图像，具体包括：

接收来自图像采集装置的第一指令，所述第一指令包括所述图像采集装置采集的所述第一图像，所述第一指令用于指示所述处理设备从所述多个电子设备中选出所述第一图像包含的所述目标电子设备。

16.根据权利要求13-15中任一项所述的方法，其特征在于，所述图像采集装置为智能眼镜。

17.根据权利要求12-16中任一项所述的方法，其特征在于，所述从多个电子设备中选出所述第一图像包含的目标电子设备，具体包括：

18.一种设备唤醒的方法，其特征在于，所述方法包括：

当检测到第一用户输入，图像采集装置采集第一图像；

所述图像采集装置向处理设备发送第一指令，所述第一指令包括所述第一图像，所述第一指令用于指示所述处理设备从多个电子设备中选出所述第一图像包含的目标电子设备，所述目标电子设备为所述处理设备发送唤醒指令的对象，所述唤醒指令用于触发所述目标电子设备进入唤醒状态。

19.根据权利要求18所述的方法，其特征在于，所述图像采集装置为智能眼镜。

20.根据权利要求18或19所述的方法，其特征在于，所述检测到第一用户输入，具体包括：

监听到唤醒词；或者，

检测到作用在所述图像采集装置的第一位置上的用户操作。

21.一种设备唤醒方法，其特征在于，所述方法包括：

第一电子设备监听到唤醒词；

响应于所述唤醒词，所述第一电子设备检测设备唤醒系统中是否存在智能眼镜，且所述智能眼镜是否处于佩戴状态；

如果所述设备唤醒系统中存在所述智能眼镜，且所述智能眼镜处于佩戴状态，所述第一电子设备等待接收唤醒指令，所述唤醒指令用于触发所述第一电子设备进入唤醒状态；

所述第一电子设备接收到所述唤醒指令，进入所述唤醒状态。

22.一种电子设备，其特征在于，所述电子设备包括存储器和处理器，其中，所述存储器用于存储计算机程序，所述处理器用于调用所述计算机程序，使得所述电子设备执行权利要求12-17或18-20或21中任一项所述的方法。

23.一种计算机可读存储介质，包括指令，其特征在于，当所述指令在电子设备上运行，使得所述电子设备执行权利要求12-17或18-20或21中任一项所述的方法。