WO2020098421A1

WO2020098421A1 - 智能设备控制方法、装置和存储介质

Info

Publication number: WO2020098421A1
Application number: PCT/CN2019/110191
Authority: WO
Inventors: 张胜美; 李金鑫; 宋奔
Original assignee: 北京猎户星空科技有限公司
Priority date: 2018-11-13
Filing date: 2019-10-09
Publication date: 2020-05-22
Also published as: US20210354306A1; JP2022507447A; JP7204912B2; EP3866054A1; US11247342B2; TWI741406B; TW202018587A; CN109543578A; EP3866054B1; EP3866054C0; CN109543578B; EP3866054A4

Abstract

智能设备控制方法、装置和存储介质，涉及智能设备技术领域。该方法中在智能设备处于休眠状态时，采集所述智能设备周围环境的图像(201)；若在采集的图像中检测到人物特征且具有所述人物特征的目标与所述智能设备之间的距离在第一指定距离内，则触发所述智能设备进行语音播报(202)；语音播报之后，若检测到所述目标与所述智能设备之间的距离在第二指定距离内，则唤醒所述智能设备，所述第二指定距离小于所述第一指定距离(203)。由此，本方法能够根据图像检测，确定周围的用户是否有交互意图，并通过主动进行语音播报的形式，将有潜在交互意图的用户引导到智能设备进行操作，从而提高智能设备的曝光率和使用率。

Description

智能设备控制方法、装置和存储介质

相关申请的交叉引用

本申请要求在2018年11月13日提交中国专利局、申请号为201811346631.3、申请名称为“智能设备控制方法、装置和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及智能设备技术领域，尤其涉及智能设备控制方法、装置和存储介质。

背景技术

随着人工智能技术的不断发展，越来越多的智能设备(如机器人)进入人们的生活和工作领域。

如今各类的机器人能够提供不同的功能，例如育儿机器人能够从服务器获得童话故事、儿歌、诗歌等播放给小朋友。接待机器人能够帮助用户自助办理一些业务(如银行开卡业务)。

然而，智能设备提供的功能虽然较为全面了，但是人们面对陌生的智能设备仍无所适从。

发明内容

本申请实施例提供一种智能设备控制方法、装置和存储介质，用于解决现有技术中智能设备的曝光率和使用率较低等的问题。

第一方面，本申请实施例提供一种智能设备控制方法，该方法包括：

在智能设备处于休眠状态时，采集所述智能设备周围环境的图像；

若在采集的图像中检测到人物特征且具有所述人物特征的目标与所述智能设备之间的距离在第一指定距离内，则触发所述智能设备进行语音播报；

语音播报之后，若检测到所述目标与所述智能设备之间的距离在第二指定距离内，则唤醒所述智能设备，所述第二指定距离小于所述第一指定距离。

在一种可能的实施方式中，所述人物特征包括以下特征的至少一种：人脸特征和人体特征。

在一种可能的实施方式中，所述采集所述智能设备周围环境的图像，包括：

实时采集所述智能设备前方物体的彩色图像和深度图像；

若在采集的图像中检测到人物特征且具有所述人物特征的目标与所述智能设备之间的距离在所述第一指定距离内，则触发所述智能设备进行语音播报，包括：

实时基于所述彩色图像进行人物特征检测；

针对检测到的每个人物特征执行：

确定具有该人物特征的目标在深度图像中的对应数据；

根据具有该人物特征的目标在深度图像中的对应数据，确定具有该人物特征的目标与所述智能设备的距离；

若该距离在第一指定距离内，则触发所述智能设备进行语音播报。

在一种可能的实施方式中，所述方法还包括：

在语音播报过程中，若检测到至少一个具有人物特征的其他目标与所述智能设备之间的距离在所述第一指定距离内，在语音播报完毕后，不重复进行语音播报。

在一种可能的实施方式中，所述方法还包括：

在语音播报完毕且间隔设定时长后，若检测到至少一个具有人物特征的其他目标与所述智能设备之间的距离在所述第一指定距离内，再次进行语音播报。

在一种可能的实施方式中，所述触发所述智能设备进行语音播报，包括：

触发所述智能设备采用大于预设音量的音量进行语音播报，所述预设音量为所述智能设备唤醒后与所述目标交互时的音量。

触发所述智能设备从预设播报内容集合中随机选择播报内容进行语音播报；或者

触发所述智能设备从预设播报内容集合中顺序选择播报内容进行语音播报；或者

触发所述智能设备对预设播报内容集合中的播报内容进行语音循环播报。

在一种可能的实施方式中，所述方法还包括：

接收播报内容增加指令，将所述播报内容增加指令中包含的播报内容添加至所述播报内容集合中；或者

接收播报内容修改指令，根据所述播报内容修改指令对所述播报内容集合中相应的播报内容进行修改；或者

接收播报内容替换指令，根据所述播报内容替换指令替换所述播报内容集合中相应的播报内容。

在一种可能的实施方式中，所述方法还包括：

进行语音播报的同时，在所述智能设备的屏幕上显示预设表情。

第二方面，本申请还提供一种智能设备控制装置，所述装置包括：

图像采集模块，用于在智能设备处于休眠状态时，采集所述智能设备周围环境的图像；

预唤醒模块，用于若在采集的图像中检测到人物特征且具有所述人物特征的目标与所述智能设备之间的距离在第一指定距离内，则触发所述智能设备进行语音播报；

唤醒模块，用于语音播报之后，若检测到所述目标与所述智能设备之间的距离在第二指定距离内，则唤醒所述智能设备，所述第二指定距离小于所述第一指定距离。

在一种可能的实施方式中，所述图像采集模块，具体用于实时采集所述智能设备前方物体的彩色图像和深度图像；

所述预唤醒模块具体用于：

实时基于所述彩色图像进行人物特征检测；

针对检测到的每个人物特征执行：

确定具有该人物特征的目标在深度图像中的对应数据；

若该距离在所述第一指定距离内，则触发所述智能设备进行语音播报。

在一种可能的实施方式中，所述预唤醒模块还用于：在语音播报过程中，若检测到至少一个具有人物特征的其他目标与所述智能设备之间的距离在所述第一指定距离内，在语音播报完毕后，不重复进行语音播报。

在一种可能的实施方式中，所述预唤醒模块还用于：在语音播报完毕且间隔设定时长后，若检测到至少一个具有人物特征的其他目标与所述智能设备之间的距离在所述第一指定距离内，再次进行语音播报。

在一种可能的实施方式中，所述预唤醒模块具体用于：

在一种可能的实施方式中，所述装置还包括：

播报内容维护模块，用于接收播报内容增加指令，将所述播报内容增加指令中包含的播报内容添加至所述播报内容集合中；或者

在一种可能的实施方式中，所述装置还包括：

播报表情控制模块，用于进行语音播报的同时，在所述智能设备的屏幕上显示预设表情。

第三方面，本申请还提供一种计算装置，包括至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请实施例提供的任一智能设备控制方法。

第四方面，本申请还提供了一种计算机可读存储介质，其中，所述存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行本申请实施例中的任一智能设备控制方法。

第五方面，本申请还提供了一种计算机程序产品，所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，所述程序指令被处理器执行时实现上述任一智能设备控制方法的步骤。

本申请提供的智能设备控制方法、装置和存储介质。能够根据图像检测，确定周围较远距离的用户是否有交互意图，并通过主动进行语音播报的形式，将有潜在交互意图的用户引导到智能设备进行操作，从而提高智能设备的曝光率和使用率。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。

图1为本申请实施例中的智能设备控制的应用场景示意图；

图2为本申请实施例中的智能设备控制方法的流程示意图之一；

图3为本申请实施例中的智能设备控制方法的示意图；

图4为本申请实施例中的智能设备控制方法的流程示意图之二；

图5为本申请实施例中的智能设备控制装置示意图；

图6为根据本申请实施方式的计算装置的结构示意图。

具体实施方式

为了提高智能设备的曝光率和使用率，让人们能够更加自然的和智能设备交互，方便的使用智能设备提供的业务，本申请实施例中提供一种智能设备控制方法、装置和存储介质。为了更好的理解本申请实施例提供的技术方案，这里对该方案采用的一些名词和基本原理做一下简单说明：

名词说明：

在睡眠状态之外，智能设备可以包括两个模式，如包括预唤醒模式和唤醒模式。

预唤醒模式：是用户距离智能设备较远时的功能设计。在预唤醒模式下，智能设备实时采集周围环境图像，并在检测到人脸或人体特征时，确定周围有用户存在，开启语音播报功能，例如语音打招呼，播报自身能够提供的业务等，以便于用户了解智能设备的功能，吸引用户走近智能设备，并使用智能设备的具体功能。

唤醒模式：是用户距离智能设备较近时的功能设计，在唤醒模式下，智能设备可以和用户进行交互，依照用户指令以完成相应的服务，也可以主动引导用户以完成相应的服务等。

深度图像：在3D(Dimensions，维度)计算机图形中，Depth Map(深度图像)是包含与视点的场景对象的表面的距离信息的图像。

人物特征：用于描述人的特征，如人脸特征，人体特征。

原理说明：

为了能够提高智能设备的使用效率，本申请实施例中实现了智能设备采用较为自然的交互方案，来引导用户使用智能设备完成相应业务。具体的，当用户靠近智能设备时，就像自然人靠近自然人一样，双方通过打招呼来发起谈话。本申请实施例中，当确定智能设备前方有人时，智能设备可以主动打招呼播报自身的功能。例如，银行接待机器人能够采用自然的交互方式播报“Hi，我是银行助理，请问您需要办理什么业务”。这样，智能设备能够通过自然交互的方式向用户打招呼，吸引用户和智能设备交互，并引导用户在智能设备上完成操作。

进一步的，本申请实施例中为了能够尽可能的少打扰用户，当判断用户离智能设备较近时，才主动打招呼播报语音，而距离较远时并不打招呼，这样可以采用更为自然的方式引导用户使用智能设备。

为了便于进一步理解本申请实施例提供的技术方案，下面结合附图对此进行说明。

如图1所示，为本申请实施例提供的智能设备控制方法的应用场景示意图，该应用场景中包括用户10、智能设备11，智能设备11可以实时采集前方图像，然后根据图像分析前方是否有人，若有人，且距离较近时，则进入预唤醒状态，进行语音播报，以此引导用户使用智能设备。

需要说明的是，本申请实施例中的智能设备可以是能够移动的机器人也可以是固定位置放置的机器人，智能设备提供的功能可以是各行各业各种功能，如前所述的伴随小朋友成长的智能设备，银行接待机器人等。

下面对本申请实施例提供的智能设备控制方法做进一步介绍，如图2所示，该方法包括以下步骤：

步骤201：在智能设备处于休眠状态时，采集所述智能设备周围环境的图像。

步骤202：若在采集的图像中检测到人物特征且具有所述人物特征的目标与所述智能设备之间的距离在第一指定距离内，则触发所述智能设备进行语音播报。

其中，具体实施时，人物特征检测，可以进行人脸检测和/或人体检测，只要能够确定图像中包含人像均适用于本申请实施例。

播报的语音可以为该智能设备内置功能的服务提供商自行按需设置的。例如银行可以设置其接待智能设备播报“Hi，我是银行小秘，可以为个人用户办理**业务”。

步骤203：语音播报之后，若检测到所述目标与所述智能设备之间的距离在第二指定距离内，则唤醒所述智能设备，所述第二指定距离小于所述第一指定距离。

例如，第一指定距离为3米，第二指定距离为1.5米，即距离用户在1.5-3米内则进行语音播报，之后，确定用户靠近且距离在1.5米内，则可以进入唤醒模式，与用户进行交互。

这样，本申请实施例中若目标与智能设备的距离在第一指定距离内，则确定近距离内有人可能有交互意图，然后通过语音播报实现和目标的打招呼，以便于引导目标靠近智能设备。然后，在确定距离目标很近(即第二指定距离内)时，确定目标有交互意图，开始进入唤醒模式进行交互。这样，通过简单的自然的方式将用户导流到智能设备上进行操作，从而提高智能设备的使用率。

进一步的，确定智能设备与目标的距离的方案可具体实施为以下几种：

方案1、采用距离传感器探测周围环境的目标与智能设备的距离。

这样，是否进行语音播报的方案可理解为当检测到人物特征且探测周围环境的目标与智能设备的距离在第一指定距离内时，则可触发所述智能设备进行语音播报。否则，即使检测到人物特征、但距离传感器没有探测到物体时，也不触发所述智能设备进行语音播报。也即，目标距离太远则确定不存在具有交互意图的用户，无需语音播报进行导流。

相应的，若没有检测到人物特征，无论距离传感器是否探测到物体(该物体可能是桌子，遮挡物等)，都认为不存在具有交互意图的用户，同样不会触发语音播报。

方案2：可以采用RGB-D摄像机来采集图像，然后进行判断。

即实时采集所述智能设备前方物体的彩色图像和深度图像；然后，实时基于所述彩色图像进行人物特征检测；在检测到人物特征后，针对检测到的每个人物特征执行：确定该人物特征的目标在深度图像中的对应数据；根据具有该人物特征的目标在深度图像中的对应数据，确定具有该人物特征的目标与所述智能设备的距离；若该距离在第一指定距离内，则触发所述智能设备进行语音播报。

具体实施时，可以采用红外传感器和红外相机获取深度图像(Depth图像)，即通过红外传感器发射红外光，红外光遇到遮挡物后会反射给红外相机，红外相机根据捕捉的红外光成像，得到红外图像中各像素的深度数据。RGB-D摄像机彩色图像(即RGB(red、green、blue，红绿蓝)图像)和Depth图像是配准的，因而两图像的像素点之间具有一一对应关系。故此，根据检测到的人物特征的各像素点，可以确定具有该人物特征的目标和智能设备的距离。由于人物特征像素点有多个，具体实施时，可以采用距离最近的像素点的距离作为距离智能设备的距离，也可以采用最远距离，当然也可以采用人物特征各像素点的距离平均值，本申请对此不作限定。

本申请实施例中，还可以当目标足够近时，直接判断该目标具有交互意图，而进入唤醒模式。如图3所示，第一指定距离为(1.5m-3m)，第二指定距离为0-1.5m。连续获取图片后，分析具有人物特征的目标和智能设备的距离，当距离在1.5-3m内时，则执行预唤醒，当距离在1.5m以内时则直接执行唤醒。当然，具体实施时，具体的第一指定距离和第二指定距离可以根据实验或实际需要确定，本申请对此并不作限定。

关于语音播报，具体实施时，智能设备管理人员可以通过语音播报页面自行输入播报的文件(该文件的形式可以是文本文件或音频文件)并保存。然后需要语音播报时，由智能设备根据预存的文件进行语音播报。若是文本文件，则可以采用文本到语音(Text To Speech，TTS)合成技术进行播报。

当然具体实施时可以设置多条播报内容构成预设播报内容集合。语音播报时触发智能设备从预设播报内容集合中随机选择播报内容进行语音播报，或者，触发所述智能设备从预设播报内容集合中顺序选择播报内容进行语音播报，亦或者，触发所述智能设备对预设播报内容集合中的播报内容进行语音循环播报。

当然，随机选择时，可以随机选择一条，也可以随机选择多条进行播报。具体实施时，每条语音的字数具有字数上限，语音的条数也可以具有上限(如10条)。

相应的，用户也可以对自己配置的播报内容进行更新，具体可包括：接收播报内容增加指令，将所述播报内容增加指令中包含的播报内容添加至所述播报内容集合中；或者，接收播报内容修改指令，根据所述播报内容修改指令对所述播报内容集合中相应的播报内容进行修改；亦或者，接收播报内容替换指令，根据所述播报内容替换指令替换所述播报内容集合中相应的播报内容。

由此，用户通过上述增删改的操作可以实现对播报内容的维护。

关于语音播报除了上述内容，下面将补充几中场景的对语音内容的播报进行补充说明，包括：

1)、在语音播报过程中，若检测到至少一个具有人物特征的其他目标与所述智能设备之间的距离在所述第一指定距离内，在语音播报完毕后，不重复进行语音播报。

也即，连续监测到具有人物特征的目标距离智能设备在第一指定距离内时，不会连续重复播报语音。这样，能够避免连续打扰用户，让用户产生听觉疲劳。同时，也能节约由于语音播报耗费的资源。

2)、本申请实施例中，在语音播报完毕且间隔设定时长后，若检测到至少一个具有人物特征的其他目标与所述智能设备之间的距离在所述第一指定距离内，再次进行语音播报。

例如，本次语音播报完毕后，间隔5秒钟，5秒钟之后若满足语音播报条件时，则再次进行语音播报。这样，采用周期性检测并确定是否进行语音播报，避免了持续播报语音导致电能和处理资源的损耗，实现在资源的使用和及时导流用户之间实现平衡。

3)、语音播报时，可以触发所述智能设备采用大于预设音量的音量进行语音播报，所述预设音量为所述智能设备唤醒后与目标交互时的音量。这样，智能设备播报的语音内容可以引起用户注意，以便于能够更加有效的将具有潜在交互意图的用户导流到智能设备上操作。

4)、为了便于能够让用户以更加自然的方式理解和收听播报的内容，本申请中进行语音播报的同时，还可以在所述智能设备的屏幕上显示预设表情。如，漏出一个笑脸，以便于用户除了在听觉上能够对智能设备产生兴趣，在视觉上也能进一步的对智能设备产生兴趣，以便于将用户导流到智能设备上。

本申请实施例中，具体实施时，人物特征检测和语音播报可以为独立的两个程序，即图像的采集和人物特征检测可以实时进行，并在检测到人物特征时确定具有该人物特征的目标与智能设备之间的距离，若该距离在第一指定距离范围内，则发送消息给语音播报程序，语音播报程序根据收到的消息确定是否进行语音播报。

以前述2)中的间隔设定时长进行语音播报，对这两个程序的配合使用进行说明。具体可实施为假设指定时长为5秒，一开始，语音播报程序在收到人物特征检测程序发送的消息后，开始播报“Hi,我是接待智能设备XXX，请问有什么需求？”，在该语音还没有播报完，又收到人物特征检测程序的消息时，则忽略该消息。播报完开始计时，若在5秒之内，收到人物特征检测程序的消息，则丢弃该消息。若在5秒之后，收到消息，则进行语音播报。

具体实施时，还可以根据采集的图像确定是否有人进入智能设备的视野或离开智能设备的视野。若在语音播报过程中，视野中所有人离开智能设备视野时，则可以终止播报，达到节约资源的目的。

为了便于系统的理解本申请实施例提供的智能设备的控制方法，结合图4 对此进行说明，包括以下步骤：

步骤401：在智能设备处于休眠状态时，采集所述智能设备周围环境的图像。

步骤402：实时基于所述彩色图像进行人物特征检测。

步骤403：若检测到人脸，则针对检测到的人脸，在深度图像中查找该人脸的对应数据；并，根据该对应数据，确定该人脸对应的目标与智能设备的距离。

步骤404：确定是否存在至少一个目标距离智能设备的距离在1.5米内，若是，执行步骤405，否则，执行步骤406。

步骤405：唤醒所述智能设备。

步骤406：确定是否存在至少一个目标距离智能设备的距离在1.5-3米内，若是，执行步骤407，否则，执行步骤401。

步骤407：确定当前是否正在进行语音播报，若是，则返回执行步骤401，若否，则执行步骤408。

步骤408：距离上次语音播报的时长是否达到设定时长，若否，则返回执行步骤401，是则，执行步骤409。

步骤409：随机选择一条播报内容，并采用大于指定分贝的音量播报选择的播报内容。

步骤410：语音播报完毕后，确定目标与智能设备的距离，之后执行步骤404。

基于相同的构思，本申请实施例还提供一种智能设备控制装置。如图5所示，该装置包括：

图像采集模块501，用于在智能设备处于休眠状态时，采集所述智能设备周围环境的图像；

预唤醒模块502，用于若在采集的图像中检测到人物特征且具有所述人物特征的目标与所述智能设备之间的距离在第一指定距离内，则触发所述智能设备进行语音播报；

唤醒模块503，用于语音播报之后，若检测到所述目标与所述智能设备之间的距离在第二指定距离内，则唤醒所述智能设备，所述第二指定距离小于所述第一指定距离。

所述预唤醒模块具体用于：

实时基于所述彩色图像进行人物特征检测；

针对检测到的每个人物特征执行：

确定具有该人物特征的目标在深度图像中的对应数据；

在一种可能的实施方式中，所述预唤醒模块还用于：

在一种可能的实施方式中，所述预唤醒模块具体用于：

触发所述智能设备采用大于预设音量的音量进行语音播报，所述预设音量为所述智能设备唤醒后与目标交互时的音量。

在一种可能的实施方式中，所述预唤醒模块具体用于：

在一种可能的实施方式中，所述装置还包括：

在介绍了本申请示例性实施方式的智能设备控制方法、装置之后，接下来，介绍根据本申请的另一示例性实施方式的计算装置。

所属技术领域的技术人员能够理解，本申请的各个方面可以实现为系统、方法或程序产品。因此，本申请的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

在一些可能的实施方式中，根据本申请的计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中，存储器存储有程序代码，当程序代码被处理器执行时，使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的智能设备控制方法中的步骤。例如，处理器可以执行如图2中所示的步骤201-203。

下面参照图6来描述根据本申请的这种实施方式的计算装置130。图6显示的计算装置130仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图6所示，计算装置130以通用计算装置的形式表现。计算装置130的组件可以包括但不限于：上述至少一个处理器131、上述至少一个存储器132、连接不同系统组件(包括存储器132和处理器131)的总线133。

总线133表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储器132可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)1321和/或高速缓存存储器1322，还可以进一步包括只读存储器(ROM)1323。

存储器132还可以包括具有一组(至少一个)程序模块1324的程序/实用工具1325，这样的程序模块1324包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

计算装置130也可以与一个或多个外部设备134(例如键盘、指向设备等)通信，还可与一个或者多个使得用户能与计算装置130交互的设备通信，和/或与使得该计算装置130能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口135进行。并且，计算装置130还可以通过网络适配器136与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器136通过总线133与用于计算装置130的其它模块通信。应当理解，尽管图中未示出，可以结合计算装置130使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

在一些可能的实施方式中，本申请提供的智能设备控制方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在计算机设备上运行时，程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的智能设备控制方法中的步骤，例如，计算机设备可以执行如图2中所示的步骤201-203。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本申请的实施方式的用于智能设备控制的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在计算装置上运行。然而，本申请的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算装置上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中，远程计算装置可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算装置，或者，可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了装置的若干单元或子单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外，尽管在附图中以特定顺序描述了本申请方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种智能设备控制方法，其特征在于，所述方法包括：

在智能设备处于休眠状态时，采集所述智能设备周围环境的图像；

若在采集的图像中检测到人物特征且具有所述人物特征的目标与所述智能设备之间的距离在第一指定距离内，则触发所述智能设备进行语音播报；

语音播报之后，若检测到所述目标与所述智能设备之间的距离在第二指定距离内，则唤醒所述智能设备，所述第二指定距离小于所述第一指定距离。
根据权利要求1所述的方法，其特征在于，所述人物特征包括以下特征的至少一种：人脸特征和人体特征。
根据权利要求1所述的方法，其特征在于，所述采集所述智能设备周围环境的图像，包括：

实时采集所述智能设备前方物体的彩色图像和深度图像；

若在采集的图像中检测到人物特征且具有所述人物特征的目标与所述智能设备之间的距离在第一指定距离内，则触发所述智能设备进行语音播报，包括：

实时基于所述彩色图像进行人物特征检测；

针对检测到的每个人物特征执行：

确定具有该人物特征的目标在深度图像中的对应数据；

根据具有该人物特征的目标在深度图像中的对应数据，确定具有该人物特征的目标与所述智能设备的距离；

若该距离在所述第一指定距离内，则触发所述智能设备进行语音播报。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

在语音播报过程中，若检测到至少一个具有人物特征的其他目标与所述智能设备之间的距离在所述第一指定距离内，在语音播报完毕后，不重复进行语音播报。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

在语音播报完毕且间隔设定时长后，若检测到至少一个具有人物特征的其他目标与所述智能设备之间的距离在所述第一指定距离内，再次进行语音播报。
根据权利要求1所述的方法，其特征在于，所述触发所述智能设备进行语音播报，包括：

触发所述智能设备采用大于预设音量的音量进行语音播报，所述预设音量为所述智能设备唤醒后与所述目标交互时的音量。
根据权利要求1-6任一所述的方法，其特征在于，所述触发所述智能设备进行语音播报，包括：

触发所述智能设备从预设播报内容集合中随机选择播报内容进行语音播报；或者

触发所述智能设备从预设播报内容集合中顺序选择播报内容进行语音播报；或者

触发所述智能设备对预设播报内容集合中的播报内容进行语音循环播报。
根据权利要求7所述的方法，其特征在于，所述方法还包括：

接收播报内容增加指令，将所述播报内容增加指令中包含的播报内容添加至所述播报内容集合中；或者

接收播报内容修改指令，根据所述播报内容修改指令对所述播报内容集合中相应的播报内容进行修改；或者

接收播报内容替换指令，根据所述播报内容替换指令替换所述播报内容集合中相应的播报内容。
根据权利要求1-6任一所述的方法，其特征在于，所述方法还包括：

进行语音播报的同时，在所述智能设备的屏幕上显示预设表情。
一种智能设备控制装置，其特征在于，所述装置包括：

图像采集模块，用于在智能设备处于休眠状态时，采集所述智能设备周围环境的图像；

预唤醒模块，用于若在采集的图像中检测到人物特征且具有所述人物特征的目标与所述智能设备之间的距离在第一指定距离内，则触发所述智能设备进行语音播报；

唤醒模块，用于语音播报之后，若检测到所述目标与所述智能设备之间的距离在第二指定距离内，则唤醒所述智能设备，所述第二指定距离小于所述第一指定距离。
一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如权利要求1-9中任一权利要求所述的方法。
一种计算装置，其特征在于，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1-9中任一权利要求所述的方法。