WO2020244160A1

WO2020244160A1 - 终端设备控制方法、装置、计算机设备及可读存储介质

Info

Publication number: WO2020244160A1
Application number: PCT/CN2019/118974
Authority: WO
Inventors: 车宏伟
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-06-05
Filing date: 2019-11-15
Publication date: 2020-12-10
Also published as: CN110377201A

Abstract

一种终端设备控制方法，涉及人脸识别领域，该方法包括：获取待识别图像，并对待识别图像进行人脸检测（S11）；判断是否检测到人脸图像（S12）；若检测到人脸图像，则获取人脸图像的预设关键特征点的初始状态信息（S13）；基于初始状态信息确定人脸图像的预设关键特征点的状态变化信息（S14）；当预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发第一预设状态变化信息对应的控制指令执行相应的控制操作（S15）。还提供一种终端设备控制装置、计算机设备及非易失性可读存储介质。可实现与终端设备交互更生动有趣，提高了用户使用体验。

Description

终端设备控制方法、装置、计算机设备及可读存储介质

本申请要求于2019年06月05日提交中国专利局，申请号为201910487841.2发明名称为“终端设备控制方法、装置、计算机装置及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及电子通信技术领域，具体涉及一种终端设备控制方法、装置、计算机设备及非易失性可读存储介质。

背景技术

随着通讯技术的发展，电脑、手机等设备的使用已经越来越普及。目前对电脑、手机的操作均是通过按键操作或者触摸操作完成，然而，无论是按键操作还是触摸操作均需要通过手动操作完成。这种手动操作方式太过单一，可能会对用户使用过程造成不便，且应用范围有限，影响用户使用体验。

发明内容

鉴于以上内容，有必要提出一种终端设备控制方法、装置、计算机设备及非易失性可读存储介质，其无需通过手动操作即可实现对终端设备进行控制，提高了用户使用体验。

本申请一实施方式提供一种终端设备控制方法，所述方法包括：获取待识别图像，并对所述待识别图像进行人脸检测；判断是否检测到人脸图像；若检测到人脸图像，则获取所述人脸图像的预设关键特征点的初始状态信息；基于所述初始状态信息确定所述人脸图像的预设关键特征点的状态变化信息；及当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。

本申请一实施方式提供一种终端设备控制装置，所述装置包括：检测模块，用于获取待识别图像，并对所述待识别图像进行人脸检测；判断模块，用于判断是否检测到人脸图像；获取模块，用于在检测到人脸图像时，获取所述人脸图像的预设关键特征点的初始状态信息；确定模块，用于基于所述初始状态信息确定所述人脸图像的预设关键特征点的状态变化信息；及控制模块，用于在所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。

本申请一实施方式提供一种计算机设备，所述计算机设备包括处理器及存储器，所述存储器上存储有若干计算机可读指令，所述处理器用于执行存储器中存储的计算机可读指令时实现如前面所述的终端设备控制方法的步骤。

本申请一实施方式提供一种非易失性可读存储介质，其上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如前面所述的终端设备控制方法的步骤。

上述终端设备控制方法、装置、计算机设备及非易失性可读存储介质，通过识别用户的表情变化或者头部偏转状态来实现控制终端设备，解放用户的双手，相对传统的手动操作方式，与终端设备交互更生动有趣，提高了用户使用体验。

附图说明

图1为本申请一实施例中终端设备控制方法的步骤流程图。

图2为本申请另一实施例中终端设备控制方法的步骤流程图。

图3为本申请一实施例中终端设备控制装置的功能模块图。

图4为本申请一实施例中计算机设备示意图。

如下具体实施方式将结合上述附图进一步说明本申请。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施例对本申请进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请，所描述的实施方式仅仅是本申请一部分实施方式，而不是全部的实施方式。基于本申请中的实施方式，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式，都属于本申请保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施方式的目的，不是旨在于限制本申请。

优选地，本申请的表情交互方法应用在一个或者多个计算机设备中。所述计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本电脑、平板电脑、服务器、手机等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

实施例一：

图1是本申请终端设备控制方法较佳实施例的步骤流程图。根据不同的需求，所述流程图中步骤的顺序可以改变，某些步骤可以省略。

参阅图1所示，所述终端设备控制方法具体包括以下步骤。

步骤S11、获取待识别图像，并对所述待识别图像进行人脸检测。

在一实施方式中，可以通过与摄像头(比如所述计算机设备的摄像头)进行通信来获取待识别图像，所述待识别图像可能包含有非人脸图像，故需要对所述待识别图像进行人脸检测，以识别出所述待识别图像中包含有人脸的人脸图像。

在一实施方式中，可以通过建立并训练一卷积神经网络模型来实现对所述待识别图像进行人脸检测。具体地，可以通过以下方式来实现对所述待识别图像进行人脸检测：可以先构建人脸样本数据库并建立一用于进行人脸检测的卷积神经网络模型，所述人脸样本数据库包含多个人的人脸信息，每个人的人脸信息可以包括多种角度，每种角度的人脸信息可以有多张图片；将人脸样本数据库中的人脸图像输入至所述卷积神经网络模型，使用卷积神经网络模型的默认参数进行卷积神经网络训练；根据训练中间结果，对默认参数的初始权值、训练速率、迭代次数等进行不断调整，直到得到最优的卷积神经网络模型的网络参数，最后将具有最优网络参数的卷积神经网络模型作为最终的识别模型，训练完成后，即可利用该最终得到的卷积神经网络模型进行人脸检测。

可以理解的，可以将所述待识别图像输入至该最终得到的卷积神经网络模型，模型的输出即为人脸检测结果。

步骤S12、判断是否检测到人脸图像。

在一实施方式中，可以根据所述卷积神经网络模型的输出来判断是否检测到人脸图像。若检测到人脸图像，则跳转至步骤S13。若未检测到人脸图像，则返回至步骤S11。

步骤S13，若检测到人脸图像，则获取所述人脸图像的预设关键特征点的初始状态信息。

在一实施方式中，所述人脸图像的预设关键特征点可以由眼睛、鼻子、嘴巴等部分构成。所述初始状态信息可以包括初始位置信息或者初始表情信息；当所述初始状态信息为所述预设关键特征点的初始位置信息时，可以实现根据所述人脸图像的运动状态信息执行相应的控制操作；当所述初始状态信息为所述预设关键特征点的初始表情信息时，可以实现根据所述人脸图像的表情变化信息执行相应的控制操作。

在一实施方式中，当所述初始状态信息为初始位置信息时，所述人脸图像的预设关键特征点的初始状态信息即为所述人脸图像的预设关键特征点的初始状态的位置信息。所述人脸图像的预设关键特征点的位置信息可以通过积分投影方式或者人脸对齐算法(比如：ASM算法、AAM算法、STASM算法等)从人脸图像中确定出。由于眼睛是人脸当中比较突出的人脸特征，可以先对眼睛进行精确定位，则脸部其他器官，如：眼眉、嘴巴、鼻子等，可以由潜在的分布关系得出比较准确的定位。

举例而言，预设关键特征点的位置定位通过对应于不同积分投影方式下产生的波峰或波谷进行。其中，积分投影分为垂直投影和水平投影，设f(x，y)表示图像(x，y)处的灰度值，在图像[y1，y2]和[x1，x2]区域的水平积分投影M _h(y)和垂直积分投影M _v(x)分别表示为：

其中，水平积分投影即将一行所有像素点的灰度值进行累加后再显示，而垂直积分投影即将一列所有像素点的灰度值进行累加后再显示。通过定位两个波谷点x1、x2从人脸图像中把横轴[x1，x2]区域的图像截取出来，即可实现人脸图像左右边界的定位。对左右边界定位后二值化待识别人脸图像，分别进行水平积分投影和垂直积分投影。

进一步的，利用对人脸图像的先验知识可知，眉毛和眼睛是人脸图像中较近的黑色区域，其对应着水平积分投影曲线上的前两个极小值点。第一个极小值点对应的是眉毛在纵轴上的位置，记做y _brow，第二个极小值点对应的是眼睛在纵轴上的位置，记做y _eye，第三个极小值点对应的是鼻子在纵轴上的位置，记做y _nose，第四个极小值点对应的是嘴巴在纵轴上的位置，记做y _month。同样，人脸图像中心对称轴两侧出现两个极小值点，分别对应左右眼在横轴上的位置，记做x _left-eye、x _right-eye；眉毛在横轴上的位置和眼睛相同；嘴巴和鼻子在横轴上的位置为(x _left-eye+x _right-eye)/2。

在一实施方式中，当所述初始状态信息为初始表情信息时，所述人脸图像的预设关键特征点的初始状态信息即为所述人脸图像的预设关键特征点的初始状态的表情信息。所述人脸表情信息比如可以具有以下表现形式：高兴时的面部动作：嘴角翘起、面颊上抬起皱、眼睑收缩、眼睛尾部会形成“鱼尾纹”。伤心时的面部特征：眯眼、眉毛收紧、嘴角下拉、下巴抬起或收紧。害怕时的面部特征：嘴巴和眼睛张开、眉毛上扬、鼻孔张大。愤怒时的面部特征：眉毛下垂、前额紧皱、眼睑和嘴唇紧张。厌恶时的面部特征：嗤鼻、上嘴唇上抬、眉毛下垂、眯眼。惊讶时的面部特征：下颚下垂、嘴唇和嘴巴放松、眼睛张大、眼睑和眉毛微抬。轻蔑时的面部特征：嘴角一侧抬起、作讥笑或得意笑状等。

可以通过提取所述预设关键特征点的待识别特征向量，并根据所述待识别特征向量和预设表情库中的每个预设表情的预设特征向量，确定所述人脸图像与每个所述预设表情属于相似概率，进而根据计算得到的相似概率来得到人脸表情信息。其中所述待识别特征向量可以包括形状特征向量和/或纹理特征向量。

在一实施方式中，当所述待识别特征向量为形状特征向量时，则提取所述预设关键特征点中的形状特征向量；当所述待识别特征向量为纹理特征向量时，则提取所述预设关键特征点中的纹理特征向量；当所述待识别特征向量为形状特征向量和纹理特征向量时，则提取所述预设关键特征点中的形状特征向量和纹理特征向量。

在一实施方式中，可以通过以下方式来确定所述人脸图像与每个所述预设表情的相似概率：获取待识别特征向量和每个预设表情的预设特征向量之间的距离值；根据距离值确定所述人脸图像与距离值对应的预设表情属于同种表情的相似概率。其中，所述距离值可以为广义马氏距离。可以通过如下公式确定待识别特征向量和预设表情的预设特征向量之间的距离值：

d _M(y,x _j)＝(y-x _j) ^T*M*(y-x _j)；

其中，y为待识别特征向量，x _j为预设表情库中的第j个预设表情的预设特征向量，M为目标度量矩阵；j为大于或者等于1的整数；d _M(y,x _j)为待识别特征向量和预设表情库中的第j个预设表情的预设特征向量之间的距离值；(y-x _j)为待识别特征向量与第j个预设表情的预设特征向量的差值；(y-x _j) ^T为待识别特征向量与第j个预设表情的预设特征向量的差值的转置。

在一个实施例中，可以通过如下公式确定所述人脸图像与距离值对应的预设表情属于同种表情的相似概率：

p＝{1+exp[D-b]} ^-1；

其中，p为所述人脸图像与距离值对应的预设表情属于同种表情的相似概率；D为距离值；b为偏置量。

步骤S14、基于所述初始状态信息确定所述人脸图像的预设关键特征点的状态变化信息。

在一实施方式中，当获取到所述人脸图像的预设关键特征点的初始状态信息后，可以基于所述初始状态信息确定所述人脸图像的预设关键特征点的状态变化信息。所述状态变化信息是以所述初始状态信息为基准，比如从所述初始状态信息开始计时，预设时间内的状态变化信息。

步骤S15、当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。

在一实施方式中，当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令，进而所述终端设备会根据所述控制指令执行相应的控制操作。比如，当获取到的所述预设关键特征点的状态变化信息为头部向左偏转的动作时，所述终端设备执行上一页控制指令，当获取到的所述预设关键特征点的状态变化信息为头部向右偏转的动作时，所述终端设备执行下一页控制指令，当获取到的所述预设关键特征点的状态变化信息为点头时，所述终端设备执行播放或者暂停指令。

在一实施方式中，为了提高操作准确性，所述步骤S15可进一步包括：当所述预设关键特征点的状态变化信息为所述预设状态变化信息库中的第一预设状态变化信息时，判断所述预设关键特征点的状态变化信息是否为有效状态变化信息；及当所述预设关键特征点的状态变化信息为有效状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。

在一实施方式中，当所述初始状态信息为所述预设关键特征点的初始位置信息时，获取所述人脸图像在状态变化过程中的平均偏转速度和/或偏转角度，以根据所述平均偏转速度和/或所述偏转角度判断所述预设关键特征点的状态变化信息是否为有效状态变化信息。比如，若所述初始状态信息为头部运动动作，则可以通过获取在状态变化过程中的头部平均偏转速度和/或偏转角度，来判断所述预设关键特征点的本次状态变化信息是否为有效状态变化信息。

举例而言，正常情况下，当一用户偏头与人沟通、偏头观看事务或者沟通点头进行确认时，其头部运动速度一般比较快，为了避免发生误控制，可以设定一预设速度值来避免发生误控制终端设备。比如，可以判断本次状态变化过程中头部运动平均速度是否小于第一预设速度值，若头部运动平均速度小于第一预设速度值，则判定所述预设关键特征点的本次状态变化信息为有效状态变化信息，基于该有效状态变化信息生成对应的控制指令，若头部运动平均速度不小于第一预设速度值，则判定所述预设关键特征点的本次状态变化信息为无效状态变化信息，不产生对应的控制指令。所述预设速度值可以具有30％的正负偏差。

在一实施方式中，还可以通过判断头部的偏转角度是否大于等于第一角度阈值来判断所述预设关键特征点的本次状态变化信息是否为有效状态变化信息，若头部的偏转角度大于等于第一角度阈值，则判定所述预设关键特征点的本次状态变化信息为有效状态变化信息，基于该有效状态变化信息生成对应的控制指令，若头部的偏转角度小于第一角度阈值，则判定所述预设关键特征点的本次状态变化信息为无效状态变化信息。所述第一角度阈值可以设置成比用户平常沟通所产生的偏转角度更大的角度值。

可以理解的，还可以通过同时判断头部运动平均速度是否小于第一预设速度值且头部的偏转角度是否大于等于第一角度阈值来判断所述预设关键特征点的本次状态变化信息是否为有效状态变化信息。

在一实施方式中，当所述初始状态信息为所述预设关键特征点的初始表情信息时，获取所述人脸图像在状态变化过程中的表情持续时间，以根据所述表情持续时间判断所述预设关键特征点的状态变化信息是否为有效状态变化信息。比如，可以通过获取在状态变化过程中的脸部表情的持续时间是否大于等于预设时间，来判断所述预设关键特征点的本次状态变化信息是否为有效状态变化信息。若在本次状态变化过程中的脸部表情的持续时间大于等于预设时间，则判断本次状态变化信息为有效状态变化信息，基于该有效状态变化信息生成对应的控制指令，若在本次状态变化过程中的脸部表情的持续时间小于预设时间，则判断本次状态变化信息为无效状态变化信息，不产生对应的控制指令。

在一实施方式中，还可以基于所述预设关键特征点的本次状态变化信息的时间节点与上一次通过所述预设关键特征点而产生的控制指令的时间节点之间的差值，来判断所述预设关键特征点的本次状态变化信息是否为有效状态变化信息。比如，获取所述预设关键特征点的状态变化信息的发生时刻，判断所述预设关键特征点的状态变化信息的发生时间与上一状态变化信息的发生时间的差值是否大于等于预设时间。若本次状态变化信息的发生时间与上一状态变化信息的发生时间的差值大于等于所述预设时间，则判定本次状态变化信息为有效状态变化信息，并基于该有效状态变化信息生成对应的控制指令；若本次状态变化信息的发生时间与上一状态变化信息的发生时间的差值小于所述预设时间，则判定本次状态变化信息为无效状态变化信息，不产生对应的控制指令。

请参阅图2，与图1示出的终端设备控制方法相比，图2示处的终端设备控制方法还包括步骤S16及步骤S17。

步骤S16、配置所述预设关键特征点的上下左右检测边界信息，以建立得到一特征点检测框。

在一实施方式中，所述特征点检测框即用于检测所述预设关键特征点的状态变化信息。通过配置上下左关键特征点的检测边界信息，可以建立得到一特征点检测框，在进行人脸行为信息(头部偏转、面部表情)检测时，需确保人脸的关键特征点始终落入在所述特征点检测框内，避免影响检测准确性。

步骤S17、将所述预设关键特征点的多个预设状态变化信息与多个预设控制指令相关联。

在一实施方式中，可以预先建立多个预设状态变化信息与终端设备的多个预设控制指令的映射关系。比如，预先将预设第一状态变化信息与终端设备的第一预设控制指令相关联，将第二预设状态变化信息与终端设备的第二预设控制指令相关联，将第三预设状态变化信息与终端设备的第三预设控制指令相关联。所述预设控制指令可以为终端设备中的一些常用指令，例如下一页、上一页、播放、暂停、鼠标左键、鼠标右键等。比如预设第一状态变化信息为头部向右偏转对应下一页控制指令，预设第二状态变化信息为头部向左偏转对应上一页控制指令，预设第三状态变化信息为点头对应播放或者暂停控制指令；再比如预设第一状态变化信息为面部无表情转变到高兴表情对应下一页控制指令，预设第二状态变化信息为面部无表情转变到伤心表情对应上一页控制指令。

上述终端设备控制方法，通过识别用户的表情变化或者头部偏转状态来实现控制终端设备，解放用户的双手，相对传统的手动操作方式，与终端设备交互更生动有趣，提高了用户使用体验。

实施例二：

图3为本申请终端设备控制装置较佳实施例的功能模块图。

参阅图3所示，所述终端设备控制装置10可以包括配置模块101、关联模块102、检测模块103、判断模块104、获取模块105、确定模块106及控制模块107。

所述配置模块101用于配置所述预设关键特征点的上下左右检测边界信息，以建立得到一特征点检测框。

在一实施方式中，所述特征点检测框即用于检测所述预设关键特征点的状态变化信息。所述配置模块101通过配置上下左关键特征点的检测边界信息，可以建立得到一特征点检测框，在进行人脸行为信息(头部偏转、面部表情)检测时，需确保人脸的关键特征点始终落入在所述特征点检测框内，避免影响检测准确性。

所述关联模块102用于将所述预设关键特征点的多个预设状态变化信息与多个预设控制指令相关联。

在一实施方式中，所述关联模块102可以预先建立多个预设状态变化信息与终端设备的多个预设控制指令的映射关系。比如，所述关联模块102预先将预设第一状态变化信息与终端设备的第一预设控制指令相关联，将第二预设状态变化信息与终端设备的第二预设控制指令相关联，将第三预设状态变化信息与终端设备的第三预设控制指令相关联。所述预设控制指令可以为终端设备中的一些常用指令，例如下一页、上一页、播放、暂停、鼠标左键、鼠标右键等。比如预设第一状态变化信息为头部向右偏转对应下一页控制指令，预设第二状态变化信息为头部向左偏转对应上一页控制指令，预设第三状态变化信息为点头对应播放或者暂停控制指令；再比如预设第一状态变化信息为面部无表情转变到高兴表情对应下一页控制指令，预设第二状态变化信息为面部无表情转变到伤心表情对应上一页控制指令。

所述检测模块103用于获取待识别图像，并对所述待识别图像进行人脸检测。

在一实施方式中，所述检测模块103可以通过与摄像头(比如所述计算机设备的摄像头)进行通信来获取待识别图像，所述待识别图像可能包含有非人脸图像，故需要对所述待识别图像进行人脸检测，以识别出所述待识别图像中包含有人脸的人脸图像。

在一实施方式中，所述检测模块103可以通过建立并训练一卷积神经网络模型来实现对所述待识别图像进行人脸检测。具体地，可以通过以下方式来实现对所述待识别图像进行人脸检测：可以先构建人脸样本数据库并建立一用于进行人脸检测的卷积神经网络模型，所述人脸样本数据库包含多个人的人脸信息，每个人的人脸信息可以包括多种角度，每种角度的人脸信息可以有多张图片；将人脸样本数据库中的人脸图像输入至所述卷积神经网络模型，使用卷积神经网络模型的默认参数进行卷积神经网络训练；根据训练中间结果，对默认参数的初始权值、训练速率、迭代次数等进行不断调整，直到得到最优的卷积神经网络模型的网络参数，最后将具有最优网络参数的卷积神经网络模型作为最终的识别模型，训练完成后，即可利用该最终得到的卷积神经网络模型进行人脸检测。

可以理解的，所述检测模块103可以将所述待识别图像输入至该最终得到的卷积神经网络模型，模型的输出即为人脸检测结果。

所述判断模块104用于判断是否检测到人脸图像。

在一实施方式中，所述判断模块104可以根据所述卷积神经网络模型的输出来判断是否检测到人脸图像。若检测到人脸图像，则进行后续关键特征点识别。若未检测到人脸图像，则重新对所述待识别图像进行人脸检测。

所述获取模块105用于在检测到人脸图像时，获取所述人脸图像的预设关键特征点的初始状态信息。

所述获取模块105可以通过提取所述预设关键特征点的待识别特征向量，并根据所述待识别特征向量和预设表情库中的每个预设表情的预设特征向量，确定所述人脸图像与每个所述预设表情属于相似概率，进而根据计算得到的相似概率来得到人脸表情信息。其中所述待识别特征向量可以包括形状特征向量和/或纹理特征向量。

在一实施方式中，所述获取模块105可以通过以下方式来确定所述人脸图像与每个所述预设表情的相似概率：获取待识别特征向量和每个预设表情的预设特征向量之间的距离值；根据距离值确定所述人脸图像与距离值对应的预设表情属于同种表情的相似概率。其中，所述距离值可以为广义马氏距离。可以通过如下公式确定待识别特征向量和预设表情的预设特征向量之间的距离值：

d _M(y,x _j)＝(y-x _j) ^T*M*(y-x _j)；

在一个实施例中，所述获取模块105可以通过如下公式确定所述人脸图像与距离值对应的预设表情属于同种表情的相似概率：

p＝{1+exp[D-b]} ^-1；

所述确定模块106用于基于所述初始状态信息确定所述人脸图像的预设关键特征点的状态变化信息。

在一实施方式中，当获取到所述人脸图像的预设关键特征点的初始状态信息后，所述确定模块106可以基于所述初始状态信息确定所述人脸图像的预设关键特征点的状态变化信息。所述状态变化信息是以所述初始状态信息为基准，比如从所述初始状态信息开始计时，预设时间内的状态变化信息。

当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，所述控制模块107触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。

在一实施方式中，当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，所述控制模块107触发所述第一预设状态变化信息对应的控制指令，进而所述终端设备会根据所述控制指令执行相应的控制操作。比如，当获取到的所述预设关键特征点的状态变化信息为头部向左偏转的动作时，所述终端设备执行上一页控制指令，当获取到的所述预设关键特征点的状态变化信息为头部向右偏转的动作时，所述终端设备执行下一页控制指令，当获取到的所述预设关键特征点的状态变化信息为点头时，所述终端设备执行播放或者暂停指令。

在一实施方式中，为了提高操作准确性，所述确定模块106需确定所述预设关键特征点的状态变化信息是否为有效状态变化消息，具体可以通过以下方式实现：当所述预设关键特征点的状态变化信息为所述预设状态变化信息库中的第一预设状态变化信息时，判断所述预设关键特征点的状态变化信息是否为有效状态变化信息；及当所述预设关键特征点的状态变化信息为有效状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。

在一实施方式中，所述确定模块106还可以通过判断头部的偏转角度是否大于等于第一角度阈值来判断所述预设关键特征点的本次状态变化信息是否为有效状态变化信息，若头部的偏转角度大于等于第一角度阈值，则判定所述预设关键特征点的本次状态变化信息为有效状态变化信息，基于该有效状态变化信息生成对应的控制指令，若头部的偏转角度小于第一角度阈值，则判定所述预设关键特征点的本次状态变化信息为无效状态变化信息。所述第一角度阈值可以设置成比用户平常沟通所产生的偏转角度更大的角度值。

在一实施方式中，当所述初始状态信息为所述预设关键特征点的初始表情信息时，可以获取所述人脸图像在状态变化过程中的表情持续时间，以根据所述表情持续时间判断所述预设关键特征点的状态变化信息是否为有效状态变化信息。比如，可以通过获取在状态变化过程中的脸部表情的持续时间是否大于等于预设时间，来判断所述预设关键特征点的本次状态变化信息是否为有效状态变化信息。若在本次状态变化过程中的脸部表情的持续时间大于等于预设时间，则判断本次状态变化信息为有效状态变化信息，基于该有效状态变化信息生成对应的控制指令，若在本次状态变化过程中的脸部表情的持续时间小于预设时间，则判断本次状态变化信息为无效状态变化信息，不产生对应的控制指令。

在一实施方式中，所述确定模块106还可以基于所述预设关键特征点的本次状态变化信息的时间节点与上一次通过所述预设关键特征点而产生的控制指令的时间节点之间的差值，来判断所述预设关键特征点的本次状态变化信息是否为有效状态变化信息。比如，获取所述预设关键特征点的状态变化信息的发生时刻，判断所述预设关键特征点的状态变化信息的发生时间与上一状态变化信息的发生时间的差值是否大于等于预设时间。若本次状态变化信息的发生时间与上一状态变化信息的发生时间的差值大于等于所述预设时间，则判定本次状态变化信息为有效状态变化信息，并基于该有效状态变化信息生成对应的控制指令；若本次状态变化信息的发生时间与上一状态变化信息的发生时间的差值小于所述预设时间，则判定本次状态变化信息为无效状态变化信息，不产生对应的控制指令。

上述终端设备控制装置，通过识别用户的表情变化或者头部偏转状态来实现控制终端设备，解放用户的双手，相对传统的手动操作方式，与终端设备交互更生动有趣，提高了用户使用体验。

图4为本申请计算机设备较佳实施例的示意图。

所述计算机设备1包括存储器20、处理器30以及存储在所述存储器20中并可在所述处理器30上运行的计算机可读指令40，例如终端设备控制程序。所述处理器30执行所述计算机可读指令40时实现上述终端设备控制方法实施例中的步骤，例如图1所示的步骤S11～S15或图2所示的步骤S11～S17。或者，所述处理器30执行所述计算机可读指令40时实现上述终端设备控制装置实施例中各模块的功能，例如图3中的模块101～107。

示例性的，所述计算机可读指令40可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器20中，并由所述处理器30执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段，所述指令段用于描述所述计算机可读指令40在所述计算机设备1中的执行过程。例如，所述计算机可读指令40可以被分割成图3中的配置模块101、关联模块102、检测模块103、判断模块104、获取模块105、确定模块106及控制模块107。各模块具体功能参见实施例二。

所述计算机设备1可以是桌上型计算机、笔记本、掌上电脑、手机、平板电脑及云端服务器等计算设备。本领域技术人员可以理解，所述示意图仅仅是计算机设备1的示例，并不构成对计算机设备1的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述计算机设备1还可以包括输入输出设备、网络接入设备、总线等。

所称处理器30可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器30也可以是任何常规的处理器等，所述处理器30是所述计算机设备1的控制中心，利用各种接口和线路连接整个计算机设备1的各个部分。

所述存储器20可用于存储所述计算机可读指令40和/或模块/单元，所述处理器30通过运行或执行存储在所述存储器20内的计算机可读指令和/或模块/单元，以及调用存储在存储器20内的数据，实现所述计算机设备1的各种功能。所述存储器20可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机设备1的使用所创建的数据(比如音频数据)等。此外，存储器20可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。

所述计算机设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个非易失性可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性可读存储介质中，所述计算机可读指令在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述非易失性可读介质可以包括：能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)。

在本申请所提供的几个实施例中，应该理解到，所揭露的计算机设备和方法，可以通过其它的方式实现。例如，以上所描述的计算机设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

另外，在本申请各个实施例中的各功能单元可以集成在相同处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。计算机设备权利要求中陈述的多个单元或计算机设备也可以由同一个单元或计算机设备通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种终端设备控制方法，其特征在于，所述方法包括：

获取待识别图像，并对所述待识别图像进行人脸检测；

判断是否检测到人脸图像；

若检测到人脸图像，则获取所述人脸图像的预设关键特征点的初始状态信息；

基于所述初始状态信息确定所述人脸图像的预设关键特征点的状态变化信息；及

当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。
如权利要求1所述的终端设备控制方法，其特征在于，所述获取待识别图像的步骤之前还包括：

配置所述预设关键特征点的上下左右检测边界信息，以建立得到一特征点检测框；及

将所述预设关键特征点的多个预设状态变化信息与多个预设控制指令相关联。
如权利要求1或2所述的终端设备控制方法，其特征在于，所述对所述待识别图像进行人脸检测的步骤包括：

根据预设多个人脸样本训练得到用于进行人脸检测的卷积神经网络模型；及

利用所述卷积神经网络模型对所述待识别图像进行人脸检测。
如权利要求1或2所述的终端设备控制方法，其特征在于，所述初始状态信息包括初始位置信息或者初始表情信息；当所述初始状态信息为所述预设关键特征点的初始位置信息时，以根据所述人脸图像的运动状态信息执行相应的控制操作；当所述初始状态信息为所述预设关键特征点的初始表情信息时，以根据所述人脸图像的表情变化信息执行相应的控制操作。
如权利要求4所述的终端设备控制方法，其特征在于，所述当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作的步骤包括：

当所述预设关键特征点的状态变化信息为所述预设状态变化信息库中的第一预设状态变化信息时，判断所述预设关键特征点的状态变化信息是否为有效状态变化信息；及

当所述预设关键特征点的状态变化信息为有效状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。
如权利要求5所述的终端设备控制方法，其特征在于，所述判断所述预设关键特征点的状态变化信息是否为有效状态变化信息的步骤包括：

当所述初始状态信息为所述预设关键特征点的初始位置信息时，获取所述人脸图像在状态变化过程中的平均偏转速度和/或偏转角度，以根据所述平均偏转速度和/或所述偏转角度判断所述预设关键特征点的状态变化信息是否为有效状态变化信息；及

当所述初始状态信息为所述预设关键特征点的初始表情信息时，获取所述人脸图像在状态变化过程中的表情持续时间，以根据所述表情持续时间判断所述预设关键特征点的状态变化信息是否为有效状态变化信息。
如权利要求5所述的终端设备控制方法，其特征在于，所述判断所述预设关键特征点的状态变化信息是否为有效状态变化信息的步骤包括：

获取所述预设关键特征点的状态变化信息的发生时刻；

判断所述预设关键特征点的状态变化信息的发生时刻与上一状态变化信息的发生时刻的差值是否大于等于预设时间；及

根据所述判断结果确定所述预设关键特征点的状态变化信息是否为有效状态变化信息。
一种终端设备控制装置，其特征在于，所述装置包括：

检测模块，用于获取待识别图像，并对所述待识别图像进行人脸检测；

判断模块，用于判断是否检测到人脸图像；

获取模块，用于在检测到人脸图像时，获取所述人脸图像的预设关键特征点的初始状态信息；

确定模块，用于基于所述初始状态信息确定所述人脸图像的预设关键特征点的状态变化信息；及

控制模块，用于在所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。
一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器用于存储计算机可读指令，所述处理器执行所述计算机可读指令以实现以下步骤：

获取待识别图像，并对所述待识别图像进行人脸检测；

判断是否检测到人脸图像；

若检测到人脸图像，则获取所述人脸图像的预设关键特征点的初始状态信息；

基于所述初始状态信息确定所述人脸图像的预设关键特征点的状态变化信息；及

当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。
如权利要求9所述的计算机设备，其特征在于，在所述获取待识别图像的步骤之前，所述处理器执行所述计算机可读指令还用以实现以下步骤：

配置所述预设关键特征点的上下左右检测边界信息，以建立得到一特征点检测框；及

将所述预设关键特征点的多个预设状态变化信息与多个预设控制指令相关联。
如权利要求9或10所述的计算机设备，其特征在于，所述初始状态信息包括初始位置信息或者初始表情信息；当所述初始状态信息为所述预设关键特征点的初始位置信息时，以根据所述人脸图像的运动状态信息执行相应的控制操作；当所述初始状态信息为所述预设关键特征点的初始表情信息时，以根据所述人脸图像的表情变化信息执行相应的控制操作。
如权利要求11所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令以实现所述当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作时，包括以下步骤：

当所述预设关键特征点的状态变化信息为所述预设状态变化信息库中的第一预设状态变化信息时，判断所述预设关键特征点的状态变化信息是否为有效状态变化信息；及

当所述预设关键特征点的状态变化信息为有效状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。
如权利要求12所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令以实现所述判断所述预设关键特征点的状态变化信息是否为有效状态变化信息时，包括以下步骤：

当所述初始状态信息为所述预设关键特征点的初始位置信息时，获取所述人脸图像在状态变化过程中的平均偏转速度和/或偏转角度，以根据所述平均偏转速度和/或所述偏转角度判断所述预设关键特征点的状态变化信息是否为有效状态变化信息；及

当所述初始状态信息为所述预设关键特征点的初始表情信息时，获取所述人脸图像在状态变化过程中的表情持续时间，以根据所述表情持续时间判断所述预设关键特征点的状态变化信息是否为有效状态变化信息。
如权利要求12所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令以实现所述判断所述预设关键特征点的状态变化信息是否为有效状态变化信息时，包括以下步骤：

获取所述预设关键特征点的状态变化信息的发生时刻；

判断所述预设关键特征点的状态变化信息的发生时刻与上一状态变化信息的发生时刻的差值是否大于等于预设时间；及

根据所述判断结果确定所述预设关键特征点的状态变化信息是否为有效状态变化信息。
一种非易失性可读存储介质，其上存储有计算机可读指令，其特征在于，所述计算机可读指令被处理器执行时实现以下步骤：

获取待识别图像，并对所述待识别图像进行人脸检测；

判断是否检测到人脸图像；

若检测到人脸图像，则获取所述人脸图像的预设关键特征点的初始状态信息；

基于所述初始状态信息确定所述人脸图像的预设关键特征点的状态变化信息；及

当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。
如权利要求15所述的存储介质，其特征在于，在所述获取待识别图像的步骤之前，所述计算机可读指令被所述处理器执行还用以实现以下步骤：

配置所述预设关键特征点的上下左右检测边界信息，以建立得到一特征点检测框；及

将所述预设关键特征点的多个预设状态变化信息与多个预设控制指令相关联。
如权利要求15或16所述的存储介质，其特征在于，所述初始状态信息包括初始位置信息或者初始表情信息；当所述初始状态信息为所述预设关键特征点的初始位置信息时，以根据所述人脸图像的运动状态信息执行相应的控制操作；当所述初始状态信息为所述预设关键特征点的初始表情信息时，以根据所述人脸图像的表情变化信息执行相应的控制操作。
如权利要求17所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行以实现所述当所述预设关键特征点的状态变化信息为预设状态变化信息库中的第一预设状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作时，包括以下步骤：

当所述预设关键特征点的状态变化信息为所述预设状态变化信息库中的第一预设状态变化信息时，判断所述预设关键特征点的状态变化信息是否为有效状态变化信息；及

当所述预设关键特征点的状态变化信息为有效状态变化信息时，触发所述第一预设状态变化信息对应的控制指令执行相应的控制操作。
如权利要求18所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行以实现所述判断所述预设关键特征点的状态变化信息是否为有效状态变化信息时，包括以下步骤：

当所述初始状态信息为所述预设关键特征点的初始位置信息时，获取所述人脸图像在状态变化过程中的平均偏转速度和/或偏转角度，以根据所述平均偏转速度和/或所述偏转角度判断所述预设关键特征点的状态变化信息是否为有效状态变化信息；及

当所述初始状态信息为所述预设关键特征点的初始表情信息时，获取所述人脸图像在状态变化过程中的表情持续时间，以根据所述表情持续时间判断所述预设关键特征点的状态变化信息是否为有效状态变化信息。
如权利要求18所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行以实现所述判断所述预设关键特征点的状态变化信息是否为有效状态变化信息的步骤包括：

获取所述预设关键特征点的状态变化信息的发生时刻；

判断所述预设关键特征点的状态变化信息的发生时刻与上一状态变化信息的发生时刻的差值是否大于等于预设时间；及

根据所述判断结果确定所述预设关键特征点的状态变化信息是否为有效状态变化信息。