WO2018086461A1

WO2018086461A1 - 一种基于单目手势识别的视觉跟随方法及机器人

Info

Publication number: WO2018086461A1
Application number: PCT/CN2017/107905
Authority: WO
Inventors: 张雷
Original assignee: 南京阿凡达机器人科技有限公司
Priority date: 2016-11-09
Filing date: 2017-10-26
Publication date: 2018-05-17
Also published as: CN106502418A; CN106502418B

Abstract

一种基于单目手势识别的视觉跟随方法及机器人，通过识别一个特征手势，实时得到精确的机器人与跟踪目标的偏离角度值，易于精确追踪，跟随动作更自然。另外，其初始距离可以通过单点测距模块测量得到，通过识别一个特征手势，实时得到精确的机器人与跟踪目标的相对距离，跟踪精度更高。该方法及机器人准确率高于色块跟随，成本较3D体感方案大大降低，大大提高了跟踪的准确率，用户交互顺畅，极易掌握操作要点，使用方便。

Description

一种基于单目手势识别的视觉跟随方法及机器人

本申请要求2016年11月09日提交的申请号为：201610984710.1、发明名称为“一种基于单目手势识别的视觉跟随方法”的中国专利申请的优先权，其全部内容合并在此。

技术领域

本发明涉及机器人监控技术领域，具体是一种基于单目手势识别的视觉跟随方法及机器人。

背景技术

目前家用服务机器人大多具有单目摄像机，基于单目摄像机的人体跟随系统大多使用色块跟随的方式，该方式在程序启动时，指定单目摄像头一块预览区域，并在后续的目标移动中不断跟随目标行走。但该种方法存在以下缺陷：

1、色块跟随方法根据指定的初始色块，进行跟踪，因色块跟随方法的缺陷，目标非常容易跟丢；

2、操作繁琐，用户不易理解操作要点。

发明内容

本发明要解决的问题是提供一种基于单目手势识别的视觉跟随方法及机器人，该方法通过识别一个特征手势，实时得到精确的机器人与初始位置的空间偏差比率，实现精确跟踪，简单易行，成本较低。

为实现上述发明目的，本发明的基于单目手势识别的视觉跟随方法，包括以下步骤：

S1当接收到跟踪指令时，获取机器人距离跟踪目标的初始距离和所述跟踪目标的手势的实际高度；

S2在对所述跟踪目标进行跟踪、且达到了预设拍摄时间间隔时，利用机器人的单目摄像头拍摄包含所述跟踪目标的所述手势在内的跟踪场景图片；

S3对所述跟踪场景图片中的所述手势进行识别，获得所述手势在所述跟踪场景图片中的起点坐标和大小参数；

S4根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述机器人距离所述跟踪目标的当前距离和所述手势在实际空间的X轴上的偏离角度值；

S5将所述当前距离和预设距离阈值范围进行比较，得到第一比较结果；

S6将所述偏离角度值和预设角度阈值范围进行比较，得到第二比较结果；

S7根据所述第一比较结果和所述第二比较结果，控制所述机器人执行相应的跟随操作。

进一步，所述步骤S1具体包括以下步骤：

当接收到跟踪指令时，通过机器人的单点测距模块，测量得到所述机器人距离所述跟踪目标的所述初始距离；

利用机器人的单目摄像头拍摄包含所述跟踪目标的所述手势在内的初始场景图片；

对所述初始场景图片中的所述手势进行识别，获得所述手势在所述初始场景图片中的起点坐标和高度参数；

根据所述初始距离和所述单目摄像头的预设可视角，计算得到所述初始场景图片对应的初始场景的实际高度；

根据所述初始场景图片对应的初始场景的实际高度、所述手势在所述初始场景图片中的高度参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势的实际高度。

进一步，所述根据所述初始距离和所述单目摄像头的预设可视角，计算得到所述初始场景图片对应的初始场景的实际高度的计算公式为：

H3＝2*tanα*D1 (1)

式(1)中，H3为所述初始场景图片对应的初始场景的实际高度，α为所述单目摄像头的预设可视角，D1为所述初始距离。

进一步，所述根据所述初始场景图片对应的初始场景的实际高度、所述手势在所述初始场景图片中的高度参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势的实际高度的计算公式为：

H4＝H2*H3/H1 (3)

式(3)中，H4为所述跟踪目标的手势的实际高度，H2为所述手势在所述初始场景图片中的高度参数，H1为所述单目摄像头的预设图片分辨率中的高度分辨率，H3为所述初始场景图片对应的初始场景的实际高度。

进一步，所述步骤S4中，计算得到所述机器人距离所述跟踪目标的当前距离的计算公式如下：

H6＝H1*H4/H5 (4)

式(4)中，H6为所述跟踪场景图片对应的跟踪场景的实际高度，H1为所述单目摄像头的预设图片分辨率中的高度分辨率，H4为所述手势的实际高度，H5为所述手势在所述跟踪场景图片中大小参数中的高度参数；

D2＝H6/(2*tanα) (5)

式(5)中，D2为所述机器人距离所述跟踪目标的当前距离，H6为所述跟踪场景图片对应的跟踪场景的实际高度，α为所述单目摄像头的预设可视角。

进一步，所述步骤S4中，计算得到所述手势在实际空间的X轴上的偏离角度值包括以下步骤：

根据所述手势在所述跟踪场景图片中的起点坐标和所述手势在所述跟踪场景图片中的大小参数，计算得到所述手势在所述跟踪场景图片中的中心坐标；

根据所述单目摄像头的预设图片分辨率和所述手势在所述跟踪场景图片中的中心坐标，计算得到所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量；

根据所述图片偏移量、所述手势的实际高度、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势在实际空间的X轴上的实际偏移量；

根据所述实际偏移量和所述机器人距离所述跟踪目标的当前距离，计算得到所述手势在在实际空间的X轴上的偏离角度值。

进一步，根据所述手势在所述跟踪场景图片中的起点坐标和所述手势在所述跟踪场景图片中的大小参数，计算得到所述手势在所述跟踪场景图片中的中心坐标的计算公式如下：

X4＝X3+(W4/2) (6)

式(6)中，X4为所述手势在所述跟踪场景图片中的中心坐标的X轴坐标，X3为所述手势在所述跟踪场景图片中的起点坐标中的X轴起点坐标，W4为所述手势在所述跟踪场景图片中的大小参数中的宽度参数；

Y4＝Y3+(H5/2) (7)

式(7)中，Y4为所述手势在所述跟踪场景图片中的中心坐标的Y轴坐标，Y3为所述手势在所述跟踪场景图片中的起点坐标中的Y轴起点坐标，H5为所述手势在所述跟踪场景图片中的大小参数中的高度参数。

进一步，所述根据所述单目摄像头的预设图片分辨率和所述手势在所述跟踪场景图片中的中心坐标，计算得到所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量的计算公式如下：

O1＝X4–(W1/2) (8)

式(8)中，O1为所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量，X4为所述手势在所述跟踪场景图片中的中心坐标的X轴坐标，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率；

所述根据所述图片偏移量、所述手势的实际高度、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势在实际空间的X轴上的实际偏移量的计算公式为：

H6＝H1*H4/H5 (4)

W5＝W1*H6/H1 (10)

式(10)中，W5为所述跟踪场景图片对应的跟踪场景的实际宽度，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率，H6为所述跟踪场景图片对应的跟踪场景的实际高度；

O2＝O1*W5/W1 (11)

式(11)中，O1为所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量，W5为所述跟踪场景图片对应的跟踪场景的实际宽度，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率，O2为所述跟踪目标的手势在实际空间的X轴上的实际偏移量。

进一步，所述根据所述实际偏移量和所述机器人距离所述跟踪目标的当前距离，计算得到所述手势在在实际空间的X轴上的偏离角度值的计算公式如下：

β2＝arctan(O2/D2) (9)

式(9)中，β2为所述手势在在实际空间的X轴上的偏离角度值，O2为所述跟踪目标的手势在实际空间的X轴上的实际偏移量，D2为所述机器人距离所述跟踪目标的当前距离。

本发明还提供一种机器人，包括：

单点测距模块，用于当接收到跟踪指令时，获取机器人距离跟踪目标的初始距离；

计算模块，用于当接收到跟踪指令时，获取所述跟踪目标的手势的实际高度；

单目摄像头，用于在对所述跟踪目标进行跟踪、且达到了预设拍摄时间间隔时，拍摄包含所述跟踪目标的所述手势在内的跟踪场景图片；

识别模块，用于对所述跟踪场景图片中的所述手势进行识别，获得所述手势在所述跟踪场景图片中的起点坐标和大小参数；

所述计算模块，进一步用于根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述机器人距离所述跟踪目标的当前距离和所述手势在实际空间的X轴上的偏离角度值；

比较模块，用于将所述当前距离和预设距离阈值范围进行比较，得到第一比较结果；以及，将所述偏离角度值和预设角度阈值范围进行比较，得到第二比较结果；

执行模块，用于根据所述第一比较结果和所述第二比较结果，控制所述机器人执行相应的跟随操作。

进一步，所述单目摄像头，进一步用于拍摄包含所述跟踪目标的所述手势在内的初始场景图片；所述识别模块，进一步用于对所述初始场景图片中的所述手势进行识别，获得所述手势在所述初始场景图片中的起点坐标和高度参数；所述计算模块，用于当接收到跟踪指令时，获取所述跟踪目标的手势的实际高度具体为：所述计算模块，用于根据所述初始距离和所述单目摄像头的预设可视角，计算得到所述初始场景图片对应的初始场景的实际高度；再根据所述初始场景图片对应的初始场景的实际高度、所述手势在所述初始场景图片中的高度参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势的实际高度。

H3＝2*tanα*D1 (1)

H4＝H2*H3/H1 (3)

进一步，所述根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述机器人距离所述跟踪目标的当前距离的计算公式如下：

H6＝H1*H4/H5 (4)

D2＝H6/(2*tanα) (5)

进一步，所述计算模块，用于根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述手势在实际空间的X轴上的偏离角度值具体为：所述计算模块，用于根据所述手势在所述跟踪场景图片中的起点坐标和所述手势在所述跟踪场景图片中的大小参数，计算得到所述手势在所述跟踪场景图片中的中心坐标；

以及，根据所述单目摄像头的预设图片分辨率和所述手势在所述跟踪场景图片中的中心坐标，计算得到所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量；

以及，根据所述图片偏移量、所述手势的实际高度、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势在实际空间的X轴上的实际偏移量；

以及，根据所述实际偏移量和所述机器人距离所述跟踪目标的当前距离，计算得到所述手势在实际空间的X轴上的偏离角度值。

X4＝X3+(W4/2) (6)

Y4＝Y3+(H5/2) (7)

O1＝X4–(W1/2) (8)

H6＝H1*H4/H5 (4)

W5＝W1*H6/H1 (10)

O2＝O1*W5/W1 (11)

进一步，所述根据所述实际偏移量和所述机器人距离所述跟踪目标的当前距离，计算得到所述手势在实际空间的X轴上的偏离角度值的计算公式如下：

β2＝arctan(O2/D2) (9)

式(9)中，β2为所述手势在实际空间的X轴上的偏离角度值，O2为所述跟踪目标的手势在实际空间的X轴上的实际偏移量，D2为所述机器人距离所述跟踪目标的当前距离。

本发明的一种基于单目手势识别的视觉跟随方法及机器人，通过识别一个特征手势，实时得到精确的机器人与跟踪目标的偏离角度值，易于精确追踪，跟随动作更自然。另外，其初始距离可以通过单点测距模块测量得到，在跟踪过程中，通过识别一个特征手势，实时得到精确的机器人与人(即跟踪目标)的相对距离，跟踪精度更高。本发明的跟随方法及机器人准确率高于色块跟随，成本较3D体感方案大大降低，且效果更好，用户交互顺畅，极易掌握操作要点，使用方便。

附图说明

图1为本发明一个实施例中初始拍摄场景图片示意图；

图2为本发明一个实施例中跟踪拍摄场景图片示意图；

图3为本发明一个实施例中的跟随方法采用的机器人结构示意图；

图4为本发明另一个实施例中的跟随方法采用的机器人结构示意图；

图5为本发明机器人一个实施例的结构图；

图6为本发明基于单目手势识别的视觉跟随方法一个实施例的流程图；

图7为本发明基于单目手势识别的视觉跟随方法一个实施例的部分流程图；

图8为本发明基于单目手势识别的视觉跟随方法一个实施例的部分流程图。

具体实施方式

下面结合附图，以人体为跟踪目标为例，对本发明提出的一种基于单目手势识别的视觉跟随方法进行详细说明。

在本发明的一个实施例中，如图6所示，一种基于单目手势识别的视觉跟随方法，包括以下步骤：

S3对所述跟踪场景图片中的所述手势进行识别，获得所述手势在所述跟踪场景图片中的起点坐标和所述手势在所述跟踪场景图片中的大小参数；

具体的，机器人距离跟踪目标的初始距离可以由单点测距模块测量得到，也可以用户人为手动自行输入，考虑到用户使用的便捷性，建议使用单点测距模块来实现。

手势可采用特定手势为标志，也可以采用人体的其它部位(如人脸)作为标志。跟踪目标的手势的实际高度可以通过准备过程(即初始化过程)计算得到。

当得到初始距离和手势的实际高度后，机器人就开始执行跟随的过程。主要实现过程为拍摄含所述跟踪目标的所述手势在内的跟踪场景图片，根据跟踪场景图片、初始距离、手势的实际高度等信息，来确认机器人距离跟踪目标是否较远、跟踪目标是否超过了预设角度阈值范围等来调整机器人前进、后退、角度等操作并循环执行上述步骤，使机器人可以实现对跟踪目标的跟随过程。在跟踪过程中，单目摄像头会根据预设时间间隔来拍摄跟踪场景图片，比如以1秒作为预设时间间隔，每隔1秒就拍摄一幅跟踪场景图片进行跟随操作，保证机器人相对于跟踪目标(人)具有较好的跟随状态。

预设距离阈值范围可以由人机交互的舒适程度决定，机器人的跟随距离必须不让人(即跟踪目标)保持不适，如<0.5米就是会让人不舒适的距离。1米～2米的跟随距离会让人机交互比较舒适的距离。但除了人机交互，我们还需要结合机器人的硬件限制(“可视距离”、“可视角”)和跟随算法 (或者说，运动算法)等因素，综合得到最终的舒适区间阈值。

之所以与可视距离相关，是因为一般太近(如小于0.5米)会导致目标超出整个视野或运算量过大，太远(如大于5米，具体的米数由相机分辨率，相机清晰程度，CPU运算能力决定)，会导致目标太小，识别时间提升，以上所说三种情况：超出视野、目标太小、运算量过大都会引起识别时间增加和识别率下降，不利于跟随算法实现。

之所以与可视角相关，是因为可视角的大小影响在同样距离时，可视的图像面积大小不同，这会导致选取的预设距离阈值范围不同。机器人摄像头的高度，也是影响可视角投射面积的重要因素。

跟随算法会考虑机器人运动速度、转弯能力等限制，因此，需要根据跟随算法来决定预设距离阈值范围。本实施例的预设距离阈值范围可以设置为1米～1.5米。当然，预设距离阈值范围也可以设置为1米～1.5米。

预设角度阈值范围主要受两个方面影响：

1、人机交互的舒适程度。角度的调整也不宜太频繁，否则会给人机器人行走不稳感觉或认为程序出错(频繁找中心点)，所以，跟随目标离机器人正前方中心点一定范围的偏差是可以被容忍的。因此，设定了一个预设角度阈值范围，只有当跟踪目标不在此范围内时，才进行角度调整。以使整体的跟随更流畅。一般在1～1.5米举例，±15°的水平视角内，既不会认为是跟踪偏差太大，同时又不会频繁调整角度。

2、预设角度阈值范围还受单目摄像头的水平视角影响，预设角度阈值范围应小于单目摄像头的水平视角一定幅度(预留一定的视角以识别被跟踪目标，以及，防止被跟踪目标移出视野过快而导致丢失)。例如：若单目摄像头的水平视角为65°(其拍摄角度为-32.5°到32.5°)，设置预设角度阈值范围为-15°～15°比较合适。

将所述当前距离和预设距离阈值范围进行比较，得到的第一比较结果会有三种情况，以预设距离阈值范围设置为1米(Dx)～1.5(Dy)米为例，其三种情况以及相应的距离跟随操作如下表一：

表一

将所述偏离角度值和预设角度阈值范围进行比较，得到第二比较结果，会有三种情况，以预设角度阈值范围设置为-15(-βy)°～15°(βy)为例，其三种情况以及相应的角度跟随操作如下表二：

表二

机器人在得到第一比较结果和第二比较结果后，会结合两者的情况来调整机器人的跟随操作，跟随操作包括：角度跟随操作和距离跟随操作。例如：第一比较结果为当前距离>Dy、第二比较结果为偏离角度值＜-βy，则机器人执行的跟随操作为：向靠近跟踪目标的方向以一定的角速度移动一段距离，移动的一段距离为当前距离-Dx。

本实施例中，会根据实时拍摄的跟踪场景图片来计算得到当前距离和偏离角度值，从而将它们与各自的预设阈值范围进行比较，机器人再根据两个比较结果执行相应的跟随操作，既保证了对跟踪目标的跟随，又不会对跟踪目标造成不适感。

在本发明的另一个实施例中，除与上述相同的之外，如图7所示，所述步骤S1当接收到跟踪指令时，获取机器人距离跟踪目标的初始距离和所述跟踪目标的手势的实际高度具体包括以下步骤：

当接收到跟踪指令时，通过机器人的单点测距模块，测量得到所述机器人距离所述跟踪目标的所述初始距离；(单点测距模块可以为超声波测距传感器、红外测距传感器、激光测距传感器等)

对所述初始场景图片中的所述手势进行识别，获得所述手势在所述初始场景图片中的起点坐标和所述手势在所述初始场景图片中的高度参数；

根据所述初始距离和所述单目摄像头的预设可视角，计算得到所述初始场景图片对应的初始场景的实际高度根据所述初始场景图片对应的初始场景的实际高度、所述手势在所述初始场景图片中的高度参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势的实际高度。

具体的，1)如图1所示，机器人通过相机模块(即单目摄像头)拍摄包括人体的手势在内的初始场景图片，此初始场景图片的图片分辨率为单目摄像头的预设图片分辨率W1(宽度分辨率)*H1(高度分辨率)；根据预设的规定，由单目摄像头拍摄的场景图片的左上角第一个点坐标为(1,1)，右下角最后一点的坐标为的(W1，H1)；手势可采用手掌为标志或手指为标志，也可以采用其它器官为标志。

2)机器人识别人体的手势，通过手势识别软件，识别人体的手势(如正面手掌)，并获得手势在初始场景图片对应的图片帧中的起点坐标和手势在所述初始场景图片中的大小参数(包括：高度参数和宽度参数)：

X1：手势在初始场景图片中的起点坐标的X轴起点坐标，

Y1：手势在初始场景图片中的起点坐标的Y轴起点坐标，

W2：手势在初始场景图片中的大小参数中X轴的宽度参数，

H2：手势在初始场景图片中的大小参数中Y轴的高度参数；

H3：相机模块拍摄到的初始场景图片对应的初始场景的实际高度；

H4：跟踪目标的手势的实际高度；

通过机器人的单点测距模块，测量得到所述机器人距离所述跟踪目标的所述初始距离D1；

3)根据步骤1)、2)和3)获得的参数，计算相机拍摄的初始场景高度H3：

H3＝2*tanα*D1 (1)

其中，α为所述单目摄像头的预设垂直可视角，预设可视角为单目摄像头垂直可视角的1/2；

计算跟踪目标的手势的实际高度的计算公式可以根据式(2)推导得到：

可知H3/H4＝H1/H2 (2)

由式(2)推导得：H4＝H2*H3/H1 (3)

H4为所述跟踪目标的手势的实际高度，H2为所述手势在所述初始场景图片中(Y轴)的高度参数，H1为所述单目摄像头的预设图片分辨率中的高度分辨率，H3为所述初始场景图片对应的初始场景的实际高度。

在本发明的另一个实施例中，除与上述相同的之外，当得到了初始场景图片对应的初始场景的实际高度、实际宽度和初始距离后，就开始执行跟随操作。当4)人体向前，或者向后，或者向左，或者向右，移动一个距离，但保持手势在机器人的摄像头的视野范围内；机器人通过单目摄像头拍摄包括人体的手势在内的跟踪场景图片，因为是由相同的单卡摄像头所拍摄，所以得到的场景图片的分辨率就是预设图片分辨率W1*H1；

如图2所示，机器人识别人体的手势，通过手势识别软件，识别人体的手势(如正面手掌)，并获得手势在跟踪场景图片对应的图片帧中的起点坐标和手势在所述跟踪场景图片中的大小参数(包括：高度参数和宽度参数)：

X3：手势在跟踪场景图片中的起点坐标的X轴起点坐标，

Y3：手势在跟踪场景图片中的起点坐标的Y轴起点坐标，

W4：手势在跟踪场景图片中的大小参数中X轴的宽度参数，

W5：单目摄像头拍摄到的跟踪场景图片对应的跟踪场景的实际宽度；

H5：手势在跟踪场景图片中的大小参数中Y轴的高度参数；

H6：单目摄像头拍摄到的跟踪场景图片对应的跟踪场景的实际高度；

5)根据步骤1)至5)获得的数据，计算单目摄像头拍摄的跟踪场景的实际高度H6：

H6＝H1*H4/H5 (4)

式(4)中，H6为所述跟踪场景图片对应的跟踪场景的实际高度，H1为所述单目摄像头的预设图片分辨率中的高度分辨率，H4为所述手势的实际高度，H5为所述手势在所述跟踪场景图片中大小参数中(Y轴)的高度参数；

再计算得到机器人距离所述跟踪目标的当前距离(即拍摄跟踪场景图片时距离跟踪目标的距离)D2：

D2＝H6/(2*tanα) (5)

式(5)中，D2为所述机器人距离所述跟踪目标的当前距离，H6为所述跟踪场景图片对应的跟踪场景的实际高度，α为所述单目摄像头的预设可视角，预设可视角为单目摄像头垂直可视角的二分之一。

在本发明的另一个实施例中，除与上述相同的之外，如图8所示，根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述机器人距离所述跟踪目标的当前距离和所述手势在实际空间的X轴上的偏离角度值中，计算得到所述手势在实际空间的X轴上的偏离角度值包括以下步骤：

根据所述实际偏移量和所述机器人距离所述跟踪目标的当前距离，计算得到所述手势在实际空间的X轴上的偏离角度值。

具体的，因后面还要对机器人与跟踪目标的拍摄角度进行判断，因此需要计算偏离角度值。

根据所述手势在所述跟踪场景图片中的起点坐标和所述手势在所述跟踪场景图片中的大小参数，计算手势在跟踪场景图片中的中心坐标(X4，Y4)：

X4＝X3+(W4/2) (6)

Y4＝Y3+(H5/2) (7)

式(6)中，X4为所述手势在所述跟踪场景图片中的中心坐标的X轴坐标，X3为所述手势在所述跟踪场景图片中的起点坐标中的X轴起点坐标，W4为所述手势在所述跟踪场景图片中的大小参数中X轴的宽度参数；

计算手势在跟踪场景图片中的中心坐标(X4，Y4)相比于跟踪场景图片的中心点坐标(W1/2，H1/2)在X轴上的图片偏离量O1；

定义O1＝X4–(W1/2) (8)

由W5＝W1*H6/H1 (10)

式(10)中，W5为跟踪场景图片对应的跟踪场景的实际宽度，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率，H6为跟踪场景图片对应的跟踪场景的实际高度(注：实际空间长与像素空间长的比例和实际空间宽与像素空间宽的比例相同)。

O2＝O1*W5/W1 (11)

计算手势在实际空间的X轴上的偏离角度值的计算公式为：

定义β2＝arctan(O2/D2) (9)

角β2为手势在实际空间的X轴上的偏离角度值，O2为所述跟踪目标的手势在实际空间的X轴上的实际偏移量，D2为所述机器人距离所述跟踪目标的当前距离。

在步骤1)单目摄像头拍摄第一副场景图片之前或同时，机器人通过单点测距模块，测量机器人与跟踪目标之间的距离，获得初始距离D1，此时D1为实际测量得到的数值，而不是计算得到的值。当接收到跟踪指令，会有一个初始化的过程，即获得的初始距离(通过测量得到)，拍摄一幅场景图片(即初始场景图片)，根据初始场景图片计算得到的跟踪目标的手势的实际高度都是作为参考数值。只有在得到这两个值之后(相当于初始化结束)才会执行跟随操作，这之后拍摄的场景图片都是属于跟踪场景图片，其都是根据初始距离和手势的实际高度进行计算当前距离和偏离角度值来实现跟随操作，会以一定频率拍摄跟踪场景图片，比如每1秒拍一次等，频率较高可以保证跟踪的流畅性。

根据实时反馈的跟踪目标和所述机器人的Z轴空间距离D2、X轴空间偏离角度值β2制定引导机器人的动态跟随算法；所述机器人通过不断调整机器人的姿态、速度等(即根据第一比较结果和第二比较结果，来执行相应的跟随操作)，从而使D2趋近于预设距离阈值范围Dx～Dy，β2趋近于预设角度阈值范围-βy～βy(当然β2趋近于0°，使跟踪目标位于机器人的正前方为最优方案)，而得到良好的跟随姿态。

如图3和4所示，本发明的跟随方法采用的机器人可选用类人机器人，包括RGB彩色相机1和超声波测距传感器2。RGB彩色相机1(即单目摄像头)用于获取人及手势的图像数据(即初始场景图片、跟踪场景图片)。超声波测距传感器2(相当于单点测距模块)用于测量机器人正前方的障碍物距离，超声波测距传感器2也可用，红外测距，激光测距等技术替代。

在本发明的另一个实施例中，如图5所示，一种机器人，包括：

单点测距模块10，用于当接收到跟踪指令时，获取机器人距离跟踪目标的初始距离；

计算模块20，(与单点测距模块10电连接)用于当接收到跟踪指令时，获取所述跟踪目标的手势的实际高度；

单目摄像头30，(与计算模块20电连接)用于在对所述跟踪目标进行跟踪、且达到了预设拍摄时间间隔时，拍摄包含所述跟踪目标的所述手势在内的跟踪场景图片；

识别模块60，用于对所述跟踪场景图片中的所述手势进行识别，获得所述手势在所述跟踪场景图片中的起点坐标和大小参数；

所述计算模块20，进一步用于根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述机器人距离所述跟踪目标的当前距离和所述手势在实际空间的X轴上的偏离角度值；

比较模块40，(与计算模块20电连接)用于将所述当前距离和预设距离阈值范围进行比较，得到第一比较结果；以及，将所述偏离角度值和预设角度阈值范围进行比较，得到第二比较结果；

执行模块50，(与比较模块40电连接)用于根据所述第一比较结果和所述第二比较结果，控制所述机器人执行相应的跟随操作。

具体的，考虑到用户使用的便捷性，机器人距离跟踪目标的初始距离可以由单点测距模块测量得到。手势可采用手掌为标志或手指为标志，也可以采用人体的其它部位(如人脸)作为标志。跟踪目标的手势的实际高度可以通过准备过程计算得到。

当得到初始距离和手势的实际高度后，机器人就开始执行跟随的过程。主要实现过程为拍摄含所述跟踪目标的所述手势在内的跟踪场景图片，根据跟踪场景图片、初始距离、手势的实际高度等信息，来确认机器人距离跟踪目标是否较远、跟踪目标是否超过了预设角度阈值范围等来调整机器人前进、后退、角度等操作并循环执行上述步骤，使机器人可以实现对跟踪目标的跟随过程。

预设距离阈值范围可以由人机交互的舒适程度决定，机器人的跟随距离必须不让人(即跟踪目标)保持不适，如<0.5米就是会让人不舒适的距离。1米～2米的跟随距离会让人机交互比较舒适的距离。但除了人机交互，我们还需要结合机器人的硬件限制(“可视距离”、“可视角”)和跟随算法(或者说，运动算法)等因素，综合得到最终的舒适区间阈值。预设角度阈值范围也会受到两个方面的影响。具体解释请参见对应的方法实施例，在此不作赘述。本实施例的预设距离阈值范围可以设置为1米～1.8米。预设角度阈值范围可以设置为-18°～18°。

参见表一和表二，机器人在得到第一比较结果和第二比较结果后，会结合两者的情况来调整机器人的跟随操作，得到较好的跟随状态。既保证了对跟踪目标的跟随，又不会对跟踪目标造成不适感。

在本发明的另一个实施例中，除与上述相同的之外，单目摄像头30，进一步用于拍摄包含所述跟踪目标的所述手势在内的初始场景图片；

所述识别模块60，进一步用于对所述初始场景图片中的所述手势进行识别，获得所述手势在所述初始场景图片中的起点坐标和所述手势在所述初始场景图片中的高度参数；

计算模块20，用于当接收到跟踪指令时，获取所述跟踪目标的手势的实际高度具体为：计算模块20，用于根据所述初始距离和所述单目摄像头的预设可视角，计算得到所述初始场景图片对应的初始场景的实际高度；再根据所述初始场景图片对应的初始场景的实际高度、所述手势在所述初始场景图片中的高度参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势的实际高度。

优选地，根据所述初始距离和所述单目摄像头的预设可视角，计算得到所述初始场景图片对应的初始场景的实际高度的计算公式为：

H3＝2*tanα*D1 (1)

根据所述初始场景图片对应的初始场景的实际高度、所述手势在所述初始场景图片中的高度参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势的实际高度的计算公式为：

H4＝H2*H3/H1 (3)

在本发明的另一个实施例中，除与上述相同的之外，计算得到所述机器人距离所述跟踪目标的当前距离的计算公式如下：

H6＝H1*H4/H5 (4)

D2＝H6/(2*tanα) (5)

在本发明的另一个实施例中，除与上述相同的之外，所述计算模块20，用于根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述手势在实际空间的X轴上的偏离角度值具体为：所述计算模块，用于根据所述手势在所述跟踪场景图片中的起点坐标和所述手势在所述跟踪场景图片中的大小参数，计算得到所述手势在所述跟踪场景图片中的中心坐标；

优选地，计算得到所述手势在所述跟踪场景图片中的中心坐标的计算公式如下：

X4＝X3+(W4/2) (6)

Y4＝Y3+(H5/2) (7)

计算得到所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量的计算公式如下：

O1＝X4–(W1/2) (8)

式(8)中，O1为所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的偏移量，X4为所述手势在所述跟踪场景图片中的中心坐标的X轴坐标，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率；

W5＝W1*H6/H1 (10)

式(10)中，W5为所述跟踪场景图片对应的跟踪场景的实际宽度，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率，H6为所述跟踪场景图片对应的跟踪场景的实际高度；O2＝O1*W5/W1(11)

计算得到所述手势在实际空间的X轴上的偏离角度值的计算公式如下：

β2＝arctan(O2/D2) (9)

本实施例可以根据上述方式计算得到机器人距离跟踪目标的当前距离以及偏离角度值，从而让机器人调整自己的角度、行进路程等执行跟随操作，得到良好的跟随状态。

以上实施例仅用以说明本发明的技术方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，其均应涵盖在本发明的权利要求范围当中。

Claims

一种基于单目手势识别的视觉跟随方法，其特征在于，包括以下步骤：

S1当接收到跟踪指令时，获取机器人距离跟踪目标的初始距离和所述跟踪目标的手势的实际高度；

S2在对所述跟踪目标进行跟踪、且达到了预设拍摄时间间隔时，利用机器人的单目摄像头拍摄包含所述跟踪目标的所述手势在内的跟踪场景图片；

S3对所述跟踪场景图片中的所述手势进行识别，获得所述手势在所述跟踪场景图片中的起点坐标和大小参数；

S4根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述机器人距离所述跟踪目标的当前距离和所述手势在实际空间的X轴上的偏离角度值；

S5将所述当前距离和预设距离阈值范围进行比较，得到第一比较结果；

S6将所述偏离角度值和预设角度阈值范围进行比较，得到第二比较结果；

S7根据所述第一比较结果和所述第二比较结果，控制所述机器人执行相应的跟随操作。
根据权利要求1所述的基于单目手势识别的视觉跟随方法，其特征在于，所述步骤S1具体包括以下步骤：

当接收到跟踪指令时，通过机器人的单点测距模块，测量得到所述机器人距离所述跟踪目标的所述初始距离；

利用机器人的单目摄像头拍摄包含所述跟踪目标的所述手势在内的初始场景图片；

对所述初始场景图片中的所述手势进行识别，获得所述手势在所述初始场景图片中的起点坐标和高度参数；

根据所述初始距离和所述单目摄像头的预设可视角，计算得到所述初始场景图片对应的初始场景的实际高度；根据所述初始场景图片对应的初始场景的实际高度、所述手势在所述初始场景图片中的高度参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势的实际高度。
根据权利要求2所述的基于单目手势识别的视觉跟随方法，其特征在于，所述根据所述初始距离和所述单目摄像头的预设可视角，计算得到所述初始场景图片对应的初始场景的实际高度的计算公式为：

H3＝2*tanα*D1 (1)

式(1)中，H3为所述初始场景图片对应的初始场景的实际高度，α为所述单目摄像头的预设可视角，D1为所述初始距离。
根据权利要求2所述的基于单目手势识别的视觉跟随方法，其特征在于，所述根据所述初始场景图片对应的初始场景的实际高度、所述手势在所述初始场景图片中的高度参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势的实际高度的计算公式为：

H4＝H2*H3/H1 (3)

式(3)中，H4为所述跟踪目标的手势的实际高度，H2为所述手势在所述初始场景图片中的高度参数，H1为所述单目摄像头的预设图片分辨率中的高度分辨率，H3为所述初始场景图片对应的初始场景的实际高度。
根据权利要求1所述的基于单目手势识别的视觉跟随方法，其特征在于，所述步骤S4中，计算得到所述机器人距离所述跟踪目标的当前距离的计算公式如下：

H6＝H1*H4/H5 (4)

式(4)中，H6为所述跟踪场景图片对应的跟踪场景的实际高度，H1为所述单目摄像头的预设图片分辨率中的高度分辨率，H4为所述手势的实际高度，H5为所述手势在所述跟踪场景图片中大小参数中的高度参数；

D2＝H6/(2*tanα) (5)

式(5)中，D2为所述机器人距离所述跟踪目标的当前距离，H6为所述跟踪场景图片对应的跟踪场景的实际高度，α为所述单目摄像头的预设可视角。
根据权利要求1所述的基于单目手势识别的视觉跟随方法，其特征在于，所述步骤S4中，计算得到所述手势在实际空间的X轴上的偏离角度值包括以下步骤：

根据所述手势在所述跟踪场景图片中的起点坐标和所述手势在所述跟踪场景图片中的大小参数，计算得到所述手势在所述跟踪场景图片中的中心坐标；

根据所述单目摄像头的预设图片分辨率和所述手势在所述跟踪场景图片中的中心坐标，计算得到所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量；

根据所述图片偏移量、所述手势的实际高度、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势在实际空间的X轴上的实际偏移量；

根据所述实际偏移量和所述机器人距离所述跟踪目标的当前距离，计算得到所述手势在在实际空间的X轴上的偏离角度值。
根据权利要求6所述的基于单目手势识别的视觉跟随方法，其特征在于，根据所述手势在所述跟踪场景图片中的起点坐标和所述手势在所述跟踪场景图片中的大小参数，计算得到所述手势在所述跟踪场景图片中的中心坐标的计算公式如下：

X4＝X3+(W4/2) (6)

式(6)中，X4为所述手势在所述跟踪场景图片中的中心坐标的X轴坐标，X3为所述手势在所述跟踪场景图片中的起点坐标中的X轴起点坐标，W4为所述手势在所述跟踪场景图片中的大小参数中的宽度参数；

Y4＝Y3+(H5/2) (7)

式(7)中，Y4为所述手势在所述跟踪场景图片中的中心坐标的Y轴坐标，Y3为所述手势在所述跟踪场景图片中的起点坐标中的Y轴起点坐标，H5为所述手势在所述跟踪场景图片中的大小参数中的高度参数。
根据权利要求6所述的基于单目手势识别的视觉跟随方法，其特征在于：

所述根据所述单目摄像头的预设图片分辨率和所述手势在所述跟踪场景图片中的中心坐标，计算得到所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量的计算公式如下：

O1＝X4–(W1/2)              (8)

式(8)中，O1为所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量，X4为所述手势在所述跟踪场景图片中的中心坐标的X轴坐标，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率；

所述根据所述图片偏移量、所述手势的实际高度、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势在实际空间的X轴上的实际偏移量的计算公式为：

H6＝H1*H4/H5             (4)

式(4)中，H6为所述跟踪场景图片对应的跟踪场景的实际高度，H1为所述单目摄像头的预设图片分辨率中的高度分辨率，H4为所述手势的实际高度，H5为所述手势在所述跟踪场景图片中大小参数中的高度参数；

W5＝W1*H6/H1           (10)

式(10)中，W5为所述跟踪场景图片对应的跟踪场景的实际宽度，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率，H6为所述跟踪场景图片对应的跟踪场景的实际高度；

O2＝O1*W5/W1            (11)

式(11)中，O1为所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量，W5为所述跟踪场景图片对应的跟踪场景的实际宽度，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率，O2为所述跟踪目标的手势在实际空间的X轴上的实际偏移量。
根据权利要求6所述的基于单目手势识别的视觉跟随方法，其特征在于，所述根据所述实际偏移量和所述机器人距离所述跟踪目标的当前距离，计算得到所述手势在在实际空间的X轴上的偏离角度值的计算公式如下：

β2＝arctan(O2/D2) (9)

式(9)中，β2为所述手势在在实际空间的X轴上的偏离角度值，O2为所述跟踪目标的手势在实际空间的X轴上的实际偏移量，D2为所述机器人距离所述跟踪目标的当前距离。
一种机器人，其特征在于，包括：

单点测距模块，用于当接收到跟踪指令时，获取机器人距离跟踪目标的初始距离；

计算模块，用于当接收到跟踪指令时，获取所述跟踪目标的手势的实际高度；

单目摄像头，用于在对所述跟踪目标进行跟踪、且达到了预设拍摄时间间隔时，拍摄包含所述跟踪目标的所述手势在内的跟踪场景图片；

识别模块，用于对所述跟踪场景图片中的所述手势进行识别，获得所述手势在所述跟踪场景图片中的起点坐标和大小参数；

所述计算模块，进一步用于根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述机器人距离所述跟踪目标的当前距离和所述手势在实际空间的X轴上的偏离角度值；

比较模块，用于将所述当前距离和预设距离阈值范围进行比较，得到第一比较结果；以及，将所述偏离角度值和预设角度阈值范围进行比较，得到第二比较结果；

执行模块，用于根据所述第一比较结果和所述第二比较结果，控制所述机器人执行相应的跟随操作。
根据权利要求10所述的机器人，其特征在于：

所述单目摄像头，进一步用于拍摄包含所述跟踪目标的所述手势在内的初始场景图片；

所述识别模块，进一步用于对所述初始场景图片中的所述手势进行识别，获得所述手势在所述初始场景图片中的起点坐标和高度参数；

所述计算模块，用于当接收到跟踪指令时，获取所述跟踪目标的手势的实际高度具体为：所述计算模块，用于根据所述初始距离和所述单目摄像头的预设可视角，计算得到所述初始场景图片对应的初始场景的实际高度；再根据所述初始场景图片对应的初始场景的实际高度、所述手势在所述初始场景图片中的高度参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势的实际高度。
根据权利要求11所述的机器人，其特征在于，所述根据所述初始距离和所述单目摄像头的预设可视角，计算得到所述初始场景图片对应的初始场景的实际高度的计算公式为：

H3＝2*tanα*D1 (1)

式(1)中，H3为所述初始场景图片对应的初始场景的实际高度，α为所述单目摄像头的预设可视角，D1为所述初始距离。
根据权利要求11所述的机器人，其特征在于，所述根据所述初始场景图片对应的初始场景的实际高度、所述手势在所述初始场景图片中的高度参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势的实际高度的计算公式为：

H4＝H2*H3/H1 (3)

式(3)中，H4为所述跟踪目标的手势的实际高度，H2为所述手势在所述初始场景图片中的高度参数，H1为所述单目摄像头的预设图片分辨率中的高度分辨率，H3为所述初始场景图片对应的初始场景的实际高度。
根据权利要求10所述的机器人，其特征在于，所述根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述机器人距离所述跟踪目标的当前距离的计算公式如下：

H6＝H1*H4/H5 (4)

式(4)中，H6为所述跟踪场景图片对应的跟踪场景的实际高度，H1为所述单目摄像头的预设图片分辨率中的高度分辨率，H4为所述手势的实际高度，H5为所述手势在所述跟踪场景图片中大小参数中的高度参数；

D2＝H6/(2*tanα) (5)

式(5)中，D2为所述机器人距离所述跟踪目标的当前距离，H6为所述跟踪场景图片对应的跟踪场景的实际高度，α为所述单目摄像头的预设可视角。
根据权利要求10所述的机器人，其特征在于：

所述计算模块，用于根据所述手势的实际高度、所述单目摄像头的预设图片分辨率、所述手势在所述跟踪场景图片中的起点坐标、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设可视角，计算得到所述手势在实际空间的X轴上的偏离角度值具体为：所述计算模块，用于根据所述手势在所述跟踪场景图片中的起点坐标和所述手势在所述跟踪场景图片中的大小参数，计算得到所述手势在所述跟踪场景图片中的中心坐标；

以及，根据所述单目摄像头的预设图片分辨率和所述手势在所述跟踪场景图片中的中心坐标，计算得到所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量；

以及，根据所述图片偏移量、所述手势的实际高度、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势在实际空间的X轴上的实际偏移量；

以及，根据所述实际偏移量和所述机器人距离所述跟踪目标的当前距离，计算得到所述手势在实际空间的X轴上的偏离角度值。
根据权利要求15所述的机器人，其特征在于，根据所述手势在所述跟踪场景图片中的起点坐标和所述手势在所述跟踪场景图片中的大小参数，计算得到所述手势在所述跟踪场景图片中的中心坐标的计算公式如下：

X4＝X3+(W4/2) (6)

式(6)中，X4为所述手势在所述跟踪场景图片中的中心坐标的X轴坐标，X3为所述手势在所述跟踪场景图片中的起点坐标中的X轴起点坐标，W4为所述手势在所述跟踪场景图片中的大小参数中的宽度参数；

Y4＝Y3+(H5/2) (7)

式(7)中，Y4为所述手势在所述跟踪场景图片中的中心坐标的Y轴坐标，Y3为所述手势在所述跟踪场景图片中的起点坐标中的Y轴起点坐标，H5为所述手势在所述跟踪场景图片中的大小参数中的高度参数。
根据权利要求15所述的机器人，其特征在于：

所述根据所述单目摄像头的预设图片分辨率和所述手势在所述跟踪场景图片中的中心坐标，计算得到所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量的计算公式如下：

O1＝X4–(W1/2)          (8)

式(8)中，O1为所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量，X4为所述手势在所述跟踪场景图片中的中心坐标的X轴坐标，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率；

所述根据所述图片偏移量、所述手势的实际高度、所述手势在所述跟踪场景图片中的大小参数和所述单目摄像头的预设图片分辨率，计算得到所述跟踪目标的手势在实际空间的X轴上的实际偏移量的计算公式为：

H6＝H1*H4/H5                  (4)

式(4)中，H6为所述跟踪场景图片对应的跟踪场景的实际高度，H1为所述单目摄像头的预设图片分辨率中的高度分辨率，H4为所述手势的实际高度，H5为所述手势在所述跟踪场景图片中大小参数中的高度参数；

W5＝W1*H6/H1              (10)

式(10)中，W5为所述跟踪场景图片对应的跟踪场景的实际宽度，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率，H6为所述跟踪场景图片对应的跟踪场景的实际高度；

O2＝O1*W5/W1                 (11)

式(11)中，O1为所述手势在所述跟踪场景图片中的中心坐标相比于所述跟踪场景图片的中心坐标在X轴上的图片偏移量，W5为所述跟踪场景图片对应的跟踪场景的实际宽度，W1为所述单目摄像头的预设图片分辨率中的宽度分辨率，O2为所述跟踪目标的手势在实际空间的X轴上的实际偏移量。
根据权利要求15所述的机器人，其特征在于，所述根据所述实际偏移量和所述机器人距离所述跟踪目标的当前距离，计算得到所述手势在实际空间的X轴上的偏离角度值的计算公式如下：

β2＝arctan(O2/D2) (9)

式(9)中，β2为所述手势在实际空间的X轴上的偏离角度值，O2为所述跟踪目标的手势在实际空间的X轴上的实际偏移量，D2为所述机器人距离所述跟踪目标的当前距离。