CN110866939A

CN110866939A - 基于相机位姿估计和深度学习的机器人运动状态识别方法

Info

Publication number: CN110866939A
Application number: CN201910988218.5A
Authority: CN
Inventors: 谢非; 王鼎; 杨继全; 刘文慧; 章悦; 吴沛林; 梅一剑; 刘益剑; 沈世斌; 沈舒雨
Original assignee: Nanjing Intelligent High-End Equipment Industry Research Institute Co Ltd; Nanjing Normal University
Current assignee: Nanjing Intelligent High-End Equipment Industry Research Institute Co Ltd; Nanjing Normal University
Priority date: 2019-10-17
Filing date: 2019-10-17
Publication date: 2020-03-06
Anticipated expiration: 2039-10-17
Also published as: CN110866939B

Abstract

本发明提供了基于相机位姿估计和深度学习的机器人运动状态识别方法，包括：步骤1，采集连续视频帧序列图像并进行预处理，提取每一帧图像的加速稳健特征点，进行加速稳健特征点的匹配，并对匹配的加速稳健特征点对进行筛选；步骤2，分析提取的加速稳健特征点，并依据随机抽样一致算法，排除的离群值，计算出每一个时间段内相机的欧式变化矩阵；步骤3，把相机的欧式变化矩阵的变化转化为经时间修正过的运动描述向量，再把经时间修正过的运动描述向量转化为运动描述矩阵；步骤4，构建卷积神经网络，把运动描述矩阵和动作标签矩阵作为输入训练，得到运动预测模型；步骤5，利用运动预测模型实时判断机器人运动状态。

Description

基于相机位姿估计和深度学习的机器人运动状态识别方法

技术领域

本发明涉及行为识别及图像处理的技术领域，具体涉及基于相机位姿估计和深度学习的机器人运动状态识别方法。

背景技术

机器人运动状态识别是机器人状态监测的基础环节，可利用于工业检测、军事侦察、医疗服务、消防等领域。目前常用的机器人运动状态识别方法主要利用角度传感器和惯性传感器完成状态识别。机器人依靠机械装置来测量和识别运动状态，在可转动的关节处装有角度传感器或惯性传感器，可以测得并推算出关节转动角度及关节运动的变化状态。这种方法需在各节点处均绑定一个传感器，并且需利用各节点的多个传感器信息耦合计算运动状态，如有一个传感器出现问题，会影响整体状态识别结果，另外，部分的六轴惯性传感器在进行数据输出时都会产生累积误差，需开发者手动修正数据，算法复杂度较高，使用较为不便。

发明内容

针对现有技术的不足，本发明公开了一种基于相机位姿估计和深度学习的机器人运动状态的识别方法，包括以下步骤：

步骤1，采集连续视频帧序列图像并进行预处理，提取每一帧图像的加速稳健特征点，根据上一帧提取的加速稳健特征点的进行加速稳健特征点对的位置的预判，进行加速稳健特征点的匹配，并对匹配的加速稳健特征点对进行筛选；

步骤2，使用光流法和对极约束的方法分析提取的加速稳健特征点，并依据随机抽样一致算法，排除的离群值，计算出每一个时间段内相机的欧式变化矩阵；

步骤3，把相机的欧式变化矩阵的变化转化为经时间修正过的运动描述向量，再把经时间修正过的运动描述向量转化为运动描述矩阵；

步骤4，构建卷积神经网络，把运动描述矩阵和动作标签矩阵作为输入训练，得到运动预测模型；

步骤5，利用运动预测模型实时判断机器人运动状态。

步骤1包括如下步骤：

步骤1-1，采集连续视频帧序列图像，所述图像为彩色图像，保留彩色图像，并将彩色图像转化为灰度图像；

步骤1-2，按照光照亮度把彩色图像进行分区，如果临域亮度大于220区域的像素点数大于整个图像所含像素点数的80％，则进行针对高亮度的区域的灰度图像增强对比度，如果临域亮度小于35区域的像素点数大于整个图像所含像素点数的80％，则进行针对低亮度的区域的灰度图像增强对比度，临域是指一个像素点和该像素点的八临域的像素点所构成的区域；

像素点的亮度由以下公式定义：

Y(u,v)＝0.299×R(u,v)+0.587×G(u,v)+0.114×B(u,v)， (1)

其中，Y(u,v)表示像素点(u,v)的亮度，R(u,v)、G(u,v)和B(u,v)分别表示该像素点(u,v)的红色分量值、绿色分量值和蓝色分量值；以图像左上角为基准，u表示像素点所在行数，v代表像素点所在列数；

针对高亮度的区域的灰度图像增强对比度是指对灰度图像内的所有像素点进行灰度值变化，该变化由以下公式定义：

针对低亮度的区域的灰度图像增强对比度是指对灰度图像内的所有像素点进行灰度值变化，该变化由以下公式定义：

对于公式(2)和(3)，Gy(u,v)表示当前像素点(u,v)变化后的灰度值，Gy₀(u,v)表示当前像素点(u,v)变化前的灰度值；

步骤1-3，提取图像的加速稳健特征点(加速稳健特征点提取可参考FPGA-basedmodule for SURF extraction.Krajník,T.,

J.,Pedre,S.et al.Machine Visionand Applications(2014)25:787.)；

步骤1-4，对所有提取的距离过近的特征点进行筛选：对于两个距离过近的加速稳健特征点，任意选取其中一个加速稳健特征点保留，删除另一个加速稳健特征点；如果两个加速稳健特征点的坐标满足如下公式，则为距离过近：

x₁、y₁分别表示两个加速稳健特征点中的一个加速稳健特征点的横坐标和纵坐标，x₂、y₂分别表示另一个加速稳健特征点的横坐标和纵坐标；width指图像水平方向的像素点的数量，height指图像竖直方向的像素点的数量；

反复判断，直至任意两个加速稳健特征点都不满足不等式(4)；

筛选后的特征点的像素坐标记为p_p[i，j]，i代表当前帧的编号，j代表特征点的编号；

步骤1-5，计算加速稳健特征点的世界坐标；

步骤1-6，计算下一帧图像预测的欧式变化矩阵；

步骤1-7，进行加速稳健特征点对位置的预判；

步骤1-8，依据步骤1-7中得出来的特征点对位置的预判，划分出当前帧图像的旧区域和新区域，其中旧区域为包含原有像素点在新的图像中的区域，新区域为当前帧图像不包含旧区域的区域；使用暴力匹配的方法将当前帧图像的旧区域的特征点和上一帧图像的特征点进行匹配，得出匹配的特征点对集合Matchs_ori，并对匹配的特征点对集合Matchs_ori进行筛选，初步去除离群值，得到筛选后的匹配的特征点对集合Matchs。

(暴力匹配可参考以下文献的暴力匹配部分：Point pattern matching byrelaxation，Sanjay Ranade，Azriel Rosenfeld，Point pattern matching byrelaxation，Pattern Recognition Volume 12，Issue 4，1980，Pages 269-275)

步骤1-5包括：

根据当前帧的特征点的像素坐标p_p[i，j]，计算出所有特征点的世界坐标，计算过程由以下公式给出：

p_wnc[i，j]＝T[i]^-1K^-1p_p[i，j]， (17)

其中，p_w[i，j]，p_wnc[i，j]，p_p[i，j]均为三维列向量，p_wnc[i，j]代表特征点的未修正的世界坐标，p_w[i，j]代表特征点的世界坐标，T[i]代表累计的欧式变化矩阵，其初始值为4×4的单位矩阵，K代表相机的内参矩阵，p_wnc[i，j](2)指三维列向量p_wnc[i，j]中第三个元素。

步骤1-6包括：

计算出下一帧图像预测的欧式变化矩阵T_pct[i+1]：

T_ct[i]表示当前帧的欧式变化矩阵。

步骤1-6中，根据如下公式计算当前帧的欧式变化矩阵T_ct[i]：

其中，相机的欧式变化矩阵T_ct[i]为4×4的矩阵，代表第j个匹配的特征点对相邻两帧图像相机欧式变换；R[i]为3×3的矩阵，代表相邻两帧图像相机欧式变换的旋转矩阵；t[i]为三维列向量，代表相邻两帧图像相机欧式变换的位移向量。

步骤1-7包括：

使用加速稳健特征点的世界坐标以及下一帧图像预测的欧式变化矩阵，计算出每个特征点的像素坐标的预测值，计算过程由如下公式给出：

T_p[i]＝T_pct[i]T[i-1]， (5)

p_pr[i+1,j]＝KT_p[i]p_w[i,j]， (6)

其中，p_pr[i+1,j]为三维列向量，代表下一帧特征点的像素坐标的预测值，p_pr[i+1,j](k)代表向量中第k个元素，k＝0,1,2；T_p[i]代表当前帧累计的欧式变化矩阵的预测值；T[i-1]代表上一帧累计的欧式变化矩阵；u′[i,j]，v′[i,j]分别代表像素点在新的图像中的横坐标和纵坐标，由此可以得出特征点的大致位置。

步骤2包括如下步骤：

步骤2-1，通过光流法提取出光流的分布情况，得出光流方向的矢量v_ld[i]，其为二维列向量，描述了主要光流的方向；

(光流法可参考Determining optical flow，Berthold K.P.HornBrianG.Schunck，Artificial Intelligence，Volume 17,Issues 1–3,August 1981,Pages 185-203)

步骤2-2，对极约束：对于筛选后的匹配的特征点对集合Matchs，使用对极几何计算出相邻2帧图像中每个匹配的特征点对对应的相邻两帧图像相机欧式变换的旋转矩阵和相邻两帧图像相机欧式变换的位移向量，由以下公式给出：

p_p[i，j]＝[u[i，j]，v[i，j]，1]^T， (10)

p_p[i-1，j]＝[u[i-1，j]，v[i-1，j]，1]^T， (11)

其中p_p[i，j]，p_p[i-1，j]均为三维列向量，p_p[i，j]表示匹配的特征点对中的一个点的像素平面坐标，p_p[i-1，j]表示匹配的特征点对中的另一个点的像素平面坐标，(u[i，j]，v[i，j])指当前帧图像特征点的像素平面坐标，(u[i-1，j]，v[i-1，j])指前一帧图像特征点的像素坐标；

使用随机抽样一致算法(随机抽样一致算法可参考Locally OptimizedRANSAC.Chum O.，Matas J.，Kittler J.(2003)Locally Optimized RANSAC.In：MichaelisB.，Krell G.(eds)Pattern Recognition.DAGM 2003.Lecture Notes in ComputerScience，vol 2781.Springer，Berlin，Heidelberg)去除离群值之后，解出R[i]、t[i]，使得所有特征点对的综合偏离值最小，偏离值d_bias由以下公式给出：

步骤2-3，根据如下公式计算得到预估的光流方向的矢量v_ldp[i]：

v_ldp[i]＝T_ct[i]v_ld[i-1]， (14)

其中，v_ld[i-1]表示上一帧的光流方向的矢量，v_ld[i]表示当前帧的光流方向的矢量；

预估的光流方向的矢量v_ldp[i]为三维列向量；

将v_ldp[i]与v_ld[i]相比较，如果相差过大，则使用光流方向的矢量v_ld[i-1]、v_ld[i]与任意4个不是步骤2-2中被判定为离群值的筛选后的匹配点对重新解方程(12)，得出欧式变化矩阵T_ct[i]，当满足如下不等式，表示相差过大：

|v_ld[i]-v_ldp[i]|>0.2×|v_ld[i]+v_ldp[i]|， (15)

步骤2-4，根据如下公式计算出当前帧图像的累计的欧式变化矩阵T[i]：

T[i]＝T_ct[i]T[i-1]， (16)

其中T[i-1]代表上一帧图像的累积相机欧式变化的矩阵。

步骤3包括如下步骤：

步骤3-1，将得出的欧式变化矩阵转化为欧式变换描述向量a_r[i]，欧式变换描述向量为一个5维行向量且与欧式变化矩阵有一一对应的关系，由以下给出：

a_r[i]＝[θ_x[i] θ_y[i] θ_z[i] m_x[i] m_y[i]]， (27)

其中，θ_x[i]代表俯仰角，θ_y[i]代表偏航角，θ_z[i]代表翻滚角，m_x[i]代表修正后的x轴方向位移量，m_y[i]代表修正后的y轴方向位移量，a_r[i]代表欧式变换描述向量；R[i]_r0,c0代表矩阵R[i]中第r0行第c0列的元素；t[i](n0)代表向量t[i]中第n0个元素。

步骤3-2，将得出的欧式变换描述向量a_r[i]除以两帧之间的时间，得到第i帧的图像的经时间修正过的欧式变换描述向量a[i]：

其中Δt为编号为i-1和编号为i的两帧图像之间的时间间隔；

步骤3-3，对于第i帧的图像计算出的经时间修正过的欧式变换描述向量，经过以下变换得出运动描述向量：

vd[i]＝[a[i] a[i+1] a[i+2] … a[i+9]]， (29)

其中，vd[i]代表第i帧的图像的运动描述向量，为一个50维的向量；

动作标签向量用于标记需要识别的运动类型，由人工判断得到。记运动类型有n种，分别为运动1、运动2、运动3、……、运动n，运动h的动作标签向量为一个n维向量，其中第h项为1，其余项为0，1≤h≤n，且h为整数，例如，一共3种运动类型(n＝3)，当前的运动类型为运动2，则动作标签向量为：

ld[i]＝[0 1 0]， (30)

由运动描述向量得出运动描述矩阵：

V_a代表运动描述矩阵；

由动作标签向量得出动作标签矩阵：

ld[i]代表第i帧的图像的动作标签向量，L_a代表动作标签矩阵；

动作标签矩阵中每一个行向量和运动描述矩阵中每一个行向量有着一一对应的关系。

步骤4包括：

把运动描述矩阵和动作标签矩阵作为输入输入卷积神经网络，设置迭代次数为x(一般取值为1000)，经过训练，得到运动预测模型Model。

步骤5包括如下步骤：

步骤5：在得到运动预测模型Model之后，在实时运行过程之中，重复步骤1～步骤3，得到运动描述向量a[i]，把运动描述向量a[i]输入运动预测模型，输出判定结果向量res[i]，遍历res[i]直到找到res[i]中最大元素的编号，记为s，则实时的运动状态为运动s，1≤s≤n。

有益效果：本发明方法与常规的通过惯性传感器不同，采用视觉传感器可以有效的抑制误差的累积，对于物体运动状态的检测有着重要的辅助作用。此外，本发明方法与常规的外置视觉传感器不同，本发明采取固着于机器人上的视觉传感器，相比外置视觉传感器可以采集到更加丰富的和机器人位姿有关的信息，对于提升机器人运动状态的检测的准确度有着很大的帮助。

附图说明

下面结合附图和具体实施方式对本发明做更进一步的具体说明，本发明的上述和/或其他方面的优点将会变得更加清楚。

图1是本发明实施例提供的基于相机位姿估计和深度学习的机器人运动状态的识别方法的工作流程示意图；

图2是本发明运行时的运动结果图，action type:1代表当前的运动状态为运动1，即静止；

图3是本发明运行时的运动结果图，当前的运动状态为运动1，即静止；

图4是本发明运行时的运动结果图，action type:2代表当前的运动状态为运动2，即走路；

图5是本发明运行时的运动结果图，当前的运动状态为运动2，即走路；

图6是本发明运行时的运动结果图，action type:3代表当前的运动状态为运动3，即旋转；

图7是本发明运行时的运动结果图，action type:4代表当前的运动状态为运动3，即跑步；

图8是本发明运行时的运动结果图，action type:5代表当前的运动状态为运动3，即跳跃；

图9是本发明在构建卷积神经网络并把运动描述矩阵和动作标签矩阵作为输入训练，得到运动预测模型的时候的代价函数的下降过程。

具体实施方式

如图1所示，本发明提供了基于相机位姿估计和深度学习的机器人运动状态识别方法，在本发明实例中，采用CCD工业相机采集彩色视频信息，通过计算机对彩色视频图像进一步处理。

包括以下步骤：

步骤5，利用运动预测模型实时判断机器人运动状态。

步骤1包括如下步骤：

像素点的亮度由以下公式定义：

Y(u,v)＝0.299×R(u,v)+0.587×G(u,v)+0.114×B(u,v)， (1)

J.,Pedre,S.et al.Machine Visionand Applications(2014)25:787.)；

筛选后的特征点的像素坐标记为p_p[i,j]，i代表当前帧的编号，j代表特征点的编号。

步骤1-5，计算加速稳健特征点的世界坐标；

步骤1-6，计算下一帧图像预测的欧式变化矩阵；

步骤1-7，进行加速稳健特征点对位置的预判；

步骤1-5包括：

根据当前帧的特征点的像素坐标p_p[i,j]，计算出所有特征点的世界坐标p_w[i,j]，计算过程由以下公式给出：

p_wnc[i,j]＝T^-1K^-1p_p[i,j]， (17)

其中，p_w[i,j]，p_wnc[i,j]，p_p[i,j]均为三维列向量，p_wnc[i,j](2)指三维列向量p_wnc[i,j]中第三个元素，i代表当前帧的编号，j代表特征点对的编号。

步骤1-6包括：

计算出下一帧图像预测的欧式变化矩阵T_pct[i+1]：

T_ct[i]表示当前帧的欧式变化矩阵。

步骤1-6中，根据如下公式计算当前帧的欧式变化矩阵T_ct[i]：

步骤1-7包括：

使用加速稳健特征点的世界坐标以及下一帧图像预测的欧式变化矩阵，计算出每个像素点在新的彩色图像中的预测位置，计算过程由如下公式给出：

T_p[i]＝T_pct[i]T[i-1]， (5)

p_pr[i+1,j]＝KT_p[i]p_w[i,j]， (6)

其中，p_pr[i+1,j]为三维列向量，代表下一帧特征点的像素坐标的预测值，p_pr[i+1,j](k)代表向量中第k个元素，k＝0,1,2；T_p[i]代表当前帧累计的欧式变化矩阵的预测值；T[i-1]代表上一帧累计的欧式变化矩阵；u′[i，j]，v′[i，j]分别代表像素点在新的图像中的横坐标和纵坐标，由此可以得出特征点的大致位置。

步骤2包括如下步骤：

(光流法可参考Determining optical flow，Berthold K.P.HornBrianG.Schunck，Artificial Intelligence，Volume 17，Issues 1-3，August 1981，Pages 185-203)

p_p[i，j]＝[u[i，j]，v[i，j]，1]^T， (10)

p_p[i-1，j]＝[u[i-1，j]，v[i-1，j]，1]^T， (11)

其中p_p[i，j]，p_p[i-1，j]均为三维列向量，p_p[i，j]表示匹配的特征点对中的一个点的像素坐标，p_p[i-1，j]表示匹配的特征点对中的另一个点的像素坐标，(u[i，j]，v[i，j])指当前帧图像特征点的像素平面坐标，(u[i-1，j]，v[i-1，j])指前一帧图像特征点的像素坐标；

v_ldp[i]＝T_ct[i]v_ld[i-1]， (14)

预估的光流方向的矢量v_ldp[i]为三维列向量；

|v_ld[i]-v_ldp[i]|>0.2×|v_ld[i]+v_ldp[i]|， (15)

T[i]＝T_ct[i]T[i-1]， (16)

其中T[i-1]代表上一帧图像的累积相机欧式变化的矩阵。

步骤3包括如下步骤：

步骤3-1，将得出的欧式变化矩阵转化为欧式变换描述向量a_r[i]，欧式变换描述向量为一个5维行向量且与欧式变化矩阵有一一对应的关系，由以下公式给出：

a_r[i]＝[θ_x[i] θ_y[i] θ_z[i] m_x[i] m_y[i]]， (27)

其中Δt为编号为i-1和编号为i的两帧图像之间的时间间隔；

vd[i]＝[a[i] a[i+1] a[i+2] … a[i+9]]， (29)

a[i]代表第i帧的图像的经时间修正过的欧式变换描述向量；vd[i]代表第i帧的图像的运动描述向量，为一个50维的向量；

动作标签向量用于标记需要识别的运动类型，由人工判断得到。其用于标记需要识别的运动类型，静止、走路、旋转、跑步、跳跃分别为运动1、运动2、运动3、运动4、运动5。运动1、运动2、运动3、运动4、运动5的动作标签向量均为n维向量，分别为：

运动1:ld₁[i]＝[1 0 0 0 0]， (30-1)

运动2:ld₂[i]＝[0 1 0 0 0]， (30-1)

运动3:ld₃[i]＝[0 0 1 0 0]， (30-1)

运动4:ld₄[i]＝[1 0 0 1 0]， (30-1)

运动5:ld₅[i]＝[0 0 0 0 1]# (30-1)

由运动描述向量得出运动描述矩阵：

V_a代表运动描述矩阵；

由动作标签向量得出动作标签矩阵：

步骤4包括：

图8显示了训练时代价函数的下降过程。

步骤5包括如下步骤：

如果输出s＝1，则代表判定的当前运动状态为静止，如图2-图3；

如果输出s＝2，则代表判定的当前运动状态为走路，如图4-图5；

如果输出s＝3，则代表判定的当前运动状态为旋转，如图6；

如果输出s＝4，则代表判定的当前运动状态为跑步，如图7；

如果输出s＝5，则代表判定的当前运动状态为跳跃，如图8；

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本发明提供了基于相机位姿估计和深度学习的机器人运动状态识别方法，具体实现该技术方案的方法和途径很多，以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims

1.基于相机位姿估计和深度学习的机器人运动状态识别方法，其特征在于，包括以下步骤：

步骤5，利用运动预测模型实时判断机器人运动状态。

2.根据权利要求1所述的方法，其特征在于，步骤1包括如下步骤：

像素点的亮度由以下公式定义：

Y(u，v)＝0.299×R(u，v)+0.587×G(u，v)+0.114×B(u，v)， (1)

其中，Y(u，v)表示像素点(u，v)的亮度，R(u，v)、G(u，v)和B(u，v)分别表示该像素点(u，v)的红色分量值、绿色分量值和蓝色分量值；以图像左上角为基准，u表示像素点所在行数，v代表像素点所在列数；

对于公式(2)和(3)，Gy(u，v)表示当前像素点(u，v)变化后的灰度值，Gy₀(u，v)表示当前像素点(u，v)变化前的灰度值；

步骤1-3，提取图像的加速稳健特征点；

步骤1-5，计算加速稳健特征点的世界坐标；

步骤1-6，计算下一帧图像预测的欧式变化矩阵；

步骤1-7，进行加速稳健特征点对位置的预判；

3.根据权利要求2所述的方法，其特征在于，步骤1-5包括：

根据当前帧的特征点的像素坐标，计算出所有特征点的世界坐标，计算过程由以下公式给出：

p_wnc[i，j]＝T[i]^-1K^-1p_p[i，j]， (17)

4.根据权利要求3所述的方法，其特征在于，步骤1-6包括：

计算出下一帧图像预测的欧式变化矩阵T_pct[i+1]：

T_ct[i]表示当前帧的欧式变化矩阵。

5.根据权利要求4所述的方法，其特征在于，步骤1-6中，根据如下公式计算当前帧的欧式变化矩阵T_ct[i]：

6.根据权利要求5所述的方法，其特征在于，步骤1-7包括：

T_p[i]＝T_pct[i]T[i-1]， (5)

p_pr[i+1，j]＝KT_p[i]p_w[i，j]， (6)

其中，p_pr[i+1，j]为三维列向量，代表下一帧特征点的像素坐标的预测值；p_pr[i+1，j](k)代表向量中第k个元素，k＝0，1，2；T_p[i]代表当前帧累计的欧式变化矩阵的预测值；T[i-1]代表上一帧累计的欧式变化矩阵；u′[i，j]，v′[i，j]分别代表像素点在新的图像中的横坐标和纵坐标。

7.根据权利要求6所述的方法，其特征在于，步骤2包括如下步骤：

步骤2-1，通过光流法提取出光流的分布情况，得出光流方向的矢量v_ld[i]；

p_p[i，j]＝[u[i，j]，v[i，j]，1]^T， (10)

p_p[i-1，j]＝[u[i-1，j]，v[i-1，j]，1]^T， (11)

使用随机抽样一致算法去除离群值之后，解出R[i]、t[i]，使得所有特征点对的综合偏离值最小，偏离值d_bias由以下公式给出：

v_ldp[i]＝T_ct[i]v_ld[i-1]， (14)

预估的光流方向的矢量v_ldp[i]为三维列向量；

|v_ld[i]-v_ldp[i]|＞0.2×|v_ld[i]+v_ldp[i]|， (15)

T[i]＝T_ct[i]T[i-1]， (16)。

8.根据权利要求7所述的方法，其特征在于，步骤3包括如下步骤：

步骤3-1，将得出的欧式变化矩阵转化为欧式变换描述向量，欧式变换描述向量为一个5维行向量且与欧式变化矩阵有一一对应的关系，由以下公式给出：

a_r[i]＝[θ_x[i] θ_y[i] θ_z[i] m_x[i] m_y[i]]， (27)

其中，θ_x[i]代表俯仰角，θ_y[i]代表偏航角，θ_z[i]代表翻滚角，m_x[i]代表修正后的x轴方向位移量，m_y[i]代表修正后的y轴方向位移量，a_r[i]代表欧式变换描述向量；R[i]_r0，c0代表矩阵R[i]中第r0行第c0列的元素；t[i](n0)代表向量t[i]中第n0个元素；

其中Δt为编号为i-1和编号为i的两帧图像之间的时间间隔；

vd[i]＝[a[i] a[i+1] a[i+2] … a[i+9]]， (29)

动作标签向量用于标记需要识别的运动类型；记运动类型有n种，分别为运动1、运动2、运动3、……、运动n，运动h的动作标签向量为一个n维向量，其中第h项为1，其余项为0，1≤h≤n，且h为整数；

由运动描述向量得出运动描述矩阵：

V_a代表运动描述矩阵；

由动作标签向量得出动作标签矩阵：

9.根据权利要求8所述的方法，其特征在于，步骤4：

把运动描述矩阵和动作标签矩阵作为输入输入卷积神经网络，设置迭代次数为x，经过训练，得到运动预测模型Model。

10.根据权利要求9所述的方法，其特征在于，步骤5包括如下步骤：