CN110211151B

CN110211151B - 一种运动物体的追踪方法和装置

Info

Publication number: CN110211151B
Application number: CN201910353672.3A
Authority: CN
Inventors: 李晚龙; 李学士; 高亚军; 温丰
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2019-04-29
Filing date: 2019-04-29
Publication date: 2021-09-21
Anticipated expiration: 2039-04-29
Also published as: WO2020221307A1; US20220051031A1; CN110211151A

Abstract

本申请提供了一种运动物体的追踪方法、装置，该方法包括：获取相机采集到的当前帧；根据惯性测量单元IMU和所述当前帧，对所述相机的当前状态向量进行预测，得到所述相机的当前状态向量的预测值；对所述当前帧中处于运动状态的目标物体的当前状态向量进行预测，得到所述目标物体的当前状态向量的预测值；根据所述当前帧中图像特征的测量结果对卡尔曼状态向量进行更新。本申请提供的技术方案可以在估计自身的位姿的同时，还可以对周围环境中处于运动状态的目标物体进行追踪并估计其位姿。

Description

一种运动物体的追踪方法和装置

技术领域

本申请涉及位姿估计技术领域，并且更具体地，涉及一种运动物体的追踪方法和装置。

背景技术

计算机视觉是各个应用领域，如制造业、检验、文档分析、医疗诊断，和军事等领域中各种智能/自主系统中不可分割的一部分，它是一门关于如何运用照相机/摄像机和计算机来获取我们所需的，被拍摄对象的数据与信息的学问。形象地说，就是给计算机安装上眼睛(照相机/摄像机)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等，从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息，所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说，计算机视觉就是用各种成象系统代替视觉器官获取输入信息，再由计算机来代替大脑对这些输入信息完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界，具有自主适应环境的能力。

运动目标的检测和跟踪是图像处理与计算机视觉的一个分支，在理论和实践中上都有重大意义。在自动驾驶、军事侦察、增强现实(augment reality，AR)动态跟踪等场景中，移动平台需要能够估计自身的位姿，同时，还需要对周围环境中处于运动状态的目标物体进行追踪并估计其位姿。

目前移动平台上常用的一种定位方式为基于摄像头采集到的视觉信息估计自身的位姿，并基于自身的位姿估计周围环境中处于运动状态的目标物体的位姿。但是，由于摄像头本身存在噪声，仅通过视觉信息估计的自身的位姿准确性较低，由此，估计的处于运动状态的目标物体的位姿的准确性较低。

基于多状态约束的卡尔曼滤波(multi-state constraint kalman filter，MSCKF)可以结合摄像头采集到的视觉信息以及惯性测量单元(inertial measurementunit，IMU)的测量结果对自身的位姿估进行估计，其准确性较高。但是，MSCKF仅能估计出自身的位姿，而不能估计出周围环境中处于运动状态的目标物体的位姿。

发明内容

本申请提供一种方法和装置方法和装置，能够在估计自身的位姿的同时，还可以对周围环境中处于运动状态的目标物体进行追踪并估计其位姿。

第一方面，提供了一种运动物体的追踪方法，包括：

获取相机采集到的当前帧；

根据惯性测量单元IMU和所述当前帧，对所述相机的当前状态向量进行预测，得到所述相机的当前状态向量的预测值，所述相机的当前状态向量用于表示所述相机的当前位姿；

对所述当前帧中处于运动状态的目标物体的当前状态向量进行预测，得到所述目标物体的当前状态向量的预测值，所述目标物体的当前状态向量用于表示所述目标物体的当前位姿；

根据所述相机的当前状态向量的预测值以及所述目标物体的当前状态向量的预测值生成卡尔曼状态向量；

根据所述当前帧中图像特征的测量结果对卡尔曼状态向量进行更新，得到更新后的卡尔曼状态向量，其中，所述更新后的卡尔曼状态向量用于表示对所述目标物体进行跟踪。

应理解，IMU是测量物体三轴姿态角(或角速率)以及加速度的装置。一般的，一个IMU包含了三个单轴的加速度计和三个单轴的陀螺。加速度计检测物体在载体坐标系统独立三轴的加速度信号。而陀螺检测载体相对于导航坐标系的角速度信号，测量物体在三维空间中的角速度和加速度，并以此解算出物体的姿态。

在一种可能的实现方式中，根据所述当前帧中的处于背景部分的图像特征和所述目标物体的图像特征，计算所述当前帧的图像特征的雅克比矩阵；根据所述当前帧的图像特征的雅克比矩阵，对所述卡尔曼状态向量中包括的目标物体的当前状态向量的预测值以及相机的当前状态向量的预测值进行更新。

应理解，图像特征可以是相机采集到的图像中的特征点，图像处理中，特征点指的是图像灰度值发生剧烈变化的点或者在图像边缘上曲率较大的点(即两个边缘的交点)。图像特征点在基于特征点的图像匹配算法中有着十分重要的作用。图像特征点能够反映图像本质特征，能够标识图像中目标物体。通过特征点的匹配能够完成图像的匹配。

在另一种可能的实现方式中，确定所述当前帧中的动态特征点，所述动态特征点中包括表征点和非表征点，所述表征点作为所述目标物体的坐标系的原点，所述非表征点用于表示所述目标物体上除了所述表征点之外的其他动态特征点；根据所述表征点的姿态以及所述随机运动模型，对所述当前帧中处于运动状态的目标物体的当前状态向量进行预测，得到所述目标物体的当前状态向量的预测值。

应理解，目标分割的算法有两类，一类是以边界框对目标进行框取，另一类是以像素级别的精度对目标进行分割。第一类方法的分割精度显然不如第二类方法的分割精度高，但是第二类方法的计算量较大，考虑到实时性要求，本申请利用第一类方法进行目标分割。

对首次观测到的动态目标，需要确定为了完整描述刚体运动所需要的参数。本申请利用其表面动态特征点对其进行初始化，将特征点分为“表征点”和“非表征点”对其进行表征。

本申请实施例中，动态目标初始化可以提高加入系统状态向量的动态目标的正确性，提升系统鲁棒性。

在本申请中假设待追踪的目标为刚体，也就是说目标在运动过程中不发生形变。一般来讲，可以用6个自由度来描述刚体的位姿。一种典型的表示方式是利用刚体上的特征点(表征点)及一个方向来表示刚体位姿。然而当表征点在目标的运动过程中被遮挡住以至无法被观测到时，这种表征方法便失效了，尽管刚体的未被遮挡的部分仍能被观测到。

本申请利用动态目标表面一组特征点对其进行表征，而不是单独的一个。为了明确表示刚体的位置，需要一个“表征点”，其在全局坐标系中的位置记为^Gp_T。而除了一个“表征点”外，刚体上所有观测到的特征点均为“非表征点”。由于单独一个“表征点”无法表示刚体的6自由度的位姿，因此需要“非表征点”用于辅助“表征点”来表示刚体位姿。“非表征点”在刚体坐标系中的坐标记为^Tp_ft。

根据刚体的性质，这些特征点的相对位置关系不随着刚体的运动而改变，换言之，这些特征点在相对于刚体静止的坐标系中的位置不变，也即^Tp_ft是一个不随时间改变的常量。这样的表示方法使得即使动态目标被部分遮挡，只要能够观测到其部分特征点，仍然能够计算出表征点的位置，并成功追踪刚体。

一种选取“表征点”与“非表征点”的可行的方案是采用首次观测到的特征点(中的一个)为刚体的“表征点”。

在另一种可能的实现方式中，所述方法还包括：在所述表征点被遮挡的情况下，通过所述非表征点的姿态计算所述表征点的姿态。

在另一种可能的实现方式中，通过边界框框取所述当前帧中处于运动状态的目标物体；将所述边界框内的特征点确定为所述动态特征点。

在另一种可能的实现方式中，在所述当前帧之前的多帧图像中观测到所述处于运动状态的目标物体的情况下，将所述目标物体的当前状态向量的预测值加入滑动窗口，生成所述卡尔曼状态向量，其中，所述滑动窗口中包括所述相机的当前状态向量的预测值。

可选地，系统不会在首次没有观测到动态目标的时候就将其从系统状态向量中去除，因为没有检测到动态目标的原因有很多，可能是单次错误检测，或者是目标暂时被遮挡。这种情况下草率地将动态目标删除对系统的正确性、连续性与鲁棒性都有影响。

由于可能存在一闪而过的高速物体，以及目标错误检测的情况，因此只有在连续几帧观测到该动态目标后，才会将其加入整体状态向量，以确保加入的目标的正确性。

在另一种可能的实现方式中，所述方法还包括：在预设时间内，所述当前帧中未观测到所述处于运动状态的目标物体，从所述卡尔曼状态向量中删除所述目标物体的当前状态向量的预测值。

本申请中系统也不会一直在状态向量中保留动态目标的信息，因为这样会增加不必要的计算负担。为避免增加计算负担，只有一段合适的时间之内一直追踪不到该动态目标的情况下，才会其从状态向量中删除，并相应地修改协方差矩阵。其中一种可能的实现方式中，只需要将动态目标对应的行和列删除即可。

第二方面，提供一种运动物体的追踪装置，该装置包括用于执行第一方面中的方法的模块。

第三方面，提供一种运动物体的追踪装置，该装置包括：

获取模块，用于获取相机采集到的当前帧；

第一预测模块，用于根据惯性测量单元IMU和所述当前帧，对所述相机的当前状态向量进行预测，得到所述相机的当前状态向量的预测值，所述相机的当前状态向量用于表示所述相机的当前位姿；

第二预测模块，用于对所述当前帧中处于运动状态的目标物体的当前状态向量进行预测，得到所述目标物体的当前状态向量的预测值，所述目标物体的当前状态向量用于表示所述目标物体的当前位姿；

生成模块，用于根据所述相机的当前状态向量的预测值以及所述目标物体的当前状态向量的预测值生成卡尔曼状态向量；

更新模块，用于根据所述当前帧中图像特征的测量结果对卡尔曼状态向量进行更新，得到更新后的卡尔曼状态向量，其中，所述更新后的卡尔曼状态向量用于表示对所述目标物体进行跟踪。

在一种可能的实现方式中，所述装置还包括：

第一计算模块，用于根据所述当前帧中的处于背景部分的图像特征和所述目标物体的图像特征，计算所述当前帧的图像特征的雅克比矩阵；

所述更新模块具体用于：

根据所述当前帧的图像特征的雅克比矩阵，对所述卡尔曼状态向量中包括的目标物体的当前状态向量的预测值以及相机的当前状态向量的预测值进行更新。

在另一种可能的实现方式中，所述第二预测模块具体用于：

确定所述当前帧中的动态特征点，所述动态特征点中包括表征点和非表征点，所述表征点作为所述目标物体的坐标系的原点，所述非表征点用于表示所述目标物体上除了所述表征点之外的其他动态特征点；

根据所述表征点的姿态以及所述随机运动模型，对所述当前帧中处于运动状态的目标物体的当前状态向量进行预测，得到所述目标物体的当前状态向量的预测值。

在另一种可能的实现方式中，所述装置还包括：

第二计算模块，用于在所述表征点被遮挡的情况下，通过所述非表征点的姿态计算所述表征点的姿态。

在另一种可能的实现方式中，第二预测模块具体用于：

通过边界框框取所述当前帧中处于运动状态的目标物体；

将所述边界框内的特征点确定为所述动态特征点。

在另一种可能的实现方式中，所述生成模块具体用于：

在所述当前帧之前的多帧图像中观测到所述处于运动状态的目标物体的情况下，将所述目标物体的当前状态向量的预测值加入滑动窗口，生成所述卡尔曼状态向量，其中，所述滑动窗口中包括所述相机的当前状态向量的预测值。

在另一种可能的实现方式中，所述装置还包括：

删除模块，用于在预设时间内，所述当前帧中未观测到所述处于运动状态的目标物体，从所述卡尔曼状态向量中删除所述目标物体的当前状态向量的预测值。

第四方面，提供一种运动物体的追踪装置，该装置包括：存储器，用于存储程序；处理器，用于执行存储器存储的程序，当存储器存储的程序被执行时，处理器用于执行第一方面中的方法。

可选地，该处理器可以是通用处理器，可以通过硬件来实现也可以通过软件来实现。当通过硬件实现时，该处理器可以是逻辑电路、集成电路等；当通过软件来实现时，该处理器可以是一个通用处理器，通过读取存储器中存储的软件代码来实现，该存储器可以集成在处理器中，可以位于该处理器之外，独立存在。

其中，存储器、处理器和输入/输出接口通过内部连接通路相连，该存储器用于存储程序指令，该处理器用于执行该存储器存储的程序指令，以控制输入/输出接口830接收输入的数据和信息，输出操作结果等数据。

应理解，在本申请实施例中，该处理器可以采用中央处理单元(centralprocessing unit，CPU)，该处理器还可以是其它通用处理器、数字信号处理器(digitalsignal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现成可编程门阵列(field programmable gate Array，FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。或者该处理器采用一个或多个集成电路，用于执行相关程序，以实现本申请实施例所提供的技术方案。

该存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据。处理器的一部分还可以包括非易失性随机存取存储器。例如，处理器还可以存储设备类型的信息。

在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

具体的，处理器通过从存储器中获取存储的指令，并执行以下步骤：

获取相机采集到的当前帧；

在另一种可能的实现方式中，在所述表征点被遮挡的情况下，通过所述非表征点的姿态计算所述表征点的姿态。

在另一种可能的实现方式中，在预设时间内，所述当前帧中未观测到所述处于运动状态的目标物体，从所述卡尔曼状态向量中删除所述目标物体的当前状态向量的预测值。

第五方面，提供了一种芯片，该芯片包括：存储器，用于存储程序；处理器，用于执行存储器存储的程序，当存储器存储的程序被执行时，处理器用于执行第一方面中的方法。

获取相机采集到的当前帧；

第六方面，提供一种计算机可读介质，该计算机可读介质存储用于设备执行的程序代码，该程序代码包括用于执行第一方面中的方法。

第七方面，提供一种包含指令的计算机程序产品，当该计算机程序产品在计算机上运行时，使得计算机执行上述第一方面中的方法。

附图说明

图1是一种MSCKF框架的示意性结构图。

图2是本申请实施例提供的一种运动物体的追踪方法的示意性流程图。

图3是本申请实施例提供的一种MSCKF框架的示意性结构图。

图4是本申请实施例提供的一种预测当前时刻的状态向量的示意性流程图。

图5是本申请实施例提供的另一种预测当前时刻的状态向量的示意性流程图。

图6是本申请实施例提供的另一种预测当前时刻的状态向量的示意性流程图

图7是本申请实施例提供的一种运动物体的追踪装置700的示意性框图。

图8是本申请实施例提供的一种运动物体的追踪装置800的示意性框图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

MSCKF是一种基于多状态约束卡尔曼滤波器。多状态约束是指将多帧图像的相机位姿加入卡尔曼状态向量中，在进行卡尔曼增益之前通过多帧图像之间的约束进行最小二乘优化来估计特征点的空间位置，然后根据优化后的特征点空间位置来约束状态向量。其中，多帧图像保存在一个按时间排序的滑动窗口序列中，跟踪多个特征点在多帧图像中的坐标，从而建立各帧图像位姿之间的约束。另一个约束是：同一时刻的相机位姿与IMU位姿之间是一个已知的约束，这个约束用在状态增广中。在这两种约束下，卡尔曼滤波能够获得一个较好的估计。该方法的优点在于鲁棒性高，计算复杂度低。

为了便于描述，下面结合图1，对MSCKF的框架进行详细描述。

图1是一种MSCKF框架的示意性结构图。如图1所示，MSCKF框架中可以包括：传感器110(包括IMU 111、摄像头112)、一步预测模块120、相机位姿估计模块130、状态扩展140、特征检测与跟踪模块150、特征点测量值模块160、状态更新模块170。下面分别对上述模块进行详细说明。

需要说明的是，本申请实施例对摄像头112不做具体限定，可以是单目摄像头，或者还可以是双目摄像头，或者还可以是多目摄像头。

(1)IMU 111：

IMU 111是测量物体三轴姿态角(或角速率)以及加速度的装置。一般的，一个IMU包含了三个单轴的加速度计和三个单轴的陀螺。加速度计检测物体在载体坐标系统独立三轴的加速度信号。而陀螺检测载体相对于导航坐标系的角速度信号，测量物体在三维空间中的角速度和加速度，并以此解算出物体的姿态。

本申请实施例中IMU 111的输出的测量值分别为角速度测量值ω(t)、加速度测量值a(t)。由于IMU 111传感器本身存在偏置和噪声，因此，角速度真实值

与角速度测量值ω(t)如公式(1)所示，加速度真实值

与加速度测量值a(t)如公式(2)所示。

其中，b_g(t)用于表示陀螺仪的偏置；

b_a(t)用于表示加速度计的偏置；

n_g(t)用于表示陀螺仪的噪声，符合高斯分布；

n_a(t)用于表示加速度计的噪声，符合高斯分布。

需要说明的是，陀螺仪的噪声以及加速度计的噪声属于IMU 111的参数，在上一个时刻以及当前时刻保持不变。

(2)一步预测模块120：

由于IMU 111的数据频率高于一般图像视觉信息的频率，在相邻的两帧图像之间，可以对IMU 111输出的多组数据进行预积分，从而根据上一个时刻IMU 111的状态向量预测当前时刻IMU 111的状态向量，得到当前时刻IMU 111的状态向量预测值。

IMU 111的状态向量可以包括当前位姿以及瞬时速度等参数。具体的请参考公式(3)。

其中，X_IMU用于表示IMU 111的状态向量；

用于表示IMU111在全局坐标系(global，G)中的姿态(或者朝向)，其中，q表示四元数；

^Gv_I用于表示IMU111在全局坐标系G中的速度；

^Gp_I用于表示IMU111全局坐标系G中位置向量。

IMU 111可以根据上一个时刻IMU 111的状态向量预测当前时刻IMU 111的状态向量，具体的请参考公式(4)。

其中，X_IMU，k|k-1可以用于表示根据上一个时刻(k-1)更新后的X_IMU预测当前时刻(k)的X_IMU；

X_{IMU，k-1|k-1}用于表示(k-1)时刻更新后的X_IMU；

用于表示(k-1)时刻到(k)时刻对

进行积分；

用于表示X_IMU的真实值的导数。

可通过公式(5)所示的运动定律得到。

其中，

用于表示

真实值的导数；

用于表示^Gv_I真实值的导数；

用于表示^Gp_I真实值的导数；

用于表示

真实值的导数，将四元数转换为矩阵的操作；

用于表示b_g真实值的导数；

用于表示b_a真实值的导数；

用于表示加速度真实值；

用于表示角速度真实值；

用于表示将一个向量ω_G变为一个反对称矩阵的操作，ω_G用于表示地球自转的角速度；

需要说明的是，对于将一个向量变为一个反对称矩阵的操作，例如，

Ω(ω)的定义如下公式(6)所示。

(3)相机位姿估计模块130：

相机位姿估计模块130用于在新的一帧到来时，根据当前时刻IMU 111的状态向量的预测值X_IMU，k|k-1确定当前时刻摄像头112的状态向量X_CN。

(4)状态扩展140：

状态扩展140用于当新的一帧到来时，在滑动窗口的当前整体状态向量中加入摄像头112的状态向量

形成新的整体状态向量。具体的有关摄像头112的状态向量

请参考公式(7)-公式(7-2)：

其中，

用于表示当前时刻(N时刻)摄像头112在全局坐标系G中的朝向，

真实值的计算请参考公式(7-1)；

用于表示当前时刻(N时刻)摄像头112在全局坐标系G中的位置向量，

真实值的计算请参考公式(7-2)。

其中，

用于表示摄像头112与IMU 111之间的朝向；

用于表示IMU 111在全局坐标系G中的姿态(朝向)的真实值；

用于表示四元数乘法。

其中，

用于表示IMU 111全局坐标系G中的位置的真实值；

用于表示摄像头112与IMU 111之间的位置。

当前时刻摄像头112的状态向量X_Ci加入到滑动窗口中当前整体状态向量，形成新的整体状态向量。

需要说明的是，在将前时刻摄像头112的状态向量X_Ci加入到滑动窗口当前的整体状态向量中之后需要计算转换矩阵J。根据转换矩阵J计算新的整体状态向量对应的协方差矩阵。

整体状态向量对应的协方差矩阵的修改请参见公式(8)中的描述。

中，J的计算方法如公式(9)所示：

本申请实施例的状态扩展140中新的整体状态向量可以表示为：

其中，X_IMU表示IMU的状态向量；

X_Ci表示i时刻摄像头112的状态向量；

N为滑动窗口中保存的摄像头112位姿的时刻数。

(5)特征检测与跟踪模块150：

获取摄像头112采集到的图像中的特征点。

应理解，图像处理中，特征点指的是图像灰度值发生剧烈变化的点或者在图像边缘上曲率较大的点(即两个边缘的交点)。图像特征点在基于特征点的图像匹配算法中有着十分重要的作用。图像特征点能够反映图像本质特征，能够标识图像中目标物体。通过特征点的匹配能够完成图像的匹配。

一种可能的实现方式中，可以通过FAST算法提取摄像头112采集到的图像中的特征点。

(6)特征点测量值模块160：

特征点测量值模块160用于计算图像特征的雅克比矩阵，以便于在状态更新模块170中对公式(16)中一步预测模块120预测的当前时刻整体状态向量X_k以及协方差矩阵进行更新。

(7)状态更新模块170：

用于对一步预测模块120预测的当前时刻整体状态向量X_k以及协方差矩阵进行更新。

本申请提供的运动物体的追踪方法，可以在估计出自身姿态的同时，还可以估计出处于运动状态的目标物体的姿态。下面结合图2，对本申请实施例提供的技术方案进行详细描述。

图2是本申请实施例提供的一种运动物体的追踪方法的示意性流程图。如图2随时，该方法包括步骤210-240，下面分别对步骤210-240进行详细描述。

步骤210：获取相机采集到的当前帧。

步骤220：根据惯性测量单元IMU和所述当前帧，对所述相机的当前状态向量进行预测，得到所述相机的当前状态向量的预测值。

相机的当前状态向量用于表示所述相机的当前位姿。

步骤230：根据所述相机的当前状态向量的预测值以及所述目标物体的当前状态向量的预测值生成卡尔曼状态向量。

卡尔曼状态向量可以对应于上文中的整体状态向量，应理解，本申请实施例中可以在检测到目标物体之后，将新观测到目标物体初始化得到的当前时刻的状态向量加入到整体状态向量中，形成新的整体状态向量。

步骤240：根据所述当前帧中图像特征的测量结果对卡尔曼状态向量进行更新，得到更新后的卡尔曼状态向量。

其中，所述更新后的卡尔曼状态向量用于表示对所述目标物体进行跟踪。

需要说明的是，本申请实施例相当于在图1所示的MSCKF框架上新增加了对目标物体的预测和更新的模块，下面结合图3，对本申请实施例中用于估计自身姿态以及处于运动状态的目标物体的姿态的MSCKF框架进行详细描述。

图3是本申请实施例提供的一种MSCKF框架的示意性结构图。如图3所示，MSCKF框架中可以包括：传感器110(包括IMU 111、摄像头112)、一步预测模块120、相机位姿估计模块130、状态扩展140、特征检测与跟踪模块150、特征点测量值模块160、状态更新模块170、目标检测310、目标表征320、目标测量330、目标位姿估计340。下面分别对上述模块进行详细说明。

(1)IMU 111：

请参考图1中对IMU111的描述，此处不再赘述。

(2)一步预测模块120：

一步预测模块120不仅可以根据上一个时刻IMU 111的状态向量预测当前时刻IMU111的状态向量，还可以利用运动模型预测动态目标运动，计算当前时刻动态目标状态向量的预测值，具体的请参见图4。

图4是本申请实施例提供的一种预测当前时刻的状态向量的示意性流程图。图4所示的方法可以包括步骤410-430，下面分别对步骤410-430进行详细描述。

步骤410：对IMU 111输出的测量值进行积分，得到当前时刻IMU 111的状态向量预测值。

具体的请参考图1中对一步预测模块120的描述，此处不再赘述。

步骤420：利用运动模型预测动态目标运动，计算当前时刻动态目标状态向量的预测值。

为了能够在MSCKF框架下进行目标追踪，需要建立动态目标的运动模型。不同的应用场景中，出现的动态目标不尽相同，可根据目标运动模式的不同建立不同的运动模型。运动模型可以统一表示如公式(11)所示：

其中，

用于表示动态目标的状态向量的误差值的导数；

用于表示动态目标的状态向量的误差值。

F_T和G_T矩阵与运动模型相关。下面会结合具体的运动模型对F_T和G_T矩阵进行描述。

本申请实施例提出了三种随机运动模型用以对目标的运动进行建模，在实际应用中，应根据应用场景的不同合理选取运动模型，或视情况应用其他运动模型。

本申请实施例中，能够在短时间内对动态目标的运动状态进行预测。

一种可能的实现方式中，随机运动模型为全局匀速运动模型，该模型的动态目标的速度和角速度被视作随机游走模型，适用于动态目标的位置和朝向解耦的情况。

动态目标的状态向量可以包括当前位姿以及瞬时速度等参数。具体的请参考公式(12)：

其中，X_T用于表示动态目标的状态向量；

用于表示动态目标在全局坐标系(global，G)中的姿态，其中，q表示四元数；

T_ω用于表示动态目标的角速度；

^Gp_T用于表示动态目标在全局坐标系(global，G)中的位置向量；

^Gv_T用于表示动态目标在全局坐标系(global，G)中的速度。

动态目标的状态向量真实值的导数的公式如公式(13)所示。

其中，

用于表示动态目标的状态向量真实值的导数；

用于表示动态目标在全局坐标系(global，G)中的姿态真实值的导数，其中，q表示四元数；

用于表示动态目标的角速度真实值的导数；

用于表示动态目标在全局坐标系(global，G)中的位置向量真实值的导数；

用于表示动态目标在全局坐标系(global，G)中的速度真实值的导数；

用于表示动态目标在G中的速度真实值；

用于表示动态目标在G中的姿态真实值。

在随机运动模型为全局匀速运动模型的情况下，F_T和G_T矩阵的表示分别如公式(13-1)以及公式(13-2)所示。

另一种可能的实现方式中，随机运动模型为局部匀速运动模型，该模型的动态目标的速度在局部坐标系中的速度是恒定的，适用于地面机器人或固定翼飞行器模型中。

动态目标的状态向量请参考公式(14)：

其中，^Tv_T用于表示在动态目标在局部坐标系中的速度。

动态目标的状态向量真实值的导数如公式(15)所示。

在随机运动模型为局部匀速运动模型的情况下，F_T和G_T矩阵的表示分别如公式(15-1)以及公式(15-2)所示。

另一种可能的实现方式中，动态随机运动模型为局部平面运动模型，该模型的动态目标的运动被约束在一个平面上。此模型在平面估计中加入噪声，以使其适应平面约束发生变化的情况。

动态目标的状态向量请参考公式(16)：

其中，ω_z用于表示局部坐标系中z方向的角速度分量；

v_x用于表示局部坐标系中x方向的速度分量；

v_y用于表示局部坐标系中y方向的速度分量。

动态目标的状态向量真实值的导数的公式如公式(17)所示。

在随机运动模型为局部平面运动模型的情况下，F_T和G_T矩阵的表示分别如公式(17-1)以及公式(17-2)所示。

其中，

动态目标可以根据上一个时刻动态目标的状态向量预测当前时刻动态目标的状态向量，具体的请参考公式(18)。

其中，X_T，k|k-1可以用于表示根据上一个时刻(k-1)更新后的XT预测当前时刻(k)的X_T；

X_T，k-1|k-1用于表示(k-1)时刻更新后的X_T。

不同的运动模型对应的

不同，具体的请参考公式(13)、(15)、(17)。

本申请实施例中一步预测模块120预测的当前时刻整体状态向量可以表示为：

其中，X_IMU表示IMU的状态向量；

X_Ci表示i时刻摄像头112的状态向量；

X_Tj表示第j个动态目标的状态向量；

N为滑动窗口中保存的摄像头112位姿的时刻数；

M为当前正在跟踪的动态目标的个数。

需要说明的是，整体状态向量也可以称为卡尔曼状态向量。

步骤430：计算协方差矩阵的预测结果。

一步预测模块120在根据上一个时刻的状态向量计算出当前时刻的状态向量，同时还可以根据上一个时刻的协方差矩阵预测出当前时刻的协方差矩阵。

上一时刻系统整体状态向量的协方差矩阵如公式(20)所示。

其中，P_k-1|k-1用于表示上一个时刻(k-1)更新后的协方差矩阵；

P_II，k-1|k-1用于表示上一个时刻(k-1)更新后的IMU 111与IMU 111之间的协方差矩阵；

P_IT，k-1|k-1用于表示上一个时刻(k-1)更新后的IMU 111与动态目标之间的协方差矩阵；

P_IC，k-1|k-1用于表示上一个时刻(k-1)更新后的IMU 111与摄像头112之间的协方差矩阵；

P_TT，k-1|k-1用于表示上一个时刻(k-1)更新后的动态目标与动态目标之间的协方差矩阵；

P_TC，k-1|k-1用于表示上一个时刻(k-1)更新后的动态目标与摄像头112之间的协方差矩阵。

当前(k)时刻系统整体状态向量的协方差矩阵如下所示。

其中，P_k|k-1用于表示根据上一个时刻(k-1)更新后的P_k-1|k-1预测当前时刻(k)的协方差矩阵：

P_II，k|k-1用于表示根据上一个时刻(k-1)更新后的P_II，k-1|k-1预测当前时刻(k)的X_IMUIMU 111与IMU 111之间的协方差矩阵；

P_IT，k|k-1用于表示根据上一个时刻(k-1)更新后的P_IT，k-1|k-1预测当前时刻(k)的X_IMUIMU 111与动态目标之间的协方差矩阵；

P_TT，k|k-1用于表示根据上一个时刻(k-1)更新后的P_TT，k-1|k-1预测当前时刻(k)的动态目标与动态目标之间的协方差矩阵；

P_CC，k-1|k-1用于表示上一个时刻(k-1)更新后的摄像头112与摄像头112之间的协方差矩阵；

Φ为状态转移矩阵，满足公式(21)-公式(22)所示的关系：

P_II，k|k-1，P_IT，k|k-1和P_TT，k|k-1可利用如下公式(23)-公式(25)通过数值积分计算得到：

其中，Q_IMU和Q_T为噪声n_IMU和n_T对应的协方差矩阵

F矩阵如公式(26)所示，G矩阵如公式(27)所示。

其中，I₃用于表示3×3的单位矩阵；

O_3×3用于表示3×3的零矩阵；

用于表示将一个向量变为一个反对称矩阵的操作，

用于表示加速度的真实值。

(3)相机位姿估计模块130：

相机位姿估计模块130用于在新的一帧到来时，根据当前时刻IMU 111的状态向量的预测值X_IMU，k|k-1确定当前时刻摄像头112的状态向量X_CN，并将X_CN加入到滑动窗口中。请参见图1中对相机位姿估计模块130的描述，此处不再赘述。

(4)状态扩展140：

请参见图1中对状态扩展140的描述，此处不再赘述。

(5)特征检测与跟踪模块150：

可以对图像中的特征点进行分类，得到动态特征点和静态特征点(背景特征点)，具体的请参见图5。

图5是本申请实施例提供的另一种预测当前时刻的状态向量的示意性流程图。图5所示的方法可以包括步骤510-550，下面分别对步骤510-550进行详细描述。

步骤510：提取图像特征点。

采用FAST算法提取特征点。在实际场景中，特征点的分布通常并不均匀。为了在图像中取得尽量均匀分布的特征点，将图像分割成网格，并在图像网格中均匀提取特征点。

步骤520：对图像进行目标分割，得到动态目标的边界。

目标分割的算法有两类，一类是以边界框对目标进行框取，另一类是以像素级别的精度对目标进行分割。第一类方法的分割精度显然不如第二类方法的分割精度高，但是第二类方法的计算量较大，考虑到实时性要求，本申请利用第一类方法进行目标分割。

步骤530：利用目标检测结果对特征点进行分类。

边界框被用来对提取到的特征点进行分类。目标检测310将在边界框之内的特征点位于动态目标上，确定为动态特征点；不在边界框内的特征点属于静态的背景，确定为静态特征点。

(6)特征点测量值模块160：

特征点测量值模块160用于对处理静态特征点，具体的请参见图5中步骤540。

步骤540：处理静态特征点。

当特征点跟丢或者达到最大追踪数的时候，将其数据用于对状态向量的更新。

其中，П是一个将三维空间中特征点投影到平面图像上的投影函数，i为动态目标的编号

其残差方程为：

其中，J⁽ⁱ⁾和

的表示如公式(33)-(34)所示。

为了在残差方程中去除

的影响，本申请实施例中将残差方程投影到H_fs的左零空间。设N是由H_fs的左零空间中的一组基构成的酉矩阵，有N^TH_fs＝0。在残差方程的左右两端同时左乘N^T，得到公式(35)：

残差r_S记作公式(36)：

其中，H_S用于表示雅克比矩阵。

(7)目标表征320：

目标表征320用于通过图像中的动态特征点表征动态目标。请参见步骤550中处理动态点测量值的描述。具体的有关处理动态点测量值的具体实现方式请参考图6中描述的方法。

图6是本申请实施例提供的另一种预测当前时刻的状态向量的示意性流程图。图6所示的方法可以包括步骤610-650，下面分别对步骤610-650进行详细描述。

步骤610：追踪动态特征点。

本申请实施例中采用KLT算法对特征点进行追踪。分别用于左目帧间匹配、右目帧间匹配以及立体匹配。

步骤620：第一次观测到动态特征点，

本申请实施例中，能够应对动态目标被部分遮挡的情况，增加系统鲁棒性。

(8)目标位姿估计340：

目标位姿估计340可以根据目标表征320输出的表征点在全局坐标系中的位置^Gp_T以及非表征点在刚体坐标系中的坐标^Tp_ft，确定是否观测到新的动态目标。如果新观测到动态目标，将该动态目标在当前时刻的状态向量加入到如公式(19)所示的整体状态向量中。具体的请参见图6中描述的方法。

步骤630：若持续观测到该动态目标，将动态目标状态向量加入整体状态向量中。

假设从C_j到C_N几帧中观测到动态目标，j∈[1，N]。对观测到的目标上的特征点进行三角化，得到表征点和第i个非表征点在C_j坐标系中的位置

和

根据动态目标在这几帧之中的观测，对其状态向量进行初始化。

本申请实施例中，可以使得系统利用新的观测结果对状态向量(包括动态目标及自身位姿)进行不断更新，保证算法在动态的未知环境中对自身和动态目标的追踪定位。

下面给出不同的随机模型的初始化结果。

在一些实施例中，运行模型为全局匀速运动模型。选取第N帧(当前帧)坐标系的方向作为动态目标的初始方向，如公式(37)-(38)所示。

其中，

为Cj坐标系下，本征点指向第i非本征点方向的单位向量；

t_j为第j帧的时间；

在一些实施例中，运行模型为局部匀速运动模型，只有速度的表示与前一个模型不同，其余变量相同。^Tv_T的表示如公式(42)所示。

其中，

在一些实施例中，运行模型为局部平面运动模型，相关参数的计算如公式(45)-(53)所示。

ω_z＝||G_ω|| (46)

V_y＝0 (52)

其中，

表示T坐标系中坐标轴的方向向量(i＝x，y，z)。

需要说明的是，本申请实施例中，由于三角化步骤中的误差取决于具体使用的方法，动态目标的初始化结果的协方差难以得到一个解析结果。因此可以考虑采用为协方差矩阵设置一个经验值作为初始值，后续的更新过程会对协方差不断修正。

(9)目标测量330：

目标测量330用于处理动态特征点，具体的请参见图6中步骤640。

步骤640：计算测量结果。

当动态目标跟丢或者达到了最大追踪长度的时候，利用它们的测量结果对状态向量进行更新。

本申请收集并采用图像中所检测到的目标上所有特征点的测量结果，包括“表征点”和“非表征点”。其中，表征点的测量模型为：

其残差方程为：

其中，

非表征点的测量模型为：

测量值的残差可表示为：

为了减低计算量，本申请实施例只保留与状态向量相关的项，边缘化特征点相关的项。故将上述残差方程分别投影到

和

的左零空间，以消除

和

的影响(具体方式与2.3相似)，并将这些方程合成一个大矩阵方程，得到：

步骤650：若连续追踪不到该动态目标，将其从整体状态向量中删除，并相应地修改协方差矩阵。

另外，系统也不会一直在状态向量中保留动态目标的信息，因为这样会增加不必要的计算负担。

为避免这些负面影响，只有一段合适的时间之内一直追踪不到该动态目标的情况下，才会其从状态向量中删除，并相应地修改协方差矩阵。其中一种可能的实现方式中，只需要将动态目标对应的行和列删除即可。

本申请实施例中，控制系统状态向量的规模在一定范围，减少不必要的计算复杂度，保证算法能够实时处理。

(10)状态更新模块170：

将静态特征点与动态特征点测量结果的残差方程列写成一个方程，如公式(68)所下：

为了降低计算复杂度，对H_X做QR分解以降维，得到：

将结果代入得到最终用于更新的残差方程，如公式(70)：

即：

通过公式(73)计算卡尔曼增益K：

其中，R_n为噪声n_n的协方差矩阵；

P_k|k-1用于表示根据上一个时刻(k-1)更新后的P_k-1|k-1预测当前时刻(k)的协方差矩阵：

P_k|k用于表示当前(k)时刻更新后的协方差矩阵。

通过公式(74)-(75)更新状态向量：

ΔX＝Kr_n (74)

X_k|k＝X_k|k-1+ΔX (75)

其中，X_k|k-1用于表示根据上一个时刻(k-1)更新后的X_k-1|k-1预测当前时刻(k)的整体状态向量；

X_k|k用于表示当前(k)时刻更新后的整体状态向量。

通过公式(76)更新协方差矩阵：

P_k|k＝(I-KT_H)P_k|k-1(I-KT_H)^T+KR_nK^T (76)

本申请实施例中，在复杂场景，如遮挡、观测不连续、快速运动等条件下仍能有较好的定位结果。

上文结合图1至图6，详细描述了本申请实施例提供的运动物体的追踪方法，下面将结合图7至图8，详细描述本申请装置的实施例。应理解，方法实施例的描述与装置实施例的描述相互对应，因此，未详细描述的部分可以参见前面方法实施例。

图7是本申请实施例提供的一种运动物体的追踪装置700的示意性框图。该装置700可以包括：

获取模块710，用于获取相机采集到的当前帧；

第一预测模块720，用于根据惯性测量单元IMU和所述当前帧，对所述相机的当前状态向量进行预测，得到所述相机的当前状态向量的预测值，所述相机的当前状态向量用于表示所述相机的当前位姿；

第二预测模块730，用于对所述当前帧中处于运动状态的目标物体的当前状态向量进行预测，得到所述目标物体的当前状态向量的预测值，所述目标物体的当前状态向量用于表示所述目标物体的当前位姿；

更新模块740，用于根据所述当前帧中图像特征的测量结果对卡尔曼状态向量进行更新，得到更新后的卡尔曼状态向量，其中，所述更新后的卡尔曼状态向量用于表示对所述目标物体进行跟踪。

可选地，所述装置700还包括：

第一计算模块750，用于根据所述当前帧中的处于背景部分的图像特征和所述目标物体的图像特征，计算所述当前帧的图像特征的雅克比矩阵；

所述更新模块740具体用于：

可选地，所述第二预测模块730具体用于：

可选地，所述装置700还包括：

第二计算模块760，用于在所述表征点被遮挡的情况下，通过所述非表征点的姿态计算所述表征点的姿态。

可选地，第二预测模块730具体用于：

通过边界框框取所述当前帧中处于运动状态的目标物体；

将所述边界框内的特征点确定为所述动态特征点。

可选地，所述装置700还包括：

生成模块770，用于在所述当前帧之前的多帧图像中观测到所述处于运动状态的目标物体的情况下，将所述目标物体的当前状态向量的预测值加入滑动窗口，生成所述卡尔曼状态向量，其中，所述滑动窗口中包括所述相机的当前状态向量的预测值。

可选地，所述装置700还包括：

删除模块780，用于在预设时间内，所述当前帧中未观测到所述处于运动状态的目标物体，从所述卡尔曼状态向量中删除所述目标物体的当前状态向量的预测值。

图8是本申请实施例提供的一种运动物体的追踪装置800的示意性框图。该装置800可以包括：存储器810、处理器820、输入/输出接口830。

其中，存储器810、处理器820和输入/输出接口830通过内部连接通路相连，该存储器810用于存储程序指令，该处理器820用于执行该存储器810存储的程序指令，以控制输入/输出接口830接收输入的数据和信息，输出操作结果等数据。

应理解，在本申请实施例中，该处理器820可以采用中央处理单元(centralprocessing unit，CPU)，该处理器还可以是其它通用处理器、数字信号处理器(digitalsignal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现成可编程门阵列(field programmable gate Array，FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。或者该处理器820采用一个或多个集成电路，用于执行相关程序，以实现本申请实施例所提供的技术方案。

该存储器810可以包括只读存储器和随机存取存储器，并向处理器820提供指令和数据。处理器820的一部分还可以包括非易失性随机存取存储器。例如，处理器820还可以存储设备类型的信息。

存储器810可以是只读存储器(Read Only Memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器(Random Access Memory，RAM)。存储器901可以存储程序，当存储器810中存储的程序被处理器820执行时，处理器810和用于执行本申请实施例的的各个步骤。

在实现过程中，上述方法的各步骤可以通过处理器820中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器810，处理器820读取存储器810中的信息，结合其硬件完成上述方法的步骤。

具体的，处理器820通过从存储器810中获取存储的指令，并执行以下步骤：

获取相机采集到的当前帧；

可选地，根据所述当前帧中的处于背景部分的图像特征和所述目标物体的图像特征，计算所述当前帧的图像特征的雅克比矩阵；根据所述当前帧的图像特征的雅克比矩阵，对所述卡尔曼状态向量中包括的目标物体的当前状态向量的预测值以及相机的当前状态向量的预测值进行更新。

可选地，确定所述当前帧中的动态特征点，所述动态特征点中包括表征点和非表征点，所述表征点作为所述目标物体的坐标系的原点，所述非表征点用于表示所述目标物体上除了所述表征点之外的其他动态特征点；根据所述表征点的姿态以及所述随机运动模型，对所述当前帧中处于运动状态的目标物体的当前状态向量进行预测，得到所述目标物体的当前状态向量的预测值。

可选地，在所述表征点被遮挡的情况下，通过所述非表征点的姿态计算所述表征点的姿态。

可选地，通过边界框框取所述当前帧中处于运动状态的目标物体；将所述边界框内的特征点确定为所述动态特征点。

可选地，在所述当前帧之前的多帧图像中观测到所述处于运动状态的目标物体的情况下，将所述目标物体的当前状态向量的预测值加入滑动窗口，生成所述卡尔曼状态向量，其中，所述滑动窗口中包括所述相机的当前状态向量的预测值。

可选地，在预设时间内，所述当前帧中未观测到所述处于运动状态的目标物体，从所述卡尔曼状态向量中删除所述目标物体的当前状态向量的预测值。

需要说明的是，在图8所示的装置800中，处理器820可以通过调用存储器810中的计算机程序，实现各个模块执行的步骤。例如，可以由处理器820调用缓存中存储的计算机指令来执行各个模块所需要执行的步骤。

应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

可选地，本申请还提供了一种芯片，该芯片包括：存储器，用于存储程序；处理器，用于执行存储器存储的程序，当存储器存储的程序被执行时，处理器用于执行第一方面中的方法。

获取相机采集到的当前帧；

可选地，本申请还提供一种计算机可读介质，该计算机可读介质存储用于设备执行的程序代码，该程序代码包括用于执行图2中的方法。

可选地，本申请还提供一种包含指令的计算机程序产品，当该计算机程序产品在计算机上运行时，使得计算机执行图2中的方法。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请中使用的术语“部件”、“模块”、“系统”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。例如，部件可以是但不限于，在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或计算机。通过图示，在计算设备上运行的应用和计算设备都可以是部件。一个或多个部件可驻留在进程和/或执行线程中，部件可位于一个计算机上和/或分布在2个或多个计算机之间。此外，这些部件可从在上面存储有各种数据结构的各种计算机可读介质执行。部件可根据具有一个或多个数据分组(例如来自与本地系统、分布式系统和/或网络间的另一部件交互的二个部件的数据，例如通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。

应理解，本申请实施例中的方式、情况、类别以及实施例的划分仅是为了描述的方便，不应构成特别的限定，各种方式、类别、情况以及实施例中的特征在不矛盾的情况下可以相结合。

还应理解，在本申请的各实施例中，“第一”、“第二”、“第三”等仅是为了指代不同的对象，并不表示对指代的对象有其它限定。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

应理解，在本申请实施例中，“与A相应的B”表示B与A相关联，根据A可以确定B。但还应理解，根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其它信息确定B。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种运动物体的追踪方法，其特征在于，所述方法包括：

获取相机采集到的当前帧；

根据所述当前帧中图像特征的测量结果对卡尔曼状态向量进行更新，得到更新后的卡尔曼状态向量，其中，所述卡尔曼状态向量中包括所述相机的当前状态向量的预测值以及所述目标物体的当前状态向量的预测值，所述更新后的卡尔曼状态向量用于表示对所述目标物体进行跟踪。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据所述当前帧中的处于背景部分的图像特征和所述目标物体的图像特征，计算所述当前帧的图像特征的雅克比矩阵；

所述当前帧中图像特征的测量结果，对卡尔曼状态向量进行更新，包括：

3.根据权利要求1所述的方法，其特征在于，对所述当前帧中处于运动状态的目标物体的当前状态向量进行预测，得到所述目标物体的当前状态向量的预测值，包括：

根据所述表征点的姿态以及随机运动模型，对所述当前帧中处于运动状态的目标物体的当前状态向量进行预测，得到所述目标物体的当前状态向量的预测值。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

在所述表征点被遮挡的情况下，通过所述非表征点的姿态计算所述表征点的姿态。

5.根据权利要求3所述的方法，其特征在于，所述确定所述当前帧中的动态特征点，包括：

通过边界框框取所述当前帧中处于运动状态的目标物体；

将所述边界框内的特征点确定为所述动态特征点。

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1至5中任一项所述的方法，其特征在于，所述方法还包括：

在预设时间内，所述当前帧中未观测到所述处于运动状态的目标物体，从所述卡尔曼状态向量中删除所述目标物体的当前状态向量的预测值。

8.一种运动物体的追踪装置，其特征在于，所述装置包括：

获取模块，用于获取相机采集到的当前帧；

更新模块，用于根据所述当前帧中图像特征的测量结果对卡尔曼状态向量进行更新，得到更新后的卡尔曼状态向量，其中，所述卡尔曼状态向量中包括所述相机的当前状态向量的预测值以及所述目标物体的当前状态向量的预测值，所述更新后的卡尔曼状态向量用于表示对所述目标物体进行跟踪。

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

所述更新模块具体用于：

10.根据权利要求8所述的装置，其特征在于，所述第二预测模块具体用于：

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

12.根据权利要求10所述的装置，其特征在于，第二预测模块具体用于：

通过边界框框取所述当前帧中处于运动状态的目标物体；

将所述边界框内的特征点确定为所述动态特征点。

13.根据权利要求8至12中任一项所述的装置，其特征在于，所述装置还包括：

生成模块，用于在所述当前帧之前的多帧图像中观测到所述处于运动状态的目标物体的情况下，将所述目标物体的当前状态向量的预测值加入滑动窗口，生成所述卡尔曼状态向量，其中，所述滑动窗口中包括所述相机的当前状态向量的预测值。

14.根据权利要求8至12中任一项所述的装置，其特征在于，所述装置还包括：

15.一种运动物体的的追踪装置，其特征在于，所述装置包括：输入输出接口、处理器和存储器，所述存储器用于存储程序指令，所述处理器用于从存储器中调用并运行所述程序指令以执行权利要求1至7中任一项所述的方法。

16.一种计算机可读存储介质，其特征在于，包括计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行权利要求1至7中任一项所述的方法。