CN113674310A

CN113674310A - 一种基于主动视觉感知的四旋翼无人机目标跟踪方法

Info

Publication number: CN113674310A
Application number: CN202110513594.6A
Authority: CN
Inventors: 张平; 梁观鑫
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2021-05-11
Filing date: 2021-05-11
Publication date: 2021-11-19
Anticipated expiration: 2041-05-11
Also published as: CN113674310B

Abstract

本发明公开了一种基于主动视觉感知的四旋翼无人机目标跟踪方法。所述方法包括以下步骤：选择跟踪目标；根据基于深度关联度量的多轨道孪生网络目标跟踪算法，对目标进行图像位置跟踪；估计和预测目标的运动状态；计算未来N步时间的最优控制序列，控制四旋翼无人机保距跟踪目标以及相机对准目标。本发明使用目标检测算法识别常见感兴趣物体类别，对于移动物体初始跟踪框的选取可以起到明显的辅助作用。本发明在保证算法实时性的基础上增加了目标识别的成功率和容错性，同时能够反映目标的丢失情况并且在目标丢失后进行全局目标重定位搜索，实现对目标的长时视觉目标跟踪，为目标的状态估计提供基本的保障。

Description

一种基于主动视觉感知的四旋翼无人机目标跟踪方法

技术领域：

本发明涉及的领域有四旋翼无人机技术、机器视觉以及航迹规划，涉及一种基于主动视觉感知的四旋翼无人机目标跟踪方法。

背景技术：

现有四旋翼无人机目标跟踪系统主要需要解决两方面问题，一是利用机载传感器对目标进行识别和定位；二是规划无人机的运动轨迹，控制无人机对目标展开跟踪，使传感器可以持续观测到目标。

根据目标识别与定位的实现手段，现有无人机目标跟踪系统的实现可以分为两类，一是要求目标携带GPS或类似其他电子信标，无人机通过信标的获取目标定位信息；这类方法具有很大的局限性。二是要求无人机搭载视觉传感器，无人机通过视觉目标跟踪算法获取目标在图像中的像素坐标，并且基于三维坐标解算方法得到目标在地理坐标系下的三维坐标；这类方法使用的视觉目标跟踪算法多为传统算法或者相关滤波算法，其跟踪精度较差或者容易在长时跟踪中累计误差导致漂移出错，不能直接用于无人机目标跟踪任务。

此外，在目标跟踪过程中，目标为规避无人机的跟踪，会产生较强的机动变化。然而，现有无人机目标跟踪系统的轨迹规划和跟踪控制方法大多只考虑当前时刻的目标状态，缺乏一种主动机制应对目标的规避行为。

现有技术中有，首先利用改进的FDSST算法对目标进行视觉跟踪，然后通过扩展卡尔曼滤波方法进行目标状态估计，最后根据目标和无人机状态，利用 PID控制器实现无人机自主保距跟踪目标(刘奇胜.基于视觉的四旋翼无人机目标跟踪系统的设计与实现[D].电子科技大学,2019)。但是，该现有技术中提出的改进FDSST算法仍属于相关滤波算法类别，其跟踪精度较差并且容易积累误差导致永久性跟踪出错。此外，该现有技术中的PID控制器只考虑当前时刻的目标状态，当目标移动较快或者目标机动较强时，容易发生跟踪滞后问题，即无法维持期望的跟踪距离，继而导致目标丢失。

这些情况都影响了无人机目标跟踪系统的实用性，是应用场景具有局限性的主要原因。

发明内容：

本发明的出发点在于克服现有类似系统的不足，提供了一种基于主动视觉感知的四旋翼无人机目标跟踪方法。本发明首先通过目标检测方法辅助选择跟踪目标；然后通过基于深度关联度量的多轨道孪生网络目标跟踪算法在线跟踪目标的图像位置和尺度，实现对目标在像素意义上的位置追踪与尺度追踪；接着结合无人机的其他传感器信息，将目标在像素意义上的位置转换到在地理坐标系下的位置，并且使用卡尔曼滤波估计目标的运动状态和预测目标的未来N步时间运动状态；最后根据目标在未来N步时间的运动状态和环境信息，计算未来N步时间的无人机最优控制序列，实现四旋翼无人机对目标的主动跟踪。

本发明的目的至少通过如下技术方案之一实现。

一种基于主动视觉感知的四旋翼无人机目标跟踪方法，包括以下步骤：

S1、选择跟踪目标；

S2、根据基于深度关联度量的多轨道孪生网络目标跟踪算法，对目标进行图像位置跟踪；

S3、估计和预测目标的运动状态；

S4、计算未来N步时间的最优控制序列，控制四旋翼无人机保距跟踪目标以及相机对准目标。

进一步地，步骤S1中，地面站计算机在线接收和显示四旋翼无人机回传的图像，运行目标检测算法或者人工选择跟踪目标，得到初始目标包围框区域；

根据四旋翼无人机的飞行高度和相机内参、跟踪目标的图像位置和大小，通过单目测距原理和三角相似方法估算目标的身高h。

进一步地，步骤S2中，当四旋翼无人机接收到新的图像帧时，运行基于深度关联度量的多轨道孪生网络目标跟踪算法，获得目标的最新图像位置和尺度；

若目标丢失，则将基于深度关联度量的多轨道孪生网络目标跟踪算法从局部跟踪切换到全局目标重定位搜索。

进一步地，步骤S2中，所述基于深度关联度量的多轨道孪生网络目标跟踪算法具体包括以下步骤：

S2.1、构建深度目标验证器，建立目标轨道，将目标轨道标记为已确认状态；根据步骤S1所选择目标，基于深度目标验证器提取初始目标包围框区域的深度嵌入表观特征向量F₀，并且以F₀初始化目标轨道的历史表观特征向量池；设置历史表观特征向量池的最大容量为L个表观特征向量，并且在池满时以先进先出的方式更新；基于初始目标包围框的位置和尺度提取运动特征向量，初始化描述目标运动变化的卡尔曼滤波器，完成对目标轨道的初始化；以初始目标包围框区域作为目标模板，完成对孪生网络跟踪器的初始化；

S2.2、当四旋翼无人机接收到新的图像帧时，以上一帧的目标包围框区域为中心提取局部搜索区域S；使用孪生网络跟踪器在局部搜索区域S内提取多个候选包围框，同时获得候选包围框的响应得分；通过非极大值抑制和预设的重叠率阈值t₇和孪生网络跟踪器响应得分阈值t₀，过滤重叠率高于阈值t₇的冗余包围框和响应得分低于阈值t₀的低质量包围框，得到候选对象包围框；

响应得分是每个候选对象包围框的固有属性，由孪生网络跟踪器生成，其值是0-1.0之间，值越大代表包围框的质量越好。阈值参数t₀和t₇的值根据详细实施例的情况手动设置，根据经验设置；非极大值抑制是一种在计算机视觉领域用于去除重叠包围框的通用方法。

S2.3、基于深度目标验证器对步骤S2.2所得到的候选对象包围框提取深度嵌入表观特征向量；基于候选对象包围框的位置和尺度提取候选对象包围框的运动特征向量；基于卡尔曼滤波器预测目标轨道的运动特征向量；若存在干扰对象轨道，基于卡尔曼滤波器预测所有干扰对象轨道的运动特征向量；

S2.4、将目标轨道或者匹配成功次数大于n的干扰对象轨道表示为已确认轨道，根据候选对象包围框的深度嵌入表观特征向量以及已确认轨道的历史表观特征向量池，利用余弦距离计算两者之间的表观代价；若表观代价高于预设的表观不匹配阈值t₁，则判断候选对象包围框与对应的已确认轨道不匹配，将该表观代价修改为浮点类型的最大表示值；根据不同候选对象包围框与不同已确认轨道之间的表观代价，生成可用于关联匹配的表观代价矩阵；

根据候选对象包围框的运动特征向量以及已确认轨道的预测运动特征向量，利用Mahalanobis距离计算两者之间的几何代价；若几何代价高于预设的几何距离阈值t₂，并且当其对应的候选对象包围框与对应的已确认轨道之间的表观代价高于预设的表观可靠匹配阈值t₃时，判断候选对象包围框与轨道不可匹配，修改该表观代价为浮点数的最大表示值；

根据不同候选对象包围框与不同已确认轨道之间的几何代价，生成可用于关联匹配的几何代价矩阵；

S2.5、根据步骤S2.2中响应得分最高的候选对象包围框的深度嵌入表观特征向量以及初始目标包围框区域的深度嵌入表观特征向量F₀，利用余弦距离计算该候选对象包围框与目标轨道之间的初始表观代价，若初始表观代价低于预设的表观可靠匹配阈值t₃，则判断该候选对象包围框与目标轨道成功匹配，更新匹配结果集，并且移除表观代价矩阵和几何代价矩阵中该候选对象包围框和目标轨道所在的行和列；

S2.6、基于匈牙利匹配方法，利用执行步骤S2.5后的表观代价矩阵对未匹配的候选对象包围框和未匹配的已确认轨道进行二部图匹配，更新匹配结果集、未匹配候选对象集以及未匹配轨道集；

S2.7、将匹配成功次数小于等于n的干扰对象轨道表示为未确认干扰对象轨道，将所有未确认干扰对象轨道加入到未匹配轨道集；根据未匹配候选对象集中的未匹配候选对象包围框的运动特征向量和未匹配轨道集中的轨道的预测运动特征向量，计算两者之间的交并比(IOU)；根据不同未匹配候选对象包围框与未匹配轨道集中不同的轨道的IOU，生成IOU代价矩阵；基于匈牙利匹配方法，利用IOU代价矩阵对未匹配候选对象集和未匹配轨道集中的元素进行第二次二部图匹配，更新匹配结果集、未匹配候选对象集和未匹配轨道集；

S2.8、遍历匹配结果集，利用匹配结果中的候选对象包围框的运动特征向量更新所匹配轨道的卡尔曼滤波参数，如果该匹配结果的表观代价低于预设的历史表观特征向量池更新阈值t₄，则利用候选对象包围框的表观特征向量更新所匹配轨道的历史表观特征向量池，并且在池满时基于先进先出的原则丢失旧特征向量，如果所匹配轨道是未确认干扰对象轨道，并且其匹配成功次数大于n，则将该干扰对象轨道标记为已确认状态；

S2.9、遍历未匹配轨道集，如果是干扰对象轨道，并且距离其最近一次匹配成功的间隔大于m帧，则删除该干扰对象轨道；

遍历未匹配候选对象集，为每一个未匹配候选对象包围框新建单独的干扰对象轨道，并且利用未匹配候选对象包围框的深度嵌入表观特征向量初始化对应干扰对象轨道的历史表观特征向量池，设置其历史表观特征向量池的最大容量为L个表观特征向量，并且在池满时以先进先出的方式更新，利用未匹配候选对象包围框的运动特征向量初始化描述干扰对象运动变化的卡尔曼滤波器，完成对干扰对象轨道的初始化；

S2.10、如果目标轨道匹配成功，则跳转到步骤S3，以目标轨道所匹配候选对象包围框作为图像位置跟踪结果；如果目标轨道未匹配成功，并且距离其最近一次匹配成功间隔小于k帧，则跳转到步骤S3，以步骤S2.2中最高响应得分的候选对象包围框作为图像位置跟踪结果；如果目标轨道未匹配成功，并且距离其最近一次匹配成功间隔大于或等于k帧，则判断目标丢失，将目标跟踪从局部区域跟踪调整到全局目标重定位搜索；

S2.11、当四旋翼无人机接收到新的图像帧时，基于滑动窗口机制产生覆盖完整图像的重定位搜索区域集合；输入所有重定位搜索区域到孪生网络跟踪器，用于提取候选包围框，同时获得候选包围框的响应得分；基于非极大值抑制、预设的重叠率阈值t₇和预设的孪生网络跟踪器响应得分阈值t₀，丢弃过滤重叠率高于阈值t₇的冗余包围框和响应得分低于阈值t₀的低质量包围框，得到全局图像的候选对象包围框；

S2.12、基于深度目标验证器对步骤S2.11得到的全局图像的候选对象包围框提取深度嵌入表观特征向量；

根据全局图像的候选对象包围框的深度嵌入表观特征向量和目标轨道的历史表观特征向量池，利用余弦距离计算两者之间的表观代价；根据全局图像的候选对象包围框的深度嵌入表观特征向量和初始目标包围框区域的深度嵌入表观特征向量F₀，利用余弦距离计算它们之间的初始表观代价；通过计算表观代价和初始表观代价的加权和，得到全局图像的候选对象包围框与目标轨道的全局搜索表观代价；

根据全局图像的不同候选对象包围框与目标轨道的全局搜索表观代价，获取最小全局搜索表观代价；若最小全局搜索表观代价低于全局搜索匹配阈值t₅，则判断目标轨道被重新成功匹配，跳转回步骤S2.2，并且以最小全局搜索表观代价所对应的候选对象包围框作为图像位置跟踪结果，否则跳转步骤S2.11。

进一步地，步骤S2.1中，深度目标验证器是离线预训练的残差神经网络，其作用是通过特征嵌入将不同包围框映射到同一个距离空间，提取目标包围框的深度嵌入表观特征向量，用于计算不同图像块之间的相似度；深度目标验证器的构建具体包括以下步骤：

S2.1.1、选择网络结构和损失函数：

使用ResNet50作为目标验证网络的骨干网络，并且在骨干网络后接上128 维输出的全连接层构成目标验证网络；使用余弦距离衡量特征相似度，以三元组损失作为损失函数；

S2.1.2、三元组训练样本的生成：

使用ImageNet DET和VID数据集作为训练数据集，基于以下操作生成三元组训练样本：

S2.1.2.1、随机从训练数据集中选择一个视频，选择其初始的目标块作为锚；

S2.1.2.2、随机的在视频中选择一帧作为正样本；

S2.1.2.3、随机从属于不同目标类的视频中选择一帧作为负样本；

S2.1.3、训练策略：

使用ImageNet的权重来对目标验证网络的骨干网络进行初始化；在 ImageNetDET和VID数据集上随机生成三元组训练样本，并基于该训练样本使用随机梯度下降对目标验证网络进行端到端训练；联合孪生网络跟踪器和初步训练的目标验证网络模型，在ImageNet DET和VID数据集上进行跟踪和验证，将验证有误的样本收集到困难样本数据集；根据困难样本数据集，在ImageNet DET、VID数据集上重新生成包括困难样本的三元组训练样本，并基于该训练样本使用随机梯度下降对现有目标验证网络模型进行再次训练，得到深度目标验证器。

进一步地，步骤S3具体包括以下步骤：

S3.1、通过单目测距原理和三角相似方法，利用目标的图像位置和尺度、步骤S1所得目标的身高h，解算目标在相机坐标系下的位置坐标；获取四旋翼无人机在地理坐标系下的位置坐标和姿态；

S3.2、根据步骤S3.1所得目标和四旋翼无人机的位置坐标，利用卡尔曼滤波估计目标在地理坐标系下的位置坐标和速度；根据目标的运动学模型以及当前时刻目标状态，利用卡尔曼滤波预测目标在未来N步时间的运动状态。

进一步地，步骤S3.2中，利用卡尔曼滤波估计目标在地理坐标系下的位置坐标和速度，具体包括以下步骤：

S3.2.1、对目标进行运动学模型建模：

以目标的位置、速度以及转弯率作为状态量，建立目标的匀转弯率运动学模型；

S3.2.2、对目标进行测量模型建模：

以目标在相机坐标系下的位置坐标作为观测量，根据相机坐标系与地理坐标系的转换关系，以及四旋翼无人机在地理坐标系下的位置坐标，建立观测量与状态量之间的测量模型；

S3.2.3、根据步骤S3.2.1和步骤S3.2.2所建立的运动学模型和测量模型，利用当前时刻目标的观测量对目标状态进行卡尔曼滤波估计，更新目标状态和状态协方差矩阵，得到目标在地理坐标系下的位置坐标和速度。

进一步地，步骤S4具体包括以下步骤：

S4.1、根据目标在未来N步时间的运动状态，结合优化目标和约束条件，运行基于模型预测控制的最优控制序列计算方法，得到未来N步时间的四旋翼无人机最优控制序列；

S4.2、将步骤S4.1所得到的最优控制序列的前e步作为四旋翼无人机底层速度控制器的输入，控制四旋翼无人机保距追踪目标；

S4.3、根据目标和四旋翼无人机在地理坐标系下的位置坐标，计算四旋翼无人机的期望滚动角，以期望滚动角作为四旋翼无人机底层姿态控制器的输入，控制四旋翼无人机相机对准目标，使目标保持在相机图像的中心；

S4.4、若跟踪任务没有结束，返回步骤S2.2。

进一步地，步骤S4.1中，所述基于模型预测控制的最优控制序列计算方法具体包括以下步骤：

S4.1.1、假设四旋翼无人机主动追踪目标的优化目标包括：

优化目标1：与目标保持一个期望距离；

优化目标2：匹配四旋翼无人机与跟踪目标的速度；

优化目标3：平滑四旋翼无人机轨迹；

S4.1.2、假设四旋翼无人机主动追踪跟踪目标的约束条件为：

约束条件1：安全避障；

约束条件2：无人机性能约束；

约束条件3：边界约束；

S4.1.3、根据现有四旋翼无人机不可避免的定位误差，通过引入软约束变量到约束不等式，并且将软约束变量作为优化目标之一，将涉及四旋翼无人机位置坐标的硬约束转换为软约束；联合所有优化目标和约束条件，得到四旋翼无人机在N步未来时间下追踪目标的最优控制序列计算公式如下：

x(n+1)＝Ax(n)+Bu(n)

s.t.x-obs_i+l＞＝d_safe

x-obs_i-l＜＝-d_safe

x-x_j+l＞＝d_safe

x-x_j-l＜＝-d_safe

x_min＜＝x_i＜＝x_max

u_min＜＝u_i＜＝u_max

0＜＝l＜＝l_max

其中，优化函数J的右一项表示优化目标1，右二项表示优化目标2，右三项表示优化目标3，右四项表示软约束参数优化目标；x和u分别表示四旋翼无人机在地理坐标系下的位置和速度控制量；d_p表示四旋翼无人机与目标的距离； d_r表示期望距离；d_safe表示安全距离；u_t表示目标的运动速度；l代表软约束量； w代表优化目标的权值；obs代表已知静态障碍物的位置；x_j代表其他四旋翼无人机的位置；

根据优化函数J及其约束项，利用ipopt优化器进行最优化计算，得到四旋翼无人机最优控制序列的解。

相比于现有技术，本发明的优点在于：

(1)本发明使用目标检测算法识别常见感兴趣物体类别，对于移动物体初始跟踪框的选取可以起到明显的辅助作用。

(2)本发明的基于深度关联度量的多轨道孪生网络目标跟踪方法具有多轨道跟踪、模板更新、目标验证以及跟踪恢复等特点，在保证算法实时性的基础上增加了目标识别的成功率和容错性，同时能够反映目标的丢失情况并且在目标丢失后进行全局目标重定位搜索，实现对目标的长时视觉目标跟踪，为目标的状态估计提供基本的保障。

(3)在目标的状态估计和状态预测上，对跟踪目标进行了运动模型和测量模型建模，使用卡尔曼滤波完成对目标的位置滤波和速度估计，并且预测得到目标在未来N步时间的运动状态，为四旋翼无人机最优控制序列的计算提供有效稳定的输入量。

在无人机跟踪控制方面，考虑到非合作目标规避跟踪的行为，本发明基于目标在未来N步时间的预测运动状态，计算未来N步时间的无人机最优控制序列，通过提前做出跟踪控制调整，减少无人机跟踪目标的滞后时间，提高无人机的主动性，减少非合作目标规避跟踪导致的跟踪失败。

附图说明：

图1是本发明实施例中基于主动视觉感知的四旋翼无人机目标跟踪方法的流程图；

图2是本发明实施例中基于深度关联度量的多轨道孪生网络目标跟踪流程图；

图3是本发明实施例中深度目标验证器的网络架构图；

图4是本发明实施例中估计和预测目标的运动状态的流程图；

图5是本发明实施例中最优控制序列计算以及跟踪控制的流程图。

具体实施方式：

下面结合附图对本开发方案做进一步的说明，以方便本领域的技术人员更好的理解本发明。需要注意的是，在以下描述中，当已知功能和设计的详细描述也许会淡化本发明的主要内容，这些描述在这里将被忽略。

实施例：

为了方便描述，先对具体实施方式中出现的相关专业术语进行说明：

Offboard：外部控制模式；

Yolov3：实时目标检测算法；

SiamRPN：孪生区域回归网络跟踪器；

CKF：卡尔曼滤波算法；

NMPC：模型预测控制方法；

在本实施例中，一种基于主动视觉感知的四旋翼无人机目标跟踪方法，如图 1所示，包括以下步骤：

S1、选择跟踪目标；

系统上电和初始化，调整四旋翼无人机的控制模式为offboard，控制四旋翼无人机竖直起飞到3.5m处，并且悬停，同时相机以50Hz的频率向地面站传输图像；

地面站计算机实时接收和显示四旋翼无人机回传的图像，本实施例中，运行Yolov3目标检测算法提取感兴趣目标的包围框，通过鼠标点击包围框的方式选择跟踪目标；若Yolov3目标检测算法提取感兴趣目标失败，则通过手动圈取的方式选择跟踪目标；根据四旋翼无人机的飞行高度和相机内参、目标的图像位置和大小，通过单目测距原理和三角相似方法计算目标身高h；

当四旋翼无人机接收到新的图像帧时，运行基于深度关联度量的多轨道孪生网络目标跟踪算法，获得目标的最新图像位置和尺度；

如图2所示，所述基于深度关联度量的多轨道孪生网络目标跟踪算法具体包括以下步骤：

S2.1、构建深度目标验证器，建立目标轨道，将目标轨道标记为已确认状态；将步骤S1选择的目标图像块缩放至128×128，以目标图像块为深度目标验证器的输入，提取初始目标包围框区域的深度嵌入表观特征向量F₀，并且以F₀初始化目标轨道的历史表观特征向量池，设置历史表观特征向量池的最大容量为 200个表观特征向量，并且在池满时以先进先出的方式更新；以初始目标包围框的中心坐标、面积以及长宽比作为目标的初始运动特征向量(x₀,y₀,s₀,a₀)，利用 (x₀,y₀,s₀,a₀)初始化描述目标运动变化的卡尔曼滤波器，完成对目标轨道的初始化；将步骤S1选择的目标图像块缩放至127×127，以此作为目标模板，完成对孪生网络跟踪器SiamRPN的初始化；

深度目标验证器的构建具体包括以下步骤：

S2.1.1、选择网络结构和损失函数：

使用ResNet50作为目标验证网络的骨干网络，并且在骨干网络后接上128 维输出的全连接层构成目标验证网络；使用余弦距离衡量特征相似度，以三元组损失作为损失函数，

L＝max(d(a,p)-d(a,n)+margin，0)； (1)

其中(a,p,n)为输入三重态训练样本到目标验证网络后得到输出特征。A代表锚的网络输出特征，p代表与a同类的正样本的网络输出特征，n是与a不同类的负样本的网络输出特征，margin为偏置值。最终的优化目标是拉近a与p的距离，拉远a与n的距离。

S2.1.2、三元组训练样本的生成：

S2.1.2.2、随机的在视频中选择一帧作为正样本；

S2.1.3、训练策略：

使用ImageNet的权重来对目标验证网络的骨干网络进行初始化；在 ImageNetDET和VID数据集上随机生成三元组训练样本，并基于该训练样本使用随机梯度下降对目标验证网络进行端到端训练，动量设置为0.9，批的大小为 64，训练周期为70，每个周期使用60000个三元组训练样本进行训练；学习率初始值设置为10^-2，每20个时期逐渐衰减1/10，得到初步训练的目标验证器网络模型；联合孪生网络跟踪器和初步训练的目标验证器网络模型，在ImageNet DET和VID数据集上进行目标跟踪验证，将目标验证有误的样本收集到困难样本数据集；根据困难样本数据集，在ImageNet DET、VID数据集上生成包括困难样本的三元组训练样本，并基于该训练样本使用随机梯度下降对现有目标验证网络模型进行再次训练，得到深度目标验证器。

S2.2、当四旋翼无人机接收到新的图像帧时，以上一帧的目标包围框区域(初始用S1选择的目标图像位置)为中心提取局部搜索区域S；局部搜索区域S的长宽为上一帧目标的图像尺度的1.5倍；将局部搜索区域S的图像块缩放至255 ×255，以此作为搜索图像输入到SiamRPN，利用SiamRPN提取多个候选包围框，同时获得候选包围框的响应得分；通过非极大值抑制和预设的重叠率阈值 t₇＝0.2和预设的孪生网络跟踪器响应得分阈值t₀＝0.85，过滤重叠率高于0.2的冗余包围框和响应得分低于0.85的低质量包围框，得到候选对象包围框；

S2.3、对步骤S2.2得到所有候选对象包围框的图像块缩放到128×128，基于深度目标验证器对候选对象包围框的图像块提取深度嵌入表观特征向量；根据候选对象包围框的中心坐标、面积以及长宽比提取候选对象包围框的运动特征向量；基于卡尔曼滤波器预测目标轨道的运动特征向量；若存在干扰对象轨道，基于卡尔曼滤波器预测所有干扰对象轨道的运动特征向量；

S2.4、将目标轨道或者匹配成功次数大于3的干扰对象轨道表示为已确认轨道，根据候选对象包围框的深度嵌入表观特征向量以及已确认轨道的历史表观特征向量池，利用余弦距离计算两者之间的表观代价；若表观代价高于预设的表观不匹配阈值t₁＝0.9，则判断候选对象包围框与对应的已确认轨道不匹配，将该表观代价修改为浮点类型的最大表示值；根据不同候选对象包围框与不同已确认轨道之间的表观代价，生成可用于关联匹配的表观代价矩阵；

根据候选对象包围框的运动特征向量以及已确认轨道的预测运动特征向量，利用Mahalanobis距离计算两者之间的几何代价；若几何代价高于预设的几何距离阈值t₂＝15，并且当其对应候选对象包围框与对应的已确认轨道之间的表观代价高于预设的表观可靠匹配阈值t₃＝0.2时，判断候选对象包围框与轨道不可匹配，修改该表观代价为浮点数的最大表示值；

S2.5、根据步骤S2.2中响应得分最高的候选对象包围框的深度嵌入表观特征向量以及初始目标包围框区域的深度嵌入表观特征向量F₀，利用余弦距离计算该候选对象包围框与目标轨道之间的初始表观代价，若初始表观代价低于预设的表观可靠匹配阈值t₃＝0.2，则判断该候选对象包围框与目标轨道成功匹配，更新匹配结果集，并且移除表观代价矩阵和几何代价矩阵中该候选对象包围框和目标轨道所在的行和列；

S2.7、将匹配成功次数小于等于3的干扰对象轨道表示为未确认干扰对象轨道，将所有未确认干扰对象轨道加入到未匹配轨道集；根据未匹配候选对象集中的未匹配候选对象包围框的运动特征向量和未匹配轨道集中的轨道的预测运动特征向量，计算两者之间的交并比(IOU)；根据不同未匹配候选对象包围框与未匹配轨道集中不同的轨道的IOU，生成IOU代价矩阵；基于匈牙利匹配方法，利用IOU代价矩阵对未匹配候选对象集和未匹配轨道集中的元素进行第二次二部图匹配，更新匹配结果集、未匹配候选对象集和未匹配轨道集；

S2.8、遍历匹配结果集，利用匹配结果中的候选对象包围框的运动特征向量更新所匹配轨道的卡尔曼滤波参数，如果该匹配结果的表观代价低于预设的历史表观特征向量池更新阈值t₄＝0.3，则利用候选对象包围框的表观特征向量更新所匹配轨道的历史表观特征向量池，并且在池满时基于先进先出的原则丢失旧特征向量，如果所匹配轨道是未确认干扰对象轨道，并且其匹配成功次数大于3，则将该干扰对象轨道标记为已确认状态；

S2.9、遍历未匹配轨道集，如果是干扰对象轨道，并且距离其最近一次匹配成功的间隔大于50帧，则删除该干扰对象轨道；

遍历未匹配候选对象集，为每一个未匹配候选对象包围框新建单独的干扰对象轨道，并且利用未匹配候选对象包围框的深度嵌入表观特征向量初始化对应干扰对象轨道的历史表观特征向量池，设置其历史表观特征向量池的最大容量为200个表观特征向量，并且在池满时以先进先出的方式更新，利用未匹配候选对象包围框的运动特征向量初始化描述干扰对象运动变化的卡尔曼滤波器，完成对干扰对象轨道的初始化；

S2.10、如果目标轨道匹配成功，则跳转到步骤S3，以目标轨道所匹配候选对象包围框作为图像位置跟踪结果；如果目标轨道未匹配成功，并且距离其最近一次匹配成功间隔小于20帧，则跳转到步骤S3，以步骤S2.2中最高响应得分的候选对象包围框作为图像位置跟踪结果；如果目标轨道未匹配成功，并且距离其最近一次匹配成功间隔大于或等于20帧，则判断目标丢失，将目标跟踪从局部区域跟踪调整到全局目标重定位搜索；

S2.11、当四旋翼无人机接收到新的图像帧时，基于滑动窗口机制产生覆盖完整图像的重定位搜索区域集合；输入所有重定位搜索区域到孪生网络跟踪器，用于提取候选包围框，同时获得候选包围框的响应得分；基于非极大值抑制和预设的重叠率阈值t₇＝0.2和预设的孪生网络跟踪器响应得分阈值t₀＝0.85，丢弃重叠率高于0.2的冗余包围框和响应得分低于0.85的低质量包围框，得到全局图像的候选对象包围框；

根据全局图像的不同候选对象包围框与目标轨道的全局搜索表观代价，获取最小全局搜索表观代价；若最小全局搜索表观代价低于全局搜索匹配阈值 t₅＝0.8，则判断目标轨道被重新成功匹配，跳转回步骤S2.2，并且以最小全局搜索表观代价所对应的候选对象包围框作为图像位置跟踪结果，否则跳转步骤 S2.11。

S3、估计和预测目标的运动状态，如图4所示，具体包括以下步骤：

S3.2、根据步骤S3.1所得目标和四旋翼无人机的位置坐标，利用卡尔曼滤波估计目标在地理坐标系下的位置坐标和速度；根据目标的运动学模型以及当前时刻目标状态，利用卡尔曼滤波预测目标在未来N步时间的运动状态，本实施例中，假设无人机在地理坐标系z轴的高度不变，估计目标在地理坐标系下的位置(x,y,z)和速度

具体包括以下步骤：

S3.2.1、对目标进行运动学模型建模：

以目标的位置、速度以及转弯率作为目标的状态量，建立目标的匀转弯率运动学模型：

其中x表示目标的状态量；Ω表示转弯率；T表示时间步长,为当前帧与上一帧时间差；v表示过程噪声向量，其协方差矩阵为Q，具体形式为：

S3.2.2、对目标进行测量模型建模：

以目标在相机坐标系下的位置坐标(x_c,y_c,z_c)作为观测量，根据相机坐标系与地理坐标系的转换关系，以及四旋翼无人机在地理坐标系下的位置坐标(x_ch,y_ch,z_ch)，建立观测量与状态量之间的测量模型：

其中，R_c代表相机坐标系到机身坐标系的旋转变换矩阵；R_w代表机身坐标系到地理坐标系的旋转变换矩阵；ε_t表示测量噪声向量，B_t表示测量噪声协方差矩阵，具体形式为：

其中，ε_x,ε_y,ε_z分别代表目标的观测量在x,y,z方向的误差波动幅度，通过实验获得；

S4、计算未来N步时间的最优控制序列，控制四旋翼无人机保距跟踪目标以及相机对准目标，如图5所示，具体包括以下步骤：

S4.1、四旋翼无人机根据S3得到目标在未来N步时间的运动状态，结合优化目标和约束条件，运行基于NMPC的最优控制计算方法，得到未来N步时间的四旋翼无人机最优控制序列[u₀,u₁...,u_n-1]，具体包括以下步骤：

S4.1.1、假设四旋翼无人机主动追踪目标的优化目标包括：

优化目标1：与目标保持一个期望距离；

优化目标2：匹配四旋翼无人机与跟踪目标的速度；

优化目标3：平滑四旋翼无人机轨迹；

S4.1.2、假设四旋翼无人机主动追踪跟踪目标的约束条件为：

约束条件1：安全避障；

约束条件2：无人机性能约束；

约束条件3：边界约束；

x(n+1)＝Ax(n)+Bu(n)

以公式(4)为NMPC的优化代价函数和约束，利用ipopt优化器进行最优化计算，得到四旋翼无人机最优控制序列的解。

S4.2、所得到的最优控制序列的u₀,u₁,u₂作为四旋翼无人机底层速度控制器的连续3个时间步输入，控制四旋翼无人机保距追踪目标；

S4.3、根据目标和四旋翼无人机在地理坐标系下的位置坐标，计算四旋翼无人机的期望yaw角，以期望yaw角作为四旋翼无人机底层yaw角PID控制器的输入，控制四旋翼无人机的相机对准目标，使目标保持在相机图像的中心；

S4.4、若跟踪任务没有结束，返回步骤S2.2。

本发明通过计算未来N步时间的四旋翼无人机最优控制序列，主动做出及时的跟踪控制调整，控制四旋翼无人机保距跟踪目标以及相机对准目标，实现四旋翼无人机主动跟踪目标。

尽管上面对本发明说明性的具体实施方式进行了描述，以便于本技术领域的技术人员理解本发明。但需要进一步说明，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求书限定和确定的本发明精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

Claims

1.一种基于主动视觉感知的四旋翼无人机目标跟踪方法，其特征在于，包括以下步骤：

S1、选择跟踪目标；

S3、估计和预测目标的运动状态；

2.根据权利要求1所述的一种基于主动视觉感知的四旋翼无人机目标跟踪方法，其特征在于，步骤S1中，地面站计算机在线接收和显示四旋翼无人机回传的图像，运行目标检测算法或者人工选择跟踪目标，得到初始目标包围框区域；

3.根据权利要求1所述的一种基于主动视觉感知的四旋翼无人机目标跟踪方法，其特征在于，步骤S2中，当四旋翼无人机接收到新的图像帧时，运行基于深度关联度量的多轨道孪生网络目标跟踪算法，获得目标的最新图像位置和尺度；

4.根据权利要求3所述的一种基于主动视觉感知的四旋翼无人机目标跟踪方法，其特征在于，步骤S2中，所述基于深度关联度量的多轨道孪生网络目标跟踪算法具体包括以下步骤：

S2.3、基于深度目标验证器对步骤S2.2所得到的候选对象包围框提取深度嵌入表观特征向量；基于候选对象包围框的位置和尺度提取候选对象包围框的运动特征向量；基于卡尔曼滤波器预测目标轨道的运动特征向量；若存在干扰对象轨道，则基于卡尔曼滤波器预测所有干扰对象轨道的运动特征向量；

5.根据权利要求4所述的一种基于主动视觉感知的四旋翼无人机目标跟踪方法，其特征在于，步骤S2.1中，深度目标验证器是离线预训练的残差神经网络，其作用是通过特征嵌入将不同包围框映射到同一个距离空间，提取目标包围框的深度嵌入表观特征向量，用于计算不同图像块之间的相似度。

6.根据权利要求5所述的一种基于主动视觉感知的四旋翼无人机目标跟踪方法，其特征在于，深度目标验证器的构建具体包括以下步骤：

S2.1.1、选择网络结构和损失函数：

使用ResNet50作为目标验证网络的骨干网络，并且在骨干网络后接上128维输出的全连接层构成目标验证网络；使用余弦距离衡量特征相似度，以三元组损失作为损失函数；

S2.1.2、三元组训练样本的生成：

S2.1.2.2、随机的在视频中选择一帧作为正样本；

S2.1.3、训练策略：

使用ImageNet的权重来对目标验证网络的骨干网络进行初始化；在ImageNet DET和VID数据集上随机生成三元组训练样本，并基于该训练样本使用随机梯度下降对目标验证网络进行端到端训练；联合孪生网络跟踪器和初步训练的目标验证网络模型，在ImageNetDET和VID数据集上进行跟踪和验证，将验证有误的样本收集到困难样本数据集；根据困难样本数据集，在ImageNet DET、VID数据集上重新生成包括困难样本的三元组训练样本，并基于该训练样本使用随机梯度下降对现有目标验证网络模型进行再次训练，得到深度目标验证器。

7.根据权利要求4所述的一种基于主动视觉感知的四旋翼无人机目标跟踪方法，其特征在于，步骤S3具体包括以下步骤：

8.根据权利要求7所述的一种基于主动视觉感知的四旋翼无人机目标跟踪方法，其特征在于，步骤S3.2中，利用卡尔曼滤波估计目标在地理坐标系下的位置坐标和速度，具体包括以下步骤：

S3.2.1、对目标进行运动学模型建模：

S3.2.2、对目标进行测量模型建模：

9.根据权利要求8所述的一种基于主动视觉感知的四旋翼无人机目标跟踪方法，其特征在于，步骤S4具体包括以下步骤：

S4.4、若跟踪任务没有结束，返回步骤S2.2。

10.根据权利要求9所述的一种基于主动视觉感知的四旋翼无人机目标跟踪方法，其特征在于，步骤S4.1中，所述基于模型预测控制的最优控制序列计算方法具体包括以下步骤：

S4.1.1、假设四旋翼无人机主动追踪目标的优化目标包括：

优化目标1：与目标保持一个期望距离；

优化目标2：匹配四旋翼无人机与跟踪目标的速度；

优化目标3：平滑四旋翼无人机轨迹；

S4.1.2、假设四旋翼无人机主动追踪跟踪目标的约束条件为：

约束条件1：安全避障；

约束条件2：无人机性能约束；

约束条件3：边界约束；

x(n+1)＝Ax(n)+Bu(n)

s.t.x-obs_i+l＞＝d_safe

x-obs_i-l＜＝-d_safe

x-x_j+l＞＝d_safe

x-x_j-l＜＝-d_safe

x_min＜＝x_i＜＝x_max

u_min＜＝u_i＜＝u_max

0＜＝l＜＝l_max

其中，优化函数J的右一项表示优化目标1，右二项表示优化目标2，右三项表示优化目标3，右四项表示软约束参数优化目标；x和u分别表示四旋翼无人机在地理坐标系下的位置和速度控制量；d_p表示四旋翼无人机与目标的距离；d_r表示期望距离；d_safe表示安全距离；u_t表示目标的运动速度；l代表软约束量；w代表优化目标的权值；obs代表已知静态障碍物的位置；x_j代表其他四旋翼无人机的位置；