CN109491241B - 一种针对机动目标的无人机鲁棒化跟踪方法 - Google Patents

一种针对机动目标的无人机鲁棒化跟踪方法 Download PDF

Info

Publication number
CN109491241B
CN109491241B CN201811309958.3A CN201811309958A CN109491241B CN 109491241 B CN109491241 B CN 109491241B CN 201811309958 A CN201811309958 A CN 201811309958A CN 109491241 B CN109491241 B CN 109491241B
Authority
CN
China
Prior art keywords
model
target
distribution
student
observation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811309958.3A
Other languages
English (en)
Other versions
CN109491241A (zh
Inventor
沈忱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Gongshang University
Original Assignee
Zhejiang Gongshang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Gongshang University filed Critical Zhejiang Gongshang University
Priority to CN201811309958.3A priority Critical patent/CN109491241B/zh
Publication of CN109491241A publication Critical patent/CN109491241A/zh
Application granted granted Critical
Publication of CN109491241B publication Critical patent/CN109491241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/0275Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using fuzzy logic only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Remote Sensing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Aiming, Guidance, Guns With A Light Source, Armor, Camouflage, And Targets (AREA)

Abstract

本发明公开了一种针对机动目标的无人机(UAV)鲁棒化跟踪方法,不仅适合UAV跟踪具有机动行为的目标,而且适用于伴有目标状态突变、观测环境复杂等对目标跟踪鲁棒性有较高要求的场合。该方法利用跳变马尔可夫模型对机动目标的多模型切换进行描述,对过程噪声、观测噪声以及系统状态均以具有重尾特性的学生t分布进行建模,以消除状态突变或观测异常带来的影响。在交互式多模型框架下,先对具有学生t分布形式的模型概率密度函数进行交互处理,再以学生t分布函数为基础进行广义非线性滤波设计,该滤波算法可使每个子模型都能获得鲁棒化的估计结果,最后利用更新的模型概率将各个子模型的估计结果进行融合从而获得最终的目标状态估计。

Description

一种针对机动目标的无人机鲁棒化跟踪方法
技术领域
本发明涉及一种鲁棒化的机动目标跟踪方法,属于联合递推贝叶斯估计理论和多源信息融合理论以增强无人机进行机动目标跟踪鲁棒性的技术领域。
背景技术
无人机(Unmanned Aerial Vehicle,UAV)是一种在无载人驾驶情况下由自身动力系统驱动、以自主或受遥控方式完成特定动作与任务的飞行器。UAV不仅在地形侦察、情报搜集、目标打击等军用领域大显身手,而且在地理测绘、防火监视、搜索救援等民用领域也广泛存在。随着材料科技、制造技术和计算机技术、通信技术等的迅速发展,UAV本身也逐渐趋于微型化、轻量化、低成本和低噪声。总体来讲,UAV的应用类型大致可划分为监视型、打击型和通信型,在大多数这三类属性的应用场合中,UAV的任务都包含了目标跟踪这一关键环节,这一环节执行的效果好坏对后续的计算机系统的决策和飞行器任务的执行都有着较大的影响。
从本质上看,UAV进行目标跟踪可以看作是一种移动传感器对目标的跟踪行为。一方面,区别于静态传感器进行的目标跟踪(被动型),UAV目标跟踪属于一种主动型目标跟踪,在跟踪方式的强度上要大大提升;另一方面,大多数静态传感器的目标跟踪单独存在,而UAV目标跟踪则通常是UAV整体任务的一个环节,它对跟踪就要求有更好的性能以维持整个系统的良好状态。
由于UAV出现的初衷是为了避免人力浪费和保障人生安全,因此大部分UAV进行目标跟踪常在复杂环境和约束条件下进行,这就要求其计算中心对实时信息的处理应具有更好的鲁棒性,以应对系统本身或观测过程中的突发情况和各类扰动。首先对UAV配备的传感器装置而言,无论是具有逃逸策略的目标的电子对抗,还是恶劣天气抑或是复杂地形对无线电传播的干扰,都会使UAV的传感器所探测到的观测信息的可靠性大大降低。其次,对UAV本身系统而言,由于UAV的飞行器属性,它自身便具有爬升、旋转、俯冲等强机动行为,这些潜在机动行为不仅会使配备的陀螺仪的输出误差随角速率的巨大变化而增大,进而给整个惯性系统的定位估计带来较大误差,同时会对机载传感器的量测过程造成较大干扰。再者,对目标而言,当被跟踪目标同样是飞行器,或者当地面灵活目标觉察到被侦察时选择迅速逃逸,目标本身也会具有UAV的上述机动特性,这种机动性不仅会使计算中心对目标状态变迁服从高斯过程的假设失效,也会使计算中心内置默认的跟踪方法和目标的真实动力学特性出现模型失配现象,从而出现估计精度大幅度下滑,甚至发散以至于UAV完全不能跟踪目标。
发明内容
本发明针对UAV在复杂环境下进行单目标跟踪时所遇到的实际问题,公开了一种鲁棒化的机动目标跟踪方法。该发明建立了跳变马尔可夫模型以描述UAV进行机动目标跟踪时可能出现的模型失配问题,模型具有重尾非高斯属性的学生t分布替代传统高斯分布,以描述带有状态突变的目标系统过程和异常测量的UAV传感器的观测过程,在交互式多模型框架下,按照递推贝叶斯估计方法设计了基于学生t分布概率密度函数的子模型广义非线性滤波方法,最后将各个子模型的鲁棒化估计结果进行信息融合以得到机动目标的跟踪结果。
该方法包括以下几个核心步骤:
步骤一:建立UAV进行单机动目标跟踪时的学生t分布跳变马尔可夫模型;
步骤二:计算各个目标动力学子模型间的混合概率并基于学生t分布进行交互;
步骤三:对交互后的服从学生t分布的系统状态进行预测;
步骤四:对服从学生t分布的系统状态进行量测更新;
步骤五:基于学生t分布对子模型的模型概率进行更新;
步骤六:融合各个子模型的鲁棒估计结果并进行输出;
步骤七:再回到步骤三重新依次执行,直至目标跟踪结束。
进一步地,步骤一所述的学生t分布跳变马尔可夫模型包括系统状态转移方程xk=f(xk-1,rk)+wk-1(rk)和传感器观测方程zk=h(xk)+vk,其中下标k代表数据来源第k个离散采样时刻,zk为观测量,xk为目标状态变量,f(·)和h(·)分别为目标的系统函数和UAV的传感器观测函数,rk为模型变量;
用p(·)代表概率密度函数,Std(·)为学生t分布函数符号,过程噪声wk-1(rk)和观测噪声vk分别服从学生t分布,即p(wk-1(rk))=Std(wk|0,Qk-1(rk),υw)和p(vk)=Std(vk|0,Rkv),其中Qk-1(rk)和Rk分别为过程噪声和观测噪声的尺度化矩阵,υw和υv分别为过程噪声和观测噪声的自由度参数;
此外,认为任意第r个子模型的状态的k时刻模型先验(即k-1时刻的模型后验)概率密度函数
Figure BDA0001854650640000021
和k时刻模型后验概率密度函数p(xk|z1:k)=Std(xk|mk,Pk,υ)均为学生t分布函数,其中
Figure BDA0001854650640000022
和mk
Figure BDA0001854650640000023
和Pk、υr和υ分别为各自学生t分布的均值、尺度化矩阵和自由度参数。
进一步地,步骤二包含以下子步骤:
2.1计算混合概率
Figure BDA0001854650640000024
它代表k-1时刻子模型为模型r而k时刻为模型s的概率,可按下式计算:
Figure BDA0001854650640000025
其中πrs表征在k-1时刻到k时刻由模型r切换为模型s的概率,
Figure BDA0001854650640000031
为第r个子模型在k时刻的模型先验概率(即k-1时刻的模型后验概率),
Figure BDA0001854650640000032
为一个归一化常量;
2.2计算混合的学生t分布
Figure BDA0001854650640000033
的均值
Figure BDA0001854650640000034
尺度化矩阵
Figure BDA0001854650640000035
和自由度参数υ0s分别如下:
Figure BDA0001854650640000036
Figure BDA0001854650640000037
υ0s=υr (4)
进一步地,步骤三需要计算学生t分布
Figure BDA0001854650640000038
中均值的预测值
Figure BDA0001854650640000039
尺度化矩阵的预测值
Figure BDA00018546506400000310
和自由度参数的预测值υs,具体如下:
Figure BDA00018546506400000311
Figure BDA00018546506400000312
υs=υ0s (7)
进一步地,步骤四包含如下子步骤:
4.1计算第s个子模型的边缘化观测似然函数
Figure BDA00018546506400000313
的均值
Figure BDA00018546506400000314
自相关尺度化矩阵
Figure BDA00018546506400000315
和互相关尺度化矩阵
Figure BDA00018546506400000316
具体为:
Figure BDA00018546506400000317
Figure BDA00018546506400000318
Figure BDA00018546506400000319
4.2计算滤波增益
Figure BDA00018546506400000320
和自由度参数
Figure BDA00018546506400000321
Figure BDA00018546506400000322
Figure BDA00018546506400000323
4.3计算第s个子模型所对应的模型后验概率密度函数p(xk|rk=s,z1:k)的均值
Figure BDA00018546506400000324
和尺度化矩阵
Figure BDA00018546506400000325
分别如下:
Figure BDA00018546506400000331
Figure BDA00018546506400000326
4.4用矩信息匹配法优化均值
Figure BDA00018546506400000327
和尺度化矩阵
Figure BDA00018546506400000328
得到新的均值
Figure BDA00018546506400000329
和尺度化矩阵
Figure BDA00018546506400000330
分别如下:
Figure BDA0001854650640000041
Figure BDA0001854650640000042
进一步地,步骤五更新子模型的模型后验概率
Figure BDA0001854650640000043
Figure BDA0001854650640000044
其中,似然函数
Figure BDA0001854650640000045
的求取可通过计算第s个子模型的边缘化观测似然函数ps(zk|z1:k-1)得到,即只需计算
Figure BDA0001854650640000046
这一标准学生t分布概率密度函数。
进一步地,步骤六中,利用更新的模型后验概率
Figure BDA0001854650640000047
与步骤四中的均值
Figure BDA0001854650640000048
和尺度化矩阵
Figure BDA0001854650640000049
可以得到k时刻融合的均值mk和尺度化矩阵Pk如下:
Figure BDA00018546506400000410
Figure BDA00018546506400000411
本发明的有益效果是:
(1)解决UAV跟踪机动目标时存在的模型失配问题,使估计器在目标发生机动行为后依然能快速而准确地跟踪上目标;
(2)较好应对因目标状态突变、UAV观测异常等扰动引起的目标系统过程和传感器观测过程呈现的重尾非高斯特性问题,从而全面增强目标跟踪的鲁棒性;
(3)具有较好的一般性和可扩展性,可根据实际工作环境和适用情形进行适当修正,以得到特定条件下最优的跟踪方法,比如,目标有无机动行为可能、系统或观测模型非线性度的强弱、系统过程或观测过程发生突变或异常的可能性大小、多无人机或多目标等情形。
附图说明
图1是本发明方法的流程图。
图2是本发明中UAV进行目标跟踪的场景示意图。
图3是投影在x-y平面内的UAV目标跟踪效果图。
具体实施方式
下面将就具体实施对本发明作进一步的详细说明,方法整体流程可参考图1。
步骤一:建立UAV进行单机动目标跟踪时的学生t分布跳变马尔可夫模型;
图2描述了本发明的一个实施例的工作场景设置,具体参数的设定和场景的假设并不限于该图描述的设置,该图展示了UAV和运动目标在相邻两个采样时刻(k-1和k时刻)的空间位置信息情况。如图所示,一个UAV在建有x-y-z坐标系的立体空间中飞行并对运动目标进行跟踪,被跟踪目标为一个地面目标,可认为其纵向高度不发生变化且高度为0,即目标仅在x-y平面上进行运动,此时UAV也可保持在某一固定高度为H的平面上进行巡航和监视,无需发生纵向的位移。UAV机身配有图像传感器和激光测距仪分别进行目标的测向和测距,GPS模块和陀螺仪组合进行UAV自身的定位、测速和测姿,默认在进行目标跟踪前UAV精确已知自身在空间坐标系中的位置
Figure BDA0001854650640000051
下标k代表数据来源于第k个离散采样时刻,
Figure BDA0001854650640000052
分别代表UAV的x方向位置、y方向位置、z方向位置,其中z方向位置即UAV的高度
Figure BDA0001854650640000053
可认为恒定不变。定义任意k时刻目标的状态变量为列向量
Figure BDA0001854650640000054
目标状态维数n=6,其中
Figure BDA0001854650640000055
分别代表该时刻目标的x方向位置、y方向位置、x方向速度、y方向速度、x方向加速度、y方向加速度,此处默认目标z方向位置
Figure BDA0001854650640000056
z方向速度
Figure BDA0001854650640000057
z方向加速度
Figure BDA0001854650640000058
进而建立UAV跟踪机动目标的跳变马尔可夫模型如下:
xk=f(xk-1,rk)+wk-1(rk) (1)
Figure BDA0001854650640000059
(1)为目标状态转移方程,它引入了模型变量rk,rk为目标动力学模型编号,认为目标状态变化规律可在匀速模型、匀加速模型、协调转弯模型、当前统计模型四个模型之间自由切换,即rk在有限集合Δ={1,2,…,M}M=4中取任意值,其切换规律可由一个维数为M×M的转移概率矩阵Π=[πrs]M×M(r,s∈Δ)进行描述,矩阵中元素πrs=Pr(rk=s|rk-1=r)表征在k-1时刻到k时刻由模型r切换为模型s的概率,符号Pr表示事件发生的概率。本发明中rk未出现在传感器观测方程(2)中,原因是UAV的测向测距组合观测并不随目标运动模式的变化而发生改变,故可以将rk省去。f(·)为目标的系统函数,可以为任意运动目标的动力学函数,如前所述,本例限制其在匀速模型、匀加速模型、协调转弯模型、当前统计模型四个模型(模型数M=4)之中切换,zk为UAV获得的观测量,观测维数d=2,如(2)中所示,h(·)在本例的实施中为一个测距测向组合的观测函数,wk-1(rk)和vk分别是具有重尾非高斯属性的过程噪声和观测噪声,用学生t分布对它们进行建模:
p(wk-1(rk))=Std(wk|0,Qk-1(rk),υw) (3)
p(vk)=Std(vk|0,Rkv) (4)
式中,p(·)为对应变量的概率密度函数,Std(·)为学生t分布的符号,其中Qk-1(rk)和Rk分别为过程噪声和观测噪声的尺度化矩阵,υw和υv分别为过程噪声和观测噪声的自由度参数。自由度参数是学生t分布区别于高斯分布的重要特征之一,它控制了概率密度函数的峰态,因此可以描述因状态突变或观测异常等干扰导致的相关变量的概率密度函数呈现的重尾特性,这是高斯分布无法做到的。事实上,高斯分布是学生t分布在自由度参数趋于正无穷大时的一个特例。此外,为使后续表述方便,定义
Figure BDA0001854650640000061
进一步,由全概率公式可得k时刻目标状态的后验概率密度函数p(xk|z1:k):
Figure BDA0001854650640000062
其中z1:k表示从第1个采样时刻到第k时刻的所有观测量。
根据(3)和(4)的设定,不难看出每个子模型的后验概率密度函数p(xk|rk=s,z1:k)是一个学生t分布,因此p(xk|z1:k)可以看作是M个学生t分布的加权求和的结果,本发明用一个学生t分布Std(xk|mk,Pk,υ)来近似这一求和结果,即认为p(xk|z1:k)=Std(xk|mk,Pk,υ)。以下步骤将阐述如何求解目标状态后验概率密度函数p(xk|z1:k)。
步骤二:计算各个目标动力学子模型间的混合概率并基于学生t分布进行交互;
由(5)可以看出,随着目标跟踪的进行,模型个数M的存在会使p(xk|z1:k)的计算量呈指数增长,于是考虑在交互式多模型框架下解决此问题。若k-1时刻所选的模型rk-1=r(r∈Δ),则k时刻状态的模型先验概率密度函数p(xk-1|rk-1=r,z1:k-1)表示为:
Figure BDA0001854650640000063
将各个子模型的模型概率密度函数进行交互处理,得到模型rk=s(s∈Δ)的模型概率密度函数p(xk-1|rk=s,z1:k-1):
Figure BDA0001854650640000064
其中定义
Figure BDA0001854650640000065
为混合概率,它表征k-1时刻子模型为模型r而k时刻为模型s的概率,它可由贝叶斯公式计算得到:
Figure BDA0001854650640000066
上式中的分母
Figure BDA0001854650640000067
为一个归一化常量。
由(7)可以看出,p(xk-1|rk=s,z1:k-1)实际上相当于是M个学生t分布
Figure BDA0001854650640000068
的加权求和,为了方便近似计算,此处仅用一个学生t分布
Figure BDA0001854650640000069
来代替求和结果。为了尽可能保留原有M个学生t分布的信息,现用矩信息匹配法求取p(xk-1|rk=s,z1:k-1)。令
Figure BDA0001854650640000071
则混合后学生t分布的均值
Figure BDA0001854650640000072
和尺度矩阵
Figure BDA0001854650640000073
可计算如下:
Figure BDA0001854650640000074
Figure BDA0001854650640000075
混合后的学生t分布自由度参数υ0s仍然沿用混合前的各个子模型的自由度参数υr,即:
υ0s=υr (11)
步骤三:对交互后的服从学生t分布的系统状态进行预测;
利用(9)-(11)对混合后的系统状态进行预测,预测的概率密度函数p(xk|rk=s,z1:k-1)为:
Figure BDA0001854650640000076
其中,学生t分布
Figure BDA0001854650640000077
中均值的预测值
Figure BDA0001854650640000078
和尺度化矩阵的预测值
Figure BDA0001854650640000079
可分别计算如下:
Figure BDA00018546506400000710
Figure BDA00018546506400000711
上式(14)中自由度参数υ0s的预测值υs保持不变,即:
υs=υ0s (15)
步骤四:对服从学生t分布的系统状态进行量测更新;
根据递推贝叶斯估计公式,给出在k时刻获取观测量zk后模型s的模型后验概率密度函数p(xk|rk=s,z1:k):
Figure BDA00018546506400000712
为使后续表述简洁,给出同样服从学生t分布的模型s的边缘化观测似然函数
Figure BDA00018546506400000713
该学生t分布的均值
Figure BDA00018546506400000714
为:
Figure BDA00018546506400000715
自相关尺度化矩阵
Figure BDA00018546506400000716
为:
Figure BDA0001854650640000081
互相关尺度化矩阵
Figure BDA0001854650640000082
为:
Figure BDA0001854650640000083
经整理计算可得p(xk|rk=s,z1:k)的均值
Figure BDA0001854650640000084
Figure BDA0001854650640000085
p(xk|rk=s,z1:k)的尺度化矩阵
Figure BDA0001854650640000086
Figure BDA0001854650640000087
其中(21)中的滤波增益
Figure BDA0001854650640000088
Figure BDA0001854650640000089
自由度参数
Figure BDA00018546506400000810
Figure BDA00018546506400000811
其中,d为步骤一中给出的观测维数。注意(23)的更新法则会使自由度参数υs在每一个更新时刻递增,这样随着时间的推移和跟踪过程的进行,学生t分布就将失去它特有的重尾属性,从而失去对目标状态突变值或观测异常值等干扰的概率描述,进而影响跟踪方法的鲁棒性。为了保持跟踪方法较好的鲁棒性,自由度参数需处于一个相对较小的值。于是重新令
Figure BDA00018546506400000812
先用自由度参数υs代替
Figure BDA00018546506400000813
再利用矩信息匹配法优化均值
Figure BDA00018546506400000814
和尺度化矩阵
Figure BDA00018546506400000815
可得新的均值
Figure BDA00018546506400000816
和尺度化矩阵
Figure BDA00018546506400000817
Figure BDA00018546506400000818
Figure BDA00018546506400000819
步骤五:基于学生t分布对子模型的模型概率进行更新;
再次利用贝叶斯公式,得到更新的模型s的模型后验概率
Figure BDA00018546506400000820
Figure BDA00018546506400000821
其中,该式中的似然函数
Figure BDA00018546506400000822
就是模型s的边缘化观测似然函数ps(zk|z1:k-1),所以有:
Figure BDA00018546506400000823
要计算(27),只需将
Figure BDA0001854650640000091
υs代入学生t分布的概率密度函数表达式,具体如下:
Figure BDA0001854650640000092
其中Γ(·)为伽玛函数(Gamma Function),π为圆周率,|·|为行列式运算符。
步骤六:融合各个子模型的鲁棒估计结果并进行输出;
为得到(5)中p(xk|z1:k)=Std(xk|mk,Pk,υ)的最终融合估计结果,利用(29)和(30)分别融合在步骤四中得到的各个子模型估计的状态均值
Figure BDA0001854650640000093
和尺度化矩阵
Figure BDA0001854650640000094
融合后的状态均值mk和尺度化矩阵Pk分别为:
Figure BDA0001854650640000095
Figure BDA0001854650640000096
为保持较好的鲁棒性,融合后的自由度参数可取为各个子模型的自由度参数的最小值:
υ=min{υ12,…,υs,…,υM} (31)
其中min{·}为最小值符号函数。
步骤七:再回到步骤三重新依次执行,直至目标跟踪结束。
若还需继续跟踪目标,则令k=k+1进入下一采样时刻,回到步骤三并再依次顺序执行,反复以上过程直至目标跟踪结束。
需要指出的是,本发明具有较好的一般性和可扩展性。具体可解释如下:
1.可通过调节子模型个数M以获得更好的跟踪效果。若目标运动机动性和不可预测性较强,可增加M值以包含更多运动模型;若目标运动仅在固定运动模式切换,只需引入几个典型子模型即可。更特殊地,若目标确认无机动性,令M=1时,此时仅利用步骤三和步骤四便可以完成目标跟踪。
2.当目标系统函数f(·)和观测函数h(·)非线性程度较弱时,涉及非线性函数积分运算的(13)、(14)、(17)、(18)和(19)可用泰勒级数展开进行近似求取;当非线性程度较为强烈,可考虑采用UT变换、球面-相径容积规则等数值方法进行积分运算。
3.若单个UAV的观测方式发生变化,比如某一个时刻因故障或跟踪策略调整,只有测距信息而无测角信息,或者当有多个UAV协同工作进行某一机动目标的跟踪,但并非所有UAV都配有相同传感器而采用同一种观测方式,这些情形均可认为目标跟踪过程中还存在观测模型的切换问题,只需在(2)中对h(·)或vk添加对应的模型变量,联合目标运动的多模型一起构造马尔可夫链即可用本发明公开的方法进行后续跟踪处理。更特殊地,当目标为非机动目标时,只需考虑观测模型的切换而无需考虑目标运动的多模型。
本发明一个实施例的仿真效果见图3,该图为UAV跟踪机动目标在x-y平面上投影的轨迹图。UAV投影在x-y平面初始位置为(2000米,600米),机动目标始于x-y平面的(2000米,1000米)处。机动目标出发后不久先以10度/秒的角速度大幅度顺时针方向转动,后立即以10度/秒的角速度持续作逆时针方向转动。设定整个目标状态变化过程和UAV观测过程受到一定概率异常值的干扰。由图可见,面向非机动目标的鲁棒跟踪方法的轨迹曲线在目标发生第一次大幅度机动行为后便不能再跟踪上真实目标,轨迹随后处于发散状态,其跟踪性能也不再可靠,这个结果是由于模型失配问题导致的。面向机动目标的非鲁棒化跟踪方法相比面向非机动目标的鲁棒跟踪方法具有更高的可信度,它基本能跟踪上真实目标的运动轨迹,但它在目标发生机动行为时段的误差要明显大于本发明公开的目标跟踪方法,原因在于该方法设计并未考虑目标系统过程和观测过程中异常值对估计性能的影响,仅仅使用高斯分布进行设计会使跟踪方法鲁棒性变差。对照真实目标轨迹和本发明对应的轨迹,本发明公开的方法在全跟踪时段(包括目标发生机动行为的时间段)都能以相对较小的误差跟踪上真实目标,既能改善机动目标本身带来的模型失配问题,还具有较好的鲁棒性以应对系统过程和观测过程的异常发生,因此具有较为稳健和良好的跟踪效果。

Claims (1)

1.一种针对机动目标的无人机鲁棒化跟踪方法,其特征在于,包括以下几个步骤:
步骤一:建立UAV进行单机动目标跟踪时的学生t分布跳变马尔可夫模型,该模型包括系统状态转移方程xk=f(xk-1,rk)+wk-1(rk)和传感器观测方程zk=h(xk)+vk,其中下标k代表数据来源第k个离散采样时刻,zk为观测量,xk为目标状态变量,f(·)和h(·)分别为目标的系统函数和UAV的传感器观测函数,rk为模型变量;
用p(·)代表概率密度函数,Std(·)为学生t分布函数符号,过程噪声wk-1(rk)和观测噪声vk分别服从学生t分布,即p(wk-1(rk))=Std(wk|0,Qk-1(rk),υw)和p(vk)=Std(vk|0,Rkv),其中Qk-1(rk)和Rk分别为过程噪声和观测噪声的尺度化矩阵,υw和υv分别为过程噪声和观测噪声的自由度参数;认为任意第r个子模型的状态的k时刻模型先验概率密度函数
Figure FDA0003237702380000011
和k时刻模型后验概率密度函数p(xk|z1:k)=Std(xk|mk,Pk,υ)均为学生t分布函数,其中
Figure FDA0003237702380000012
和mk
Figure FDA0003237702380000013
和Pk、υr和υ分别为各自学生t分布的均值、尺度化矩阵和自由度参数;
步骤二:计算各个目标动力学子模型间的混合概率,它代表k-1时刻子模型为模型r而k时刻为模型s的概率,可按下式计算:
Figure FDA0003237702380000014
其中πrs表征在k-1时刻到k时刻由模型r切换为模型s的概率,
Figure FDA0003237702380000015
为第r个子模型在k时刻的模型先验概率,
Figure FDA0003237702380000016
为一个归一化常量;
基于学生t分布进行交互,计算混合的学生t分布
Figure FDA0003237702380000017
的均值
Figure FDA0003237702380000018
尺度化矩阵
Figure FDA0003237702380000019
和自由度参数υ0s分别如下:
Figure FDA00032377023800000110
Figure FDA00032377023800000111
υ0s=υr (4)
步骤三:对交互后的服从学生t分布的系统状态进行预测,计算学生t分布
Figure FDA00032377023800000112
中均值的预测值
Figure FDA00032377023800000113
尺度化矩阵的预测值
Figure FDA00032377023800000114
和自由度参数的预测值υs,具体如下:
Figure FDA00032377023800000115
Figure FDA0003237702380000021
υs=υ0s (7)
步骤四:对服从学生t分布的系统状态进行量测更新,具体包含如下子步骤:
4.1计算第s个子模型的边缘化观测似然函数
Figure FDA0003237702380000022
的均值
Figure FDA0003237702380000023
自相关尺度化矩阵
Figure FDA0003237702380000024
和互相关尺度化矩阵
Figure FDA0003237702380000025
具体为:
Figure FDA0003237702380000026
Figure FDA0003237702380000027
Figure FDA0003237702380000028
4.2计算滤波增益
Figure FDA0003237702380000029
和自由度参数
Figure FDA00032377023800000210
Figure FDA00032377023800000211
Figure FDA00032377023800000212
其中,d为观测量zk的维数;
4.3计算第s个子模型所对应的模型后验概率密度函数p(xk|rk=s,z1:k)的均值
Figure FDA00032377023800000213
和尺度化矩阵
Figure FDA00032377023800000214
具体为:
Figure FDA00032377023800000215
Figure FDA00032377023800000216
4.4用矩信息匹配法优化均值
Figure FDA00032377023800000217
和尺度化矩阵
Figure FDA00032377023800000218
得到新的均值
Figure FDA00032377023800000219
和尺度化矩阵
Figure FDA00032377023800000220
具体为:
Figure FDA00032377023800000221
Figure FDA00032377023800000222
步骤五:基于学生t分布更新子模型的模型后验概率
Figure FDA00032377023800000223
如下:
Figure FDA00032377023800000224
其中,似然函数
Figure FDA00032377023800000225
的求取可通过计算第s个子模型的边缘化观测似然函数ps(zk|z1:k-1)得到,即只需计算
Figure FDA00032377023800000226
这一标准学生t分布概率密度函数;
步骤六:利用更新的模型后验概率
Figure FDA00032377023800000227
与步骤四中的均值
Figure FDA00032377023800000228
和尺度化矩阵
Figure FDA00032377023800000229
融合各个子模型的鲁棒估计结果并进行输出,可以得到k时刻融合的均值mk和尺度化矩阵Pk如下:
Figure FDA0003237702380000031
Figure FDA0003237702380000032
步骤七:回到步骤二重新依次执行,直至目标跟踪结束。
CN201811309958.3A 2018-11-05 2018-11-05 一种针对机动目标的无人机鲁棒化跟踪方法 Active CN109491241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811309958.3A CN109491241B (zh) 2018-11-05 2018-11-05 一种针对机动目标的无人机鲁棒化跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811309958.3A CN109491241B (zh) 2018-11-05 2018-11-05 一种针对机动目标的无人机鲁棒化跟踪方法

Publications (2)

Publication Number Publication Date
CN109491241A CN109491241A (zh) 2019-03-19
CN109491241B true CN109491241B (zh) 2021-11-09

Family

ID=65693755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811309958.3A Active CN109491241B (zh) 2018-11-05 2018-11-05 一种针对机动目标的无人机鲁棒化跟踪方法

Country Status (1)

Country Link
CN (1) CN109491241B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110120066A (zh) * 2019-04-11 2019-08-13 上海交通大学 面向监视系统的鲁棒群目标跟踪方法及跟踪系统
CN111160667B (zh) * 2020-01-02 2023-05-30 北京工商大学 一种提高食品安全预测模型鲁棒性的方法及装置
CN112269401B (zh) * 2020-09-04 2021-07-20 河南大学 基于跟踪精度与风险控制的自适应主动传感器跟踪方法
CN116777008B (zh) * 2023-08-15 2023-11-10 北京航天晨信科技有限责任公司 面向无人飞行器逃逸预测建模的数据样本生成方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102749851A (zh) * 2012-07-24 2012-10-24 北京航空航天大学 一种挠性高超声速飞行器的精细抗干扰跟踪控制器
CN103853908A (zh) * 2012-12-04 2014-06-11 中国科学院沈阳自动化研究所 一种自适应交互式多模型的机动目标跟踪方法
CN106802570A (zh) * 2017-04-01 2017-06-06 广东工业大学 一种无人直升机位置跟踪的方法与装置
CN106886748A (zh) * 2016-12-28 2017-06-23 中国航天电子技术研究院 一种基于tld的适用于无人机的变尺度目标跟踪方法
CN108563128A (zh) * 2018-05-28 2018-09-21 浙江工业大学 基于指数增强型快速幂次趋近律和快速终端滑模面的四旋翼飞行器自适应控制方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180007847A1 (en) * 2016-07-11 2018-01-11 Darren Raj Automated Data-Based Irrigation System and Method
US10611474B2 (en) * 2017-03-20 2020-04-07 International Business Machines Corporation Unmanned aerial vehicle data management

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102749851A (zh) * 2012-07-24 2012-10-24 北京航空航天大学 一种挠性高超声速飞行器的精细抗干扰跟踪控制器
CN103853908A (zh) * 2012-12-04 2014-06-11 中国科学院沈阳自动化研究所 一种自适应交互式多模型的机动目标跟踪方法
CN106886748A (zh) * 2016-12-28 2017-06-23 中国航天电子技术研究院 一种基于tld的适用于无人机的变尺度目标跟踪方法
CN106802570A (zh) * 2017-04-01 2017-06-06 广东工业大学 一种无人直升机位置跟踪的方法与装置
CN108563128A (zh) * 2018-05-28 2018-09-21 浙江工业大学 基于指数增强型快速幂次趋近律和快速终端滑模面的四旋翼飞行器自适应控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A Robust Particle Filtering Algorithm With Non-Gaussian Measurement Noise Using Student-t Distribution;dingjie xu;《IEEE Signal Processing Letters 》;20131107;page 30-35 *

Also Published As

Publication number Publication date
CN109491241A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN109491241B (zh) 一种针对机动目标的无人机鲁棒化跟踪方法
Lee et al. Ensemble bayesian decision making with redundant deep perceptual control policies
CN112034887A (zh) 无人机躲避柱状障碍物到达目标点的最优路径训练方法
CN113848974B (zh) 一种基于深度强化学习的飞行器轨迹规划方法及系统
Ma et al. Adaptive vision-based guidance law with guaranteed performance bounds
Wang et al. Robust navigation for racing drones based on imitation learning and modularization
Or et al. Adaptive step size learning with applications to velocity aided inertial navigation system
Kang et al. Finite-memory-structured online training algorithm for system identification of unmanned aerial vehicles with neural networks
CN114326810A (zh) 一种无人机在复杂动态环境下的避障方法
Zheng et al. CS-BRM: A Probabilistic RoadMap for Consistent Belief Space Planning With Reachability Guarantees
Jacinto et al. Navigation of autonomous vehicles using reinforcement learning with generalized advantage estimation
Baek et al. Optimal sensor management for multiple target tracking using cooperative unmanned aerial vehicles
Liu et al. Cooperative localization of imu-based UAV using relative observation by EKF
Pacis et al. Enhancing functionality and autonomy in man-portable robots
Zhu et al. UAV trajectory tracking via RNN-enhanced IMM-KF with ADS-B data
Ryan Information-theoretic tracking control based on particle filter estimate
Deilamsalehy et al. Fuzzy adaptive extended Kalman filter for robot 3D pose estimation
Kumaar et al. A scalable tree based path planning for a service robot
Sharma Fuzzy Q learning based UAV autopilot
EP3797939B1 (en) Control command based adaptive system and method for estimating motion parameters of differential drive vehicles
Aspragkathos et al. Event-triggered image moments predictive control for tracking evolving features using UAVs
Liu et al. A review of multisensor information fusion technology
Lu et al. LPNet: A reaction-based local planner for autonomous collision avoidance using imitation learning
Kramer et al. Adaptation for evidence accrual applied to uas impact assessment
Dai et al. Unmanned ground vehicle‐unmanned aerial vehicle relative navigation robust adaptive localization algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant