CN112161626A - 一种基于航路跟踪映射网络的高可飞性航路规划方法 - Google Patents

一种基于航路跟踪映射网络的高可飞性航路规划方法 Download PDF

Info

Publication number
CN112161626A
CN112161626A CN202010995619.6A CN202010995619A CN112161626A CN 112161626 A CN112161626 A CN 112161626A CN 202010995619 A CN202010995619 A CN 202010995619A CN 112161626 A CN112161626 A CN 112161626A
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
route
predicted
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010995619.6A
Other languages
English (en)
Other versions
CN112161626B (zh
Inventor
王宏伦
刘一恒
李娜
伦岳斌
温甲赟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202010995619.6A priority Critical patent/CN112161626B/zh
Publication of CN112161626A publication Critical patent/CN112161626A/zh
Application granted granted Critical
Publication of CN112161626B publication Critical patent/CN112161626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明提供了一种基于航路跟踪映射网络的高可飞性航路规划方法,属于无人机导航制导与控制技术领域,具体为:利用无人机六自由度运动模型与航路跟踪控制器结合构成闭环运动控制模型,并输入随机规划航路和随机状态,输出对应的预测状态和预测航迹,将当前无人机规划航路和状态按时间顺序排列成二维数据,逐个输入到TMN中,得到各输出与各输入对应的预测状态和预测航迹的偏差值,利用反向传播更新TMN。然后,建立总代价函数;在MPC框架下规划出n条随机航路输入TMN中,预测出飞行航迹和飞行状态,并代入总代价函数,得到最优的规划航路,飞控系统跟踪最优规划航路,显示的同时记录无人机实际的飞行航迹和飞行状态参数,提升了飞行航迹预测能力。

Description

一种基于航路跟踪映射网络的高可飞性航路规划方法
技术领域
本发明属于无人机导航制导与控制技术领域,具体涉及一种基于航路跟踪映射网络的高可飞性航路规划方法。
背景技术
无人机航路规划是指在特定环境下,结合地图信息和各种约束条件,找到从任务出发点到任务结束点的最符合要求的无人机飞行路径。航路规划不仅需要尽可能实现任务代价最优,同时规划出的航路可飞性也十分重要。航路规划的可飞性代表了无人机对所规划航路跟踪的可行性以及准确程度,是无人机航路规划领域的一个重要问题。高可飞性的航路规划对于某些高精度任务具有重要意义,例如密集区域避障、自主空中加油对接和精确编队等。
目前现有文献的航路规划方法大多只考虑具有运动学约束(如最大爬升角、最小转弯半径等)的无人机简化模型,未充分考虑到实际无人机的动力学约束以及航路跟踪控制系统的跟踪特性,使得规划航路与实际飞行航迹之间存在较大的跟踪误差。为提高所规划航路对于实际无人机的可飞性,一个行之有效的方法是在规划时采用由无人机六自由度运动模型和航路跟踪控制器组成的闭环系统模型。但是该闭环系统模型由12个非线性微分方程和包括传感器、控制器和执行器构成的飞控系统模型组成,方程复杂,计算量大,会严重影响航路规划的效率。
近年来,随着新一代人工智能技术的发展,深度学习所展现的强大的非线性表达能力,为复杂非线性问题的解决提供了可能。利用深度学习网络通过离线训练来充分表征无人机六自由度运动模型和航路跟踪控制器组成的闭环系统特性,并在航路规划器中在线使用,为解决上述问题提供了有效途径。
发明内容
针对现有航路规划方法中可飞性偏低的问题,本发明提出了一种基于航路跟踪映射网络的高可飞性航路规划方法,充分考虑了无人机的运动学、动力学和航路跟踪控制系统特性,可以大幅提高规划航路的可飞性和其他性能,保障飞行安全,并兼具智能性、再学习和规划效率高的特点,对于无人系统安全可飞路径规划具有重要意义。
所述的基于航路跟踪映射网络的高可飞性航路规划方法,具体包括如下步骤:
步骤一、建立无人机六自由度运动模型,将该模型与无人机的航路跟踪控制器结合构成无人机闭环运动控制模型。
首先,建立航路跟踪控制器模型,如下:
uc=fC(Tc,S)
其中fC代表航路跟踪控制器控制律,Tc为指令路径,S为无人机状态:
S=[X Y Z V χ γ α β μ p q r]
X,Y,Z分别为无人机在惯性系下的横、纵和垂三维位置坐标,V为无人机的航迹速度;χ为无人机的航迹偏角,γ是无人机的航迹倾角;p,q,r是无人机体坐标下的横、纵和垂三轴角速度;α是无人机坐标系下的迎角、β是无人机坐标系下的侧滑角和μ是无人机坐标系下的航迹滚转角。
然后,建立含风扰的无人机运动模型,简化为:
Figure BDA0002692508250000021
fM代表无人机模型,u为控制输入,w为风扰动;
最后,建立无人机闭环系统控制模型;
无人机下一个仿真步长的状态
Figure BDA0002692508250000022
为:
Figure BDA0002692508250000023
fU代表无人机闭环系统模型。
步骤二、通过航路生成器产生大量随机规划航路,在无人机运动约束范围内设置随机无人机状态,将每一条规划航路和无人机状态分别输入到无人机闭环系统模型,输出对应的预测状态和预测航迹并记录;
将每一条输入的规划航路和无人机状态,以及对应输出的预测状态和预测航迹,构成一对数据进行记录和存储。
步骤三、将当前无人机规划航路和状态按时间顺序排列成二维数据,逐个输入到TMN网络中,得到各输入对应的输出,将各输出与各输入对应的预测状态和预测航迹进行对比,得到预测状态偏差和预测航迹的偏差,利用反向传播更新TMN网络参数。
TMN网络是指航路跟踪映射网络,在现有的卷积神经网络的基础上添加了时间特征形成的。
具体步骤如下:
步骤301、将每个无人机状态,和各自对应的规划航路和实际航迹的偏差合并为各自对应的一维向量;
一维向量表示为:
Figure BDA0002692508250000024
航迹偏角的偏差为
Figure BDA0002692508250000025
航迹倾角的偏差为
Figure BDA0002692508250000026
为规划航路t时刻的航迹偏角χ,
Figure BDA0002692508250000027
为规划航路t时刻的航迹倾角γ,χt为t时刻无人机实际航迹偏角,γt为t时刻无人机实际航迹倾角;pt,qt,rt是无人机体坐标下t时刻的横、纵和垂三轴角速度;αt为t时刻无人机的攻角;μt是t时刻航迹滚转角。
步骤302、将所有的一维向量按时间顺序排列成包含时间特性的二维数据;
二维数据集合为:
Figure BDA0002692508250000031
其中,ρT为时间序列长度;
步骤303、针对每个排序后的二维数据,设计不同尺度的卷积核进行特征提取;
每个卷积块包括三部分:卷积层,归一化层和LeakyReLU层。两个卷积核的长度分别与特征图的时间轴方向长度和状态轴方向长度相同;
步骤304、对特征结果进行卷积,分别得各二维数据对应的时间特征图和状态特征图;
步骤305、将时间特征图经过转置层处理后与状态特征图进行深度特性拼接,然后输入到全连接层;
步骤306、全连接层对卷积核输出进行综合,得出各二维数据对应的预测结果
Figure BDA0002692508250000032
将预测结果与原无人机闭环系统生成的对应预测状态和预测航迹进行比较学习,然后通过反向传播更新TMN网络结构的参数。
预测的无人机航迹和状态信息结果为:
Figure BDA0002692508250000033
步骤307、重复上述操作,直到结果满足训练要求或达到训练次数上限,结束TMN网络训练。
步骤四、建立航路优化的总代价函数
Figure BDA0002692508250000034
总代价函数由四部分组成:长度代价
Figure BDA0002692508250000035
能量代价
Figure BDA0002692508250000036
飞行安全代价函数
Figure BDA0002692508250000037
可飞性代价函数
Figure BDA0002692508250000038
可飞性代价函数
Figure BDA0002692508250000039
是指:规划航路与相应的预测航迹之间的相似度,定义如下:
Figure BDA00026925082500000310
其中,Kd是距离代价系数,Kθ是方向代价系数;d是规划航路点与预测航迹点的距离,计算公式为d=||T-T*||;T(x,y,z)为单步预测航迹点,T*(x*,y*,z*)为单步规划航路点;
Figure BDA00026925082500000311
为预测航迹在距离和方向的相似度,
Figure BDA00026925082500000312
为规划航路在距离和方向的相似度。
步骤五、选取的航路生成器在MPC框架下,规划出n条时间序列长度为M的随机航路,将n条随机航路输入TMN中,预测出各随机航路对应的飞行航迹
Figure BDA00026925082500000313
和飞行状态数据
Figure BDA00026925082500000314
并代入总代价函数,通过航路优化器优化得到总代价函数最优的规划航路Tc
步骤六、将最优规划航路Tc输给无人机,无人机飞控系统将规划航路Tc作为航路跟踪的指令进行跟踪,将预测航迹和评价指标显示在无人机控制站;同时记录无人机实际的飞行航迹和飞行状态参数,当出现实际飞行航迹和预测航迹偏差超过阈值时,将实际航迹和相应的飞行状态参数加入TMN网络中进行迭代训练,提升飞行航迹预测能力。
本发明的优点在于:
(1)一种基于航路跟踪映射网络的高可飞性航路规划方法,使用快速计算的深度神经网络表征现有的无人机非线性运动模型,充分考虑无人机跟踪特性的同时提高航路规划效率。
(2)一种基于航路跟踪映射网络的高可飞性航路规划方法,用规划航路对应的预测航迹评价安全性、能量消耗、航迹长度等性能指标并优化,预测其优化特性更贴合无人机实飞状况和跟踪特性,效果优于对规划航路进行的优化;
(3)一种基于航路跟踪映射网络的高可飞性航路规划方法,提出可飞性的优化指标,用于评价和优化规划航路和预测航迹的相似度,以提高航路规划的可行性;
(4)一种基于航路跟踪映射网络的高可飞性航路规划方法,采用的深度神经网络具有再训练性,不仅可以依据不同的训练数据适应不同的无人机和飞行环境,还可以通过采集无人机实飞数据逐步提高训练集中实际飞行航迹和无人机状态的数量,实现飞行航迹预测能力的进一步提升。
附图说明
图1是本发明一种基于航路跟踪映射网络的高可飞性航路规划方法的原理图;
图2是本发明一种基于航路跟踪映射网络的高可飞性航路规划方法的流程图;
图3是本发明中航路映射网络(TMN)的训练过程;
图4是本实例中航路映射网络(TMN)的神经网络结构;
图5是基于无人机非线性闭环系统模型和TMN模型单步仿真时长对比;
图6a是本发明采用所规划航路的方法与现有两种算法规划航路方法的对比图;
图6b是本发明采用所规划航路过程中状态变量与状态限制差距与现有两种算法的对比图;
图6c是本发明采用的方法在不同模型误差下所规划航路的对比。
具体实施方式
下面将结合附图和实例对本发明作进一步的详细说明。
本发明一种基于航路跟踪映射网络的高可飞性航路规划方法,利用深度学习网络通过离线训练来充分表征无人机六自由度运动模型和航路跟踪控制器组成的闭环系统特性,并在航路规划器中在线使用,从而准确预测出无人机以该规划航路为跟踪指令时的飞行航迹;航路评价时摒弃传统的对规划航路的评价,改为对于预测的飞行航迹的评价,同时引入航路跟踪可飞性指标,以尽可能提高规划航路的可飞性;之后通过航路优化器对总评价指标进行优化,得到最终的规划航路、预测航迹和评价指标,一起发送给无人机系统;无人机飞控系统将规划航路作为航路跟踪的指令进行跟踪,将预测航迹和评价指标显示在无人机控制站,为操控人员提供信息指示,同时记录无人机实际的飞行航迹和飞行状态参数;当出现实际飞行航迹和预测航迹偏差超过一定门限情况时,将实际航迹和相应的飞行状态参数加入网络的训练集中进行迭代训练,以逐步提高训练集中实际飞行航迹数量,实现飞行航迹预测能力的进一步提升。
如图1所示,首先,航路规划器产生大量的规划航路,经过航迹映射网络得到预测航迹,将预测航迹输入常规评价函数(高效性、状态限制、安全性),以及与规划航路一同输入到可飞性评价函数。两种评价函数输出得到规划航路的综合评价,将综合评价输入无人机系统,用于地面站工作人员进行参考,同时优化器根据综合评价对大量航路进行优化得到最优规划航路参数。将该参数输入航路规划器生成最优规划航路,然后最优规划航路通过TMN生成对应预测轨迹,将最优规划航路和预测轨迹输入到无人机系统,完成高可飞性的航路规划。同时,无人机系统在飞行过程中储存航迹状态数据,用于对TMN网络的再优化。
本发明所述的高可飞性航路规划方法,如图2所示,具体包括如下步骤:
步骤一、建立考虑气动数据不准确、风扰和其他干扰等不确定因素的无人机六自由度运动模型,将该模型与无人机的航路跟踪控制器结合构成无人机闭环运动控制模型。
无人机位置六自由度运动学方程如下:
Figure BDA0002692508250000051
Figure BDA0002692508250000052
Figure BDA0002692508250000053
Figure BDA0002692508250000061
Figure BDA0002692508250000062
其中,X,Y,Z分别为无人机在惯性系下的纵、横和垂三维位置坐标,
Figure BDA0002692508250000063
分别是X,Y,Z的微分;V为无人机的航迹速度;χ为无人机的航迹偏角,γ是无人机的航迹倾角;m是无人机质量;α,β,μ别为无人机的迎角、无人机的侧滑角和无人机的航迹滚转角;σ是发动机安装偏角;T,D,C,L分别为无人机的发动机推力、无人机的阻力、无人机的侧力和无人机的升力;βw是受风扰下的气流侧滑角;αw是受风扰下的气流攻角;g是重力加速度;βk是无风扰下的侧滑角;αk是无风扰下的迎角。
p,q,r分别对应无人机体坐标下的x,y,z三轴角速度;Ix,Iy,Iz分别对应无人机体坐标下的横、纵和垂三轴转动惯量;Ixz是x,z轴的惯性积;uw,vw,ww分别对应体坐标下的横、纵和垂三轴速度;L,M,N分别对应体坐标下的横、纵和垂的三轴力矩;Va是无人机的地速。
将风扰从惯性系转换到无人机的体坐标系,然后在气流角和空速中加入风扰效应。考虑风扰的无人机运动模型可以简化表示为:
Figure BDA0002692508250000064
u为控制输入,w为风扰动,fM代表无人机模型。其中S为无人机状态:
S=[X Y Z V χ γ α β μ p q r]
建立航路跟踪控制器模型,如下:
uc=fC(Tc,S)
其中fC代表航路跟踪控制器控制律,Tc为指令路径,S为无人机状态:
最后,将无人机运动模型和航路跟踪控制器结合,构成无人机闭环系统控制模型;
Figure BDA0002692508250000065
fU代表无人机闭环系统模型,
Figure BDA0002692508250000066
为无人机下一个仿真步长的状态。
步骤二、通过航路生成器随机产生大量规划航路,在无人机运动约束范围内,设置随机无人机状态,将两者输入给无人机闭环运动控制模型,通过数值仿真得到相应于各输入航路和无人机飞行状态数据的无人机预测飞行航迹。
将每一条输入的规划航路和无人机状态,以及对应输出的预测状态和预测航迹,构成一对数据进行记录和存储,如图3所示,重复上述操作可得训练神经网络所需的数据对集。
步骤三、将当前无人机规划航路和状态按时间顺序排列成二维数据,逐个输入到TMN网络中,得到各输入对应的输出,将各输出与各输入对应的预测状态和预测航迹进行对比,得到规划航路偏差和预测航迹的偏差,利用反向传播更新TMN网络参数。
TMN网络是在现有的卷积神经网络(CNN)的基础上添加了时间,形成时间序列卷积神经网络(TSCNN),使用无人机闭环系统模型所产生的输入输出数据对离线训练TSCNN,经过充分训练后的TSCNN在规划航路与飞行航迹之间建立航路跟踪映射网络(TMN),通过输入规划航路和无人机当前状态可以预测无人机后续飞行状态和飞行航迹。
如图4所示,将无人机历史状态和规划航路合并为一维向量作为神经网络训练输入,然后将处理好的一维输入数据按时间顺序排列成为包含时间特性的二维数据空间,对CNN进行训练,使之成为TSCNN。利用卷积核对输入信息进行特征提取,最后经全连接层对卷积核输出进行综合,输出预测的无人机航迹和状态信息,与原无人机闭环系统生成的对应输出比较进行学习。
深度学习网络训练过程参数为:最大训练次数200;数据集规模20000;初始学习率0.01。网络训练完成后,其预测过程与训练过程步骤一致,但不再对比学习,网络结构参数不变。
具体步骤如下:
步骤301、将每个无人机状态,和各自对应的规划航路和实际航迹的偏差合并为各自对应的一维向量;
一维向量表示为:
Figure BDA0002692508250000071
航迹偏角的偏差为
Figure BDA0002692508250000072
航迹倾角的偏差为
Figure BDA0002692508250000073
为规划航路t时刻的航迹偏角χ,
Figure BDA0002692508250000074
为规划航路t时刻的航迹倾角γ,γt为t时刻无人机实际航迹偏角,γt为t时刻无人机实际航迹倾角;pt,qt,rt是无人机体坐标下t时刻的三轴角速度;αt为t时刻无人机的攻角;μt是t时刻航迹滚转角。
步骤302、将所有的一维向量按时间顺序排列成包含时间特性的二维数据;
二维数据集合为:
Figure BDA0002692508250000075
其中,ρT为时间序列长度;
步骤303、针对每个排序后的二位数据,设计不同尺度的卷积核进行特征提取;
每个卷积块包括三部分:卷积层,归一化层和LeakyReLU层。两个卷积核的长度分别与特征图的时间轴方向长度和状态轴方向长度相同;
步骤304、设计两个卷积核对特征结果进行卷积,分别得各二维数据对应的时间特征图和状态特征图;
两个卷积核的长度分别与特征图的时间轴方向长度和状态轴方向长度相同,
步骤305、将时间特征图经过转置层处理后与状态特征图进行深度特性拼接,然后输入到全连接层;
步骤306、全连接层对卷积核输出进行综合,得出各二维数据对应的预测结果
Figure BDA0002692508250000081
将预测结果与原无人机闭环系统生成的对应预测状态和预测航迹进行比较学习,然后通过反向传播更新TMN网络结构的参数。
预测的无人机航迹和状态信息结果为:
Figure BDA0002692508250000082
步骤307、重复上述操作,直到结果满足训练要求或达到训练次数上限,结束TMN网络训练。
步骤四、建立航路优化的总代价函数
Figure BDA0002692508250000083
总代价函数由四部分组成:长度代价
Figure BDA0002692508250000084
能量代价
Figure BDA0002692508250000085
飞行安全代价函数
Figure BDA0002692508250000086
可飞性代价函数
Figure BDA0002692508250000087
长度代价
Figure BDA0002692508250000088
相应于规划航路的预测航迹的归一化长度作为长度代价,定义如下:
Figure BDA0002692508250000089
其中,Ks为长度代价系数,di为第i条预测航迹长度,dmax为最长预测航迹长度,用于评价和优化实飞航迹的飞行长度;
能量代价
Figure BDA00026925082500000810
相应于规划航路的控制输入的平方和(归一化后),定义如下:
Figure BDA00026925082500000811
其中,KE为能量代价系数,δx表示副翼偏角,δy表示方向舵偏角,δz表示升降舵偏角,δxmax为副翼最大偏角,δymax为方向舵最大偏角,δzmax为升降舵最大偏角;
飞行安全代价函数
Figure BDA00026925082500000812
避免无人机和障碍、威胁(这里将禁飞区视作威胁)以及其他飞行器之间的碰撞而引入,采用相应于规划航路的预测航迹来评价;
可飞性代价函数
Figure BDA00026925082500000813
是指:规划航路与相应的预测航迹之间的相似度,定义如下:
Figure BDA00026925082500000814
其中,Kd是距离代价系数,Kθ是方向代价系数;d是规划航路点与预测航迹点的距离,计算公式为d=||T-T*||;T(x,y,z)为单步预测航迹点,T*(x*,y*,z*)为单步规划航路点;
Figure BDA0002692508250000091
为预测航迹在距离和方向的相似度,
Figure BDA0002692508250000092
为规划航路在距离和方向的相似度。
步骤五、建立优化器和MPC框架,对航路生成器规划出n条时间序列长度为M的随机航路进行优化;
其中,本实例采用的优化器为PSO,其运行过程如下:
步骤501、按工程需要选取某种航路生成器并根据PSO求解出的参数N和UAV的位置信息P生成下一时间序列段可能的随机航路;
首先,对参数N和UAV的位置信息P进行初始化;
步骤502、在MPC框架下,TMN根据UAV现在的状态S和随机规划航路T′预测下一时间序列长度后的飞行状态
Figure BDA0002692508250000093
和对应飞行航迹
Figure BDA0002692508250000094
M是MPC预测步长;
步骤503、在MPC框架下由PSO计算并优化在该时间序列长度的预测状态
Figure BDA0002692508250000095
和预测航迹
Figure BDA0002692508250000096
下的代价函数,得到最优参数N用于航路生成器生成下一步长的最优规划航路Tc
步骤六、将最优规划航路Tc、对应预测航迹、对应可飞性指标参数输出到无人机系统,其中,最优规划航路Tc作为无人机航路跟踪的指令进行跟踪,对应预测航迹、对应可飞性指标参数用于显示在无人机控制站,为操控人员提供信息指示,同时,将该步长的实飞航迹和对应无人机状态数据进行存储。当出现实际飞行航迹和预测航迹偏差超过一定门限情况时,将实际航迹和相应的飞行状态参数加入TMN的训练集中进行迭代训练,以逐步提高训练集中实际飞行航迹数量,实现飞行航迹预测能力的进一步提升。
为检验本发明所提出的方法在航路规划方面的高效性,将传统无人机非线性模型与本文TMN模型的运行时间进行比较,如图5所示。
将基于三自由度质点模型航路规划方法(方法一)、基于离线无人机闭环系统模型路径规划方法(方法二)与本发明采用的方法进行比较。
设定两个障碍位置为
Figure BDA0002692508250000097
Figure BDA0002692508250000098
对应参数
Figure BDA0002692508250000099
Figure BDA00026925082500000910
以及目标位置PT=[10000 1000 1000]和捕获半径RT=10,设定无人机初始位置PUAV=[0 00]。图6a为基于三自由度质点模型航路规划方法(方法一)/基于离线无人机闭环系统模型路径规划方法(方法二)/本发明采用的方法所规划航路的对比,图6b为基于三自由度质点模型航路规划方法(方法一)/基于离线无人机闭环系统模型路径规划方法(方法二)/本发明采用的方法跟踪规划航路过程中状态变量与状态限制差距的对比,图6c为本发明采用的方法在不同模型误差下所规划航路的对比。
由上述实验可知,本发明采用的方法中,采用无人机闭环运动控制模型下的飞行数据训练TMN网络,利用TMN网络代替复杂的非线性方程,充分考虑无人机跟踪特性,提高了航路规划效率,提高了模型抗扰动能力;设计规划航路的可飞性指标,保障了预测航迹的准确性,有效提高了规划航路的可飞性;使用预测航迹进行安全性、能量代价和轨迹长度评价和优化,更接近实际飞行状况和无人机特性,优化效果优于对规划航路进行的优化。
本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (4)

1.一种基于航路跟踪映射网络的高可飞性航路规划方法,其特征在于,包括如下步骤:
步骤一、建立无人机六自由度运动模型,将该模型与无人机的航路跟踪控制器结合构成无人机闭环运动控制模型;
步骤二、通过航路生成器产生大量随机规划航路,在无人机运动约束范围内设置随机无人机状态,将每一条规划航路和无人机状态分别输入到无人机闭环系统模型,输出对应的预测状态和预测航迹并记录;
步骤三、将当前无人机规划航路和状态按时间顺序排列成二维数据,逐个输入到TMN网络中,得到各输入对应的输出,将各输出与各输入对应的预测状态和预测航迹进行对比,得到预测状态偏差和预测航迹的偏差,利用反向传播更新TMN网络参数;
TMN网络是指航路跟踪映射网络,在现有的卷积神经网络的基础上添加了时间特征形成的;
具体步骤如下:
步骤301、将每个无人机状态,和各自对应的规划航路和实际航迹的偏差合并为各自对应的一维向量;
一维向量表示为:
Figure FDA0002692508240000011
航迹偏角的偏差为
Figure FDA0002692508240000012
航迹倾角的偏差为
Figure FDA0002692508240000013
Figure FDA0002692508240000014
为规划航路t时刻的航迹偏角χ,
Figure FDA0002692508240000015
为规划航路t时刻的航迹倾角γ,χt为t时刻无人机实际航迹偏角,γt为t时刻无人机实际航迹倾角;pt,qt,rt是无人机体坐标下t时刻的横、纵和垂三轴角速度;αt为t时刻无人机的攻角;μt是t时刻航迹滚转角;Vt为t时刻的无人机的航迹速度;
步骤302、将所有的一维向量按时间顺序排列成包含时间特性的二维数据;
二维数据集合为:
Figure FDA0002692508240000016
其中,ρT为时间序列长度;
步骤303、针对每个排序后的二维数据,设计不同尺度的卷积核进行特征提取;
每个卷积块包括三部分:卷积层,归一化层和LeakyReLU层;两个卷积核的长度分别与特征图的时间轴方向长度和状态轴方向长度相同;
步骤304、对特征结果进行卷积,分别得各二维数据对应的时间特征图和状态特征图;
步骤305、将时间特征图经过转置层处理后与状态特征图进行深度特性拼接,然后输入到全连接层;
步骤306、全连接层对卷积核输出进行综合,得出各二维数据对应的预测结果
Figure FDA0002692508240000017
将预测结果与原无人机闭环系统生成的对应预测状态和预测航迹进行比较学习,然后通过反向传播更新TMN网络结构的参数;
预测的无人机航迹和状态信息结果为:
Figure FDA0002692508240000021
步骤307、重复上述操作,直到结果满足训练要求或达到训练次数上限,结束TMN网络训练;
步骤四、建立航路优化的总代价函数
Figure FDA0002692508240000022
步骤五、选取的航路生成器在MPC框架下,规划出n条时间序列长度为M的随机航路,将n条随机航路输入TMN中,预测出各随机航路对应的飞行航迹
Figure FDA0002692508240000023
和飞行状态数据
Figure FDA0002692508240000024
并代入总代价函数,通过航路优化器优化得到总代价函数最优的规划航路Tc
步骤六、将最优规划航路Tc输给无人机,无人机飞控系统将规划航路Tc作为航路跟踪的指令进行跟踪,将预测航迹和评价指标显示在无人机控制站;同时记录无人机实际的飞行航迹和飞行状态参数,当出现实际飞行航迹和预测航迹偏差超过阈值时,将实际航迹和相应的飞行状态参数加入TMN网络中进行迭代训练,提升飞行航迹预测能力。
2.如权利要求1所述的一种基于航路跟踪映射网络的高可飞性航路规划方法,其特征在于,所述的步骤一构建无人机闭环运动控制模型,步骤如下:
首先,建立航路跟踪控制器模型,如下:
uc=fC(Tc,S)
其中fC代表航路跟踪控制器控制律,Tc为指令路径,S为无人机状态:
S=[X Y Z V χ γ α β μ p q r]
X,Y,Z分别为无人机在惯性系下的横、纵和垂三维位置坐标,V为无人机的航迹速度;χ为无人机的航迹偏角,γ是无人机的航迹倾角;p,q,r是无人机体坐标下的横、纵和垂三轴角速度;α是无人机坐标系下的迎角、β是无人机坐标系下的侧滑角和μ是无人机坐标系下的航迹滚转角;
然后,建立含风扰的无人机运动模型,简化为:
Figure FDA0002692508240000025
fM代表无人机模型,u为控制输入,w为风扰动;
最后,建立无人机闭环系统控制模型;
无人机下一个仿真步长的状态
Figure FDA0002692508240000026
为:
Figure FDA0002692508240000027
fU代表无人机闭环系统模型。
3.如权利要求1所述的一种基于航路跟踪映射网络的高可飞性航路规划方法,其特征在于,所述的步骤二中每一条输入的规划航路和无人机状态,以及对应输出的预测状态和预测航迹,构成一对数据进行记录和存储。
4.如权利要求1所述的一种基于航路跟踪映射网络的高可飞性航路规划方法,其特征在于,所述的步骤四中总代价函数由四部分组成:长度代价
Figure FDA0002692508240000031
能量代价
Figure FDA0002692508240000032
飞行安全代价函数
Figure FDA0002692508240000033
可飞性代价函数
Figure FDA0002692508240000034
可飞性代价函数
Figure FDA0002692508240000035
是指:规划航路与相应的预测航迹之间的相似度,定义如下:
Figure FDA0002692508240000036
其中,Kd是距离代价系数,Kθ是方向代价系数;d是规划航路点与预测航迹点的距离,计算公式为d=||T-T*||;T(x,y,z)为单步预测航迹点,T*(x*,y*,z*)为单步规划航路点;
Figure FDA0002692508240000037
为预测航迹在距离和方向的相似度,
Figure FDA0002692508240000038
为规划航路在距离和方向的相似度。
CN202010995619.6A 2020-09-21 2020-09-21 一种基于航路跟踪映射网络的高可飞性航路规划方法 Active CN112161626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010995619.6A CN112161626B (zh) 2020-09-21 2020-09-21 一种基于航路跟踪映射网络的高可飞性航路规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010995619.6A CN112161626B (zh) 2020-09-21 2020-09-21 一种基于航路跟踪映射网络的高可飞性航路规划方法

Publications (2)

Publication Number Publication Date
CN112161626A true CN112161626A (zh) 2021-01-01
CN112161626B CN112161626B (zh) 2022-05-17

Family

ID=73863186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010995619.6A Active CN112161626B (zh) 2020-09-21 2020-09-21 一种基于航路跟踪映射网络的高可飞性航路规划方法

Country Status (1)

Country Link
CN (1) CN112161626B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114066354A (zh) * 2021-11-12 2022-02-18 中远海运科技股份有限公司 一种基于全球船舶历史航迹的智能航线推荐方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109828602A (zh) * 2018-01-19 2019-05-31 北京航空航天大学 一种基于观测补偿技术的航迹回路非线性模型变换方法
CN110514206A (zh) * 2019-08-02 2019-11-29 中国航空无线电电子研究所 一种基于深度学习的无人机飞行路径预测方法
CN110908395A (zh) * 2019-11-26 2020-03-24 西北工业大学 改进的无人机航迹实时规划方法
CN111385806A (zh) * 2020-02-18 2020-07-07 清华大学 一种无人机基站路径规划和带宽资源分配方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109828602A (zh) * 2018-01-19 2019-05-31 北京航空航天大学 一种基于观测补偿技术的航迹回路非线性模型变换方法
CN110514206A (zh) * 2019-08-02 2019-11-29 中国航空无线电电子研究所 一种基于深度学习的无人机飞行路径预测方法
CN110908395A (zh) * 2019-11-26 2020-03-24 西北工业大学 改进的无人机航迹实时规划方法
CN111385806A (zh) * 2020-02-18 2020-07-07 清华大学 一种无人机基站路径规划和带宽资源分配方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王华鲜等: "无人机群多目标协同主动感知的自组织映射方法", 《智能系统学报》 *
王宏伦等: "无人机避障航路规划方法研究综述", 《无人系统技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114066354A (zh) * 2021-11-12 2022-02-18 中远海运科技股份有限公司 一种基于全球船舶历史航迹的智能航线推荐方法及系统
CN114066354B (zh) * 2021-11-12 2023-10-31 中远海运科技股份有限公司 一种基于全球船舶历史航迹的智能航线推荐方法及系统

Also Published As

Publication number Publication date
CN112161626B (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
CN112241125B (zh) 一种基于微分平坦特性的无人机轨迹跟踪方法
Karimi et al. Optimal maneuver-based motion planning over terrain and threats using a dynamic hybrid PSO algorithm
Ergezer et al. Path planning for UAVs for maximum information collection
Hong et al. Energy-efficient online path planning of multiple drones using reinforcement learning
Kang et al. Deep convolutional identifier for dynamic modeling and adaptive control of unmanned helicopter
Wu Coordinated path planning for an unmanned aerial-aquatic vehicle (UAAV) and an autonomous underwater vehicle (AUV) in an underwater target strike mission
Bemporad et al. Decentralized linear time-varying model predictive control of a formation of unmanned aerial vehicles
Duong et al. Hamiltonian-based neural ODE networks on the SE (3) manifold for dynamics learning and control
CN111596684B (zh) 固定翼无人机密集编队与防撞避障半实物仿真系统及方法
Hérissé et al. A terrain-following control approach for a vtol unmanned aerial vehicle using average optical flow
Lin et al. Flying through a narrow gap using neural network: an end-to-end planning and control approach
CN113848974B (zh) 一种基于深度强化学习的飞行器轨迹规划方法及系统
Nie et al. Three‐Dimensional Path‐Following Control of a Robotic Airship with Reinforcement Learning
Zhang et al. Review of modeling and control in UAV autonomous maneuvering flight
Stevšić et al. Sample efficient learning of path following and obstacle avoidance behavior for quadrotors
Ge et al. Trajectory planning of fixed-wing UAV using kinodynamic RRT algorithm
CN114138022B (zh) 一种基于精英鸽群智能的无人机集群分布式编队控制方法
Li et al. Robocentric model-based visual servoing for quadrotor flights
Wu et al. Multi-objective reinforcement learning for autonomous drone navigation in urban areas with wind zones
CN112161626B (zh) 一种基于航路跟踪映射网络的高可飞性航路规划方法
Garus et al. Using of soft computing techniques to control of underwater robot
Hua et al. A novel learning-based trajectory generation strategy for a quadrotor
CN116301007A (zh) 基于强化学习的多四旋翼无人机集结型任务路径规划方法
Huang et al. Omnidirectional autonomous aggressive perching of unmanned aerial vehicle using reinforcement learning trajectory generation and control
Pi et al. Reinforcement learning trajectory generation and control for aggressive perching on vertical walls with quadrotors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant