CN110470301B - 多动态任务目标点下的无人机路径规划方法 - Google Patents

多动态任务目标点下的无人机路径规划方法 Download PDF

Info

Publication number
CN110470301B
CN110470301B CN201910742860.5A CN201910742860A CN110470301B CN 110470301 B CN110470301 B CN 110470301B CN 201910742860 A CN201910742860 A CN 201910742860A CN 110470301 B CN110470301 B CN 110470301B
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
point
unmanned
winning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910742860.5A
Other languages
English (en)
Other versions
CN110470301A (zh
Inventor
周筱忆
邹媛媛
李少远
肖春晖
赵小虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201910742860.5A priority Critical patent/CN110470301B/zh
Publication of CN110470301A publication Critical patent/CN110470301A/zh
Application granted granted Critical
Publication of CN110470301B publication Critical patent/CN110470301B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明提供了一种多动态任务目标点下的无人机路径规划方法,包括如下步骤:训练SOM神经网络,确定获胜点、访问点及访问序列;确定飞行方向以及最优路径;迭代;滚动优化。本发明针对信使机制下的无人机路径规划问题,无人机需要周期性地遍历所有无人车并进行信息交换,考虑无人机的运动曲率约束、无人车的动态特性以及无人车的通讯范围等约束条件,利用无监督的竞争型神经网络SOM求解访问顺序和访问点,优化无人机的飞行路径,并在无人机遍历无人车的过程中采用滚动优化策略,使无人机每次访问一个无人车后重新求解优化问题,从而实现在无人机访问的过程中动态地更新最优路径,持续保证决策的优越性。

Description

多动态任务目标点下的无人机路径规划方法
技术领域
本发明涉及空地协同领域的一种路径规划技术,具体地,涉及一种多动态任务目标点下的无人机路径规划方法。
背景技术
由于无人机和无人车在速度、负载、通讯和观测能力等方面有很强的互补性,空地协同可以有效拓宽无人机和无人车的应用范围,提高其执行侦查、搜索、营救等任务的效率。信使机制是无人机和无人车一种可能的协同模式,它在军事和民用领域有着广阔的应用前景,能够在救灾救援等场景下发挥重要作用。信使机制的含义是:在无人机/无人车协同系统中,假设无人车的通讯范围是有限的,相隔距离较远的无人车之间无法直接进行信息交互,因此需要一架无人机充当信使,周期性地飞到每辆无人车上空并与之通讯,将其他无人车的状态信息传递给该无人车,无人车接收到信息后制定决策并将决策结果发送给无人机,从而协作完成任务。作为信使机制下无人机/无人车协同的关键问题之一,无人机的路径规划直接影响着系统执行任务的效率,是无人机/无人车协同系统自主完成任务的重要前提,也是系统智能化的重要体现。
无人机的路径规划问题是指在特定需求下为无人机规划最优的可行轨迹。目前,针对信使机制下的无人机路径规划问题的研究较少,其中一个典型方法为解耦策略。解耦策略是首个针对信使机制下的无人机路径规划问题的解决方案,该算法把问题划分为确定访问顺序和寻找最优访问点两部分。首先采用启发式策略确定访问顺序,再通过采样获得最优访问点。但是用启发式算法确定访问顺序容易损失最优解,并且采样方法的求解精度主要取决于采样密度,采样密度较大时形成的问题规模也较大,计算量增加,采样密度较小时解的精度较低。
因此,设计一种适用于信使机制的多动态任务目标点下的无人机路径规划算法对于无人机/无人车协同系统的实现具有重要意义。
目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。
发明内容
针对现有技术中存在的上述不足,本发明的目的是提供一种多动态任务目标点下的无人机路径规划方法,该方法针对信使机制下的无人机路径规划问题,是一种基于自组织映射(SOM)的滚动优化算法。
本发明是通过以下技术方案实现的。
一种多动态任务目标点下的无人机路径规划方法,包括如下步骤:
S1,确认获胜点、访问点和访问序列:
输入无人机和无人车的位置坐标集合P,训练SOM神经网络,输出获胜点、访问点和访问序列;
初始化:输入无人机位置坐标和任意多个(优选为两个)无人车位置坐标,把竞争层初始化为环形结构,并把竞争层携带的权向量初始化为环形上获胜点的位置坐标;
依次输入集合P中的其他目标点坐标,输入层每输入一个目标点pm,输出层确定一个获胜点wm、更新访问序列S、确定访问点
Figure GDA0002755107960000021
并调整获胜点wi′及其邻近节点;
确定获胜点:获胜点是指在竞争层环形结构上与输入样本相似性最高的点,即与目标无人车欧氏距离最小的点;
更新访问序列:假设获胜点
Figure GDA0002755107960000022
其中sj为序列S中的第j个元素,则将序号m插入到sj和sj+1之间;
确定访问点:获胜点wm、访问点
Figure GDA0002755107960000023
与目标点pm的关系如下所示:
Figure GDA0002755107960000024
其中,R为目标点的通讯邻域半径,∈是一个常数,用于确保访问点
Figure GDA0002755107960000025
在目标点pm的邻域范围内能够正常通讯;
调整获胜点wm及其邻近节点权值:采用邻近函数f(σ,d)量化获胜点wm对其临近节点的影响:
Figure GDA0002755107960000031
其中,η是一个小于1的常数,M是当前环形结构中的节点总数,σ为学习增益,d是邻近节点与获胜点wm之间的距离,即两点之间相隔节点数;与获胜点wm之间的距离大于等于ηM的节点将不会移动,仅把获胜点wm左右[ηM]个节点纳入调整范围;
环形结构上原节点坐标记作wi,调整后的节点坐标记作wi′,则调整获胜点及其邻近节点权值的规则为:
Figure GDA0002755107960000032
其中,μ为学习率,μf(σ,d)决定了节点的调整幅度大小;
S2,确定飞行方向以及最优路径:
提取解决方案:在每轮训练结束时,删除上一轮的n个获胜点,输出层环形结构上留下本轮获得的n个获胜点,同时获得n个相应的访问点以及访问序列S;
确定飞行方向:按照访问序列依次连接访问点形成闭环,对于每一条闭环环路,采用启发式方法确定顺时针或逆时针飞行方向;
计算加权路径长度:在计算路径长度时为每一段Dubins路径加权,加权路径长度D的计算方法为:
Figure GDA0002755107960000033
其中,
Figure GDA0002755107960000034
为序号为si的无人车对应的访问点位置坐标,
Figure GDA0002755107960000035
为无人机在
Figure GDA0002755107960000036
处的航向,
Figure GDA0002755107960000037
为给定起点状态和终点位置下的Dubins路径长度,n为集合P的元素数量;
更新最优路径:将加权路径长度D与当前最短路径长度Dmin比较,更新最短路径长度Dmin、最优访问序列Sfinal、最优访问点
Figure GDA0002755107960000038
为:
Figure GDA0002755107960000039
其中,P*为访问点集合;
S3,迭代:有限次迭代S1和S2,得到最终的最优访问序列Sfinal和最优访问点
Figure GDA00027551079600000310
S4,滚动优化:无人机每次访问一个无人车后重新预估所有无人车的位置,重复S1~S3,直至遍历所有无人车。
优选地,∈=0.001。
优选地,η=0.2。
优选地,采用启发式方法确定顺时针或逆时针飞行方向,具体为:分别计算无人机的朝向与相邻两条路径之间的夹角,取夹角较小者作为飞行方向。
优选地,S4中,在重复S1~S3的优化过程中,只把尚未访问的无人车纳入求解范围;即,对于n个无人车,无人机的一次遍历任务中共需要进行n-1次优化问题的求解,每次求解涉及的无人车数量分别为n、n-1、n-2、…、2。
优选地,所述多动态任务目标点下的无人机路径规划方法,还包括如下步骤:在无人机的一次遍历任务完成后,待访问的无人车数量恢复为n,继续进行下一次遍历任务。
本发明所提供的多动态任务目标点下的无人机路径规划方法,针对信使机制下的无人机路径规划问题,无人机需要周期性地遍历所有无人车并进行信息交换,考虑无人机的运动曲率约束、无人车的动态特性以及无人车的通讯范围等约束条件,利用无监督的竞争型神经网络SOM求解访问顺序和访问点,优化无人机的飞行路径,并在无人机遍历无人车的过程中采用滚动优化策略,使无人机每次访问一个无人车后重新求解优化问题,从而实现在无人机访问的过程中动态地更新最优路径,持续保证决策的优越性。
与现有技术相比,本发明具有如下有益效果:
1、本发明利用SOM神经网络优化访问顺序和访问点,并且在无人机遍历无人车的过程中滚动优化,动态地更新访问序列及相应的访问点,持续保证决策的优越性;
2、本发明适用于包含一个信使无人机和多个无人车的无人机/无人车协同系统,能够适应无人机的运动曲率约束和无人车的动态特性,为无人机规划合理的飞行路径。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明一实施例中所涉及的无人机/无人车协同系统初始场景示意图;
图2是本发明一实施例所提供的多动态任务目标点下的无人机路径规划方法中一次遍历任务流程图;
图3是本发明一实施例中无人机能够与动态目标点会合的证明示意图;
图4是本发明一实施例中无人机完成一次遍历任务的路径示意图;
图5是发明一实施例中无人机完成二次遍历任务的路径示意图;
图6是发明一实施例中无人机完成三次遍历任务的路径示意图;
图7是发明一实施例中无人机完成四次遍历任务的路径示意图;
具体实施方式
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
本发明实施例提供了一种多动态任务目标点下的无人机路径规划方法,该方法针对以下无人机路径规划问题以及基于以下原理实施。
多动态任务目标点下的无人机路径规划问题,可以描述为:
以森林灭火为例,已知空间中存在多个着火点,由n辆无人车和一架信使无人机组成的协同系统执行灭火任务。各个无人车需要根据自身的灭火能力和其他无人车的实时状态信息进行决策,向不同着火点集结并执行灭火任务。由于相隔距离较远,无人车之间无法直接进行通讯,无人机作为信使需要周期性地遍历所有无人车,获取每个无人车的状态信息并同时将其他无人车的信息转发给当前无人车,无人车根据无人机传递的实时信息制定灭火决策,直到任务完成。无人车可以认为是分布于二维平面上不同位置的n个动态目标点,信使无人机主要负责获取目标点的运动方向和速度信息并向每个无人车传达这些信息,假设无人机和无人车的信息交换是瞬时完成的。在实际情况中,无人车往往有一定的通讯范围,当无人机位于无人车通讯范围内时,两者可以进行通信。因此在进行路径规划时,无人机不必遍历各个无人车所在的准确位置,只需要经过无人车通讯邻域即可。无人机路径规划的目标在于使无人机完成一次遍历任务的时间最短,通过提高无人车对各个目标点信息的更新频率,帮助无人车做出更及时有效的决策,提高任务的执行效率。
多动态任务目标点下的无人机路径规划模型,可以描述为:
考虑到无人机的运动具有转向曲率约束,为了使规划的路径更加平滑且更具有可行性,采用Dubins模型来描述无人机的运动学特征,模型要求无人机运动满足以下约束:
Figure GDA0002755107960000061
其中(x,y)表示无人机在二维平面的位置坐标,θ是无人机的朝向角,(x,y,θ)可以描述无人机任意时刻的状态。v和r分别表示无人机的飞行速度和最小转向半径。u为控制输入,规定当u>0时,无人机向左转弯,当u<0时,无人机向右转弯,当u=0时,无人机保持原方向直行。
对于满足上述约束的运动体,任意给定起点状态和终点位置,两点间的最短路径称为终端航向松弛的Dubins路径。
因此基于终端航向松弛的Dubins路径的优化问题模型可以表示为:
Figure GDA0002755107960000062
Figure GDA0002755107960000063
Figure GDA0002755107960000064
Figure GDA0002755107960000065
Figure GDA0002755107960000066
其中S=[s1,s2,…,sn]为目标点访问顺序,H=[h1,h2,…,hn]为无人机在目标点处的朝向。(p0,h0)表示无人机的初始状态,
Figure GDA0002755107960000067
表示无人机访问第i个目标点时的状态,
Figure GDA0002755107960000068
表示给定起点状态和终点位置的最短Dubins路径长度。
Figure GDA0002755107960000071
Figure GDA0002755107960000072
在t时刻的位置坐标,
Figure GDA0002755107960000073
Figure GDA0002755107960000074
对应的访问点的位置坐标,
Figure GDA0002755107960000075
Figure GDA0002755107960000076
和与其相应的访问点之间的直线距离,R为无人车的通讯半径。
本发明实施例所提供的多动态任务目标点下的无人机路径规划方法,其构思如下:无人机根据上一轮访问时得到的各个无人车的位置信息和运动方向信息可以预估出各个无人车在任意时刻的位置。用这些位置数据训练无监督竞争型SOM神经网络可以获得访问顺序和访问点坐标。考虑到无人车的动态特性,本发明采用了滚动优化思想,无人机每次访问一个无人车后重新预估所有无人车的位置并重新训练SOM网络,求解优化问题。滚动优化思想可以实现在无人机访问的过程中动态地调整和更新访问序列及相应的访问点,持续保证决策的优越性。
基于SOM的滚动优化算法:SOM网络是一种竞争学习型的无监督神经网络,它的拓扑结构分为两层:输入层和输出层(也称为竞争层),它能把高维输入数据映射到低维空间,同时保持输入数据在高维空间的拓扑结构,即将高维空间中相似的样本点映射到输出层中邻近的神经元。训练SOM神经网络的目标是为竞争层的神经元求解出合适的权向量,以保证输入样本在低维空间仍能保持在高维空间的拓扑结构。本发明用目标点的坐标数据训练SOM神经网络,并从训练结果中提取无人机的可飞路径。在无人机遍历无人车的过程中采用滚动优化策略,动态地调整和更新最优路径。
基于以上规划问题及原理,本发明实施例提供的多动态任务目标点下的无人机路径规划方法,其具体技术方案如下。
一种多动态任务目标点下的无人机路径规划方法,所述方法包括如下步骤:
(1)确定获胜点、访问点及访问序列;
输入无人机和无人车的位置坐标集合P,训练SOM神经网络,输出获胜点、访问点和访问序列。
初始化:输入无人机位置坐标和任意多个(优选为两个)无人车位置坐标,把竞争层初始化为环形结构,并把竞争层携带的权向量初始化为环形上获胜点的位置坐标。
依次输入集合P中的其他目标点坐标,输入层每输入一个数据pm,输出层就要确定一个获胜点wm、更新访问序列S、确定访问点
Figure GDA0002755107960000081
并调整获胜点wi′及其邻近节点。
确定获胜点:获胜点是指在竞争层闭环上与输入样本相似性最高的点,即与目标无人车欧氏距离最小的点,确定获胜点的有益效果是找到竞争层上与输入样本相似度最高的神经元。
更新访问序列:假设获胜点
Figure GDA0002755107960000082
其中sj为序列S中的第j个元素,则将序号m插入到sj和sj+1之间;
确定访问点:无人机必须访问目标点邻域内的某一点才能与无人车进行通讯,因此获胜点未必是可行解。若访问点落在圆盘形邻域的内部,那么无人机的飞行路径一定会经过邻域边界上的某一点,因此此时的路径不是最短的,从优化路径的角度,将访问点确定在无人车的通讯邻域边界上。获胜点wm、访问点
Figure GDA0002755107960000083
与目标点pm的关系可以用如下公式表示:
Figure GDA0002755107960000084
其中,R为目标点的通讯邻域半径,∈是一个常数,例如∈=0.001,从实际情况考虑,∈用于确保访问点
Figure GDA0002755107960000085
在目标点的邻域范围内可以正常通讯。
调整获胜点及其邻近神经元权值:其基本思想是获胜神经元对其邻近神经元的影响从近到远,从兴奋逐渐转变为抑制。采用邻近函数来量化这种影响:
Figure GDA0002755107960000086
其中,M是当前环路中的节点总数,σ为学习增益,d是邻近节点与获胜点wm之间的距离,即两点之间相隔节点数。与获胜点wm之间的距离大于等于0.2M的节点将不会移动,仅把获胜点wm左右[0.2M]个节点纳入调整范围。η优选为0.2。
按照如下规则调整权值,有益效果是使得获胜神经元及其邻近神经元携带的权向量与当前训练样本的距离缩小,从而保持数据在输入层的拓扑结构。环路上原节点坐标记作wi,调整后的节点坐标记作wi′,调整规则为:
Figure GDA0002755107960000087
其中,μ为学习率,f(σ,d)为邻近函数,μ*f(σ,d)决定了节点的调整幅度大小,
Figure GDA0002755107960000088
为访问点坐标。
(2)确定飞行方向以及最优路径;
提取解决方案:在每轮训练结束时,删除上一轮的n个获胜点,输出层闭环上留下本轮获得的n个获胜点,同时可以获得n个相应的访问点以及访问序列S。输出层闭环并不是可行路径,需要从中提取无人机可飞路径。
确定飞行方案:按照访问顺序依次连接访问点形成闭环,对于一条环路,无人机有顺时针和逆时针两种飞行方案。采用一种启发式策略确定顺时针或逆时针飞行方案:分别计算无人机的朝向与相邻两条路径之间的夹角,取夹角较小者作为飞行方向。
计算加权路径长度:由于采用滚动优化策略,只把下一个访问点投入实施,因此在计算路径长度时为每一段Dubins路径加权,目的是突出下一个访问点的优先性,越先经过的路径优先级越高,权值越大,访问顺序靠后的路径由于并不会立刻实施而获得较小的权值。加权路径长度计算公式为:
Figure GDA0002755107960000091
更新最优路径:将加权路径长度D与当前最短路径长度Dmin比较,更新最短路径长度Dmin、最优访问顺序Sfinal、最优访问点
Figure GDA0002755107960000092
Figure GDA0002755107960000093
(3)迭代:由于学习率μ<1,上述步骤(1)和(2)经过有限次迭代,竞争层逐渐趋于稳定,算法收敛,得到最终的最优访问顺序Sfinal和最优访问点
Figure GDA0002755107960000094
(4)滚动优化:无人机每次访问一个无人车后重新预估所有无人车的位置,重复上述步骤(1)~(3),重新训练SOM网络,求解优化问题,直至遍历所有无人车。
进一步地,还包括:在无人机的一次遍历任务完成后,待访问的无人车数量恢复为n,继续进行下一次遍历任务。
本发明实施例提供的多动态任务目标点下的无人机路径规划方法,能够根据无人车实时位置信息及时更新最优路径,持续保证决策的优越性。
以下结合附图并通过仿真举例对本发明实施例所提供的技术方案进一步说明。
请参阅图1,信使机制下的无人机/无人车协同系统由1个信使无人机和5个无人车组成,假设无人机的初始位置坐标为(0,0),初始方向为90°,无人车的初始位置坐标分别为(0,10)、(20,0)、(0,20)、(20,20)、(30,12)。假设在执行任务过程中无人机以vA=0.5m/s匀速飞行,无人车保持匀速直线运动,它们的单位方向向量分别为
Figure GDA0002755107960000101
(-1,0)、
Figure GDA0002755107960000102
运动速度为vG=0.02m/s。假设无人机的转弯曲率半径为r=1m,无人车的通讯邻域半径为R=2m,在初始时刻t=0。请参阅图2,本实施例的基于SOM的滚动优化算法为信使机制下的无人机/无人车协同系统进行无人机路径规划包括如下步骤:
首先用无人机和无人车在初始时刻的位置坐标数据训练SOM神经网络,输入P={(0,5),(0,10),(20,0),(0,20),(20,20),(30,12)},r=1m,R=2m,设置参数学习增益σ=10,增益衰减率α=0.005,学习率μ=0.5,其中在第k轮学习时学习增益衰减为σ←(1-αk)σ。第一次学习过程为:
初始化:任意选取两个任务点i、j,满足1≤i<j≤n,n为无人车数量,计算p0、pi、pj三点的几何中心:
Figure GDA0002755107960000103
初始化获胜点:
w0=p0 (13)
Figure GDA0002755107960000104
Figure GDA0002755107960000105
初始化访问序列:
S={s0,s1,s2}={0,i,j} (16)
其中i代表集合P中第i个任务点。假设选取i=1、j=2。
确定获胜点:输入数据p3,确定获胜点。输入层每输入一个数据pm,输出层就要确定一个获胜点wm,并更新访问序列S。获胜点是指在竞争层闭环上与输入样本相似性最高的点,即与目标无人车欧氏距离最小的点,确定获胜点的目的是找到竞争层上与输入样本相似度最高的神经元。计算获胜点的方法是分别计算输入样本与竞争层闭环中每一段线段上距离最短的点,最终在最短距离的集合中取最小值作为输入点与环路的最小距离,与最小距离相对应的闭环上的点即为获胜点。例如,当前闭环是由v个获胜点依次相连而成的,访问顺序为S={s0,s1,…,sv-1},组成闭环的v段线段可以表示为
Figure GDA0002755107960000111
输入数据pm,分别计算任务点pm与每条线段
Figure GDA0002755107960000112
上距离最短的点
Figure GDA0002755107960000113
并从中选取与pm距离最近的点作为本次获胜点wm
Figure GDA0002755107960000114
Figure GDA0002755107960000115
确定访问点:无人机必须访问目标点邻域内的某一点才能与无人车进行通讯,因此获胜点未必是可行解。若访问点落在圆盘形邻域的内部,那么无人机的飞行路径一定会经过邻域边界上的某一点,因此此时的路径不是最短的,从优化路径的角度,将访问点确定在无人车的通讯邻域边界上。获胜点wm、访问点
Figure GDA0002755107960000116
与目标点pm的关系可以用如下公式表示:
Figure GDA0002755107960000117
调整获胜点及其邻近神经元权值:其基本思想是获胜神经元对其邻近神经元的影响从近到远,从兴奋逐渐转变为抑制。采用邻近函数来量化这种影响:
Figure GDA0002755107960000118
按照如下规则调整权值,使得获胜神经元及其邻近神经元携带的权向量与当前训练样本的距离缩小,从而保持数据在输入层的拓扑结构。环路上原节点坐标记作wi,调整后的节点坐标记作wi′。调整规则为:
Figure GDA0002755107960000119
再依次输入数据p4、p5,重复确定获胜点、确定访问点和调整获胜点及其邻近神经元权值步骤,得到竞争层闭环。除了第一次学习过程外,在每轮训练结束时,删除上一轮的n个获胜点,输出层闭环上留下本轮获得的n个获胜点。
提取解决方案:输出层闭环并不是可行路径,需要从中提取无人机可飞路径,步骤如下:
确定飞行方案:按照访问顺序依次连接访问点形成闭环,对于一条环路,无人机有顺时针和逆时针两种飞行方案。采用一种启发式策略确定顺时针或逆时针飞行方案:分别计算无人机的朝向与相邻两条路径之间的夹角,取夹角较小者作为飞行方向。
计算加权路径长度:由于采用滚动优化策略,只把下一个访问点投入实施,因此在计算路径长度时为每一段Dubins路径加权,目的是突出下一个访问点的优先性,越先经过的路径优先级越高,权值越大,访问顺序靠后的路径由于并不会立刻实施而获得较小的权值。加权路径长度计算公式为:
Figure GDA0002755107960000121
更新最优路径:将加权路径长度D与当前最短路径长度Dmin比较,更新最短路径长度Dmin、最优访问顺序Sfinal、最优访问点
Figure GDA0002755107960000122
Figure GDA0002755107960000123
需要指出的是,只有第一次学习过程进行初始化步骤。经过imax=60次上述学习过程并提取解决方案后,得到最优访问顺序Sfinal={1,3,4,5,2}和最优访问点
Figure GDA0002755107960000124
Figure GDA0002755107960000125
因此无人机首先访问无人机UGV1,相应的访问点坐标为(0.5085,11.9343)。
目标点的位置随时间不断变化,若无人机和无人车的运动速度满足vA>vG,,则一定存在时间t*,使得无人机在t*时刻与动态目标点T会合,并且可以用二分法求解t*的数值解。
证明:假设无人机的初始状态为
Figure GDA0002755107960000126
且无人机能够提前获得目标点相关信息:目标点的初始位置为pG(0)=(xG(0),yG(0)),运动轨迹为pG(t)=(xG(t),yG(t)),通讯半径为R0。由此,目标点邻域内的任意一点T(R,β)的初始位置可以表示为pT(0)=pG(0)+(Rcosβ,Rsinβ),运动轨迹可以表示为pT(t)=pG(t)+(Rcosβ,Rsinβ),其中0≤R≤R0,0≤β<2π。下文将证明在vA>vG的条件下,在t*时刻无人机可以与T点会合。
假设无人机可以提前获得T点的运动轨迹,且vA>vG,则存在时间t*,使得无人机在t*时刻与动态目标点T会合,即:
Figure GDA0002755107960000131
Figure GDA0002755107960000132
d2(d)=vAt。d2(t)与时间t呈线性关系,而d1(t)是与目标点轨迹有关的曲线,可以求出d1(t)的极值:
min(d1(t))≤d1(t)≤max(d1(t)) (20)
其中最小值可表示为
Figure GDA0002755107960000133
最大值可表示为
Figure GDA0002755107960000134
由此得到d1(t)和d2(t)的函数图像,图3展示了d1(t)和d2(t)之间的关系,其中灰色区域为d1(t)曲线的可变化范围。
图3说明了d1(t)和d2(t)两条曲线至少存在一个交点,因此一定存在时间t*,使d1(t*)=d2(t*),即式(19)成立,并且满足:
tmin≤t*≤tmax (21)
其中
Figure GDA0002755107960000135
因此,无人机在时间[tmin,tmax]内一定可以与动态目标点T会合。由于t*的解析解难以求得,本文采用二分法给出t*的一个近似的数值解。求解t*的步骤如下:令
Figure GDA0002755107960000136
计算t的上下限的平均值tmid=(tmin+tmax)/2,分别求出f(tmid)和f(tmin);如果f(tmid)f(tmin)≥0,t的范围变为[tmid,tmax],否则t的范围变为[tmin,tmid];重复步骤一和步骤二,直到精度达到要求,例如|f(tmid)|<0.01;t*=tmid,可知无人机在t*时刻与目标点T会合。
数值解t*的精度取决于迭代次数,迭代次数为N时,计算精度可以达到
Figure GDA0002755107960000137
通过上述二分法求解出无人机访问无人车UGV1的用时为t*=18.1884s。根据各个无人车的初始位置信息和运动状态信息可以预估各个无人车在t时刻的位置坐标:(0.1819,10.3150)、(19.6362,0)、(-0.2572,19.7428)、(20.2572,20.2572)、(29.6850,11.8181)。
重复以上步骤,用当前无人机所在位置坐标与预估的尚未访问的无人车位置坐标重新训练SOM神经网络,更新最优访问顺序和访问点。无人机完成四次遍历任务的仿真结果请参阅图4至图7。
本发明上述实施例提供的一种多动态任务目标点下的无人机路径规划方法,包括如下步骤:训练SOM神经网络,确定获胜点、访问点及访问序列;确定飞行方向以及最优路径;迭代;滚动优化。本发明针对信使机制下的无人机路径规划问题,无人机需要周期性地遍历所有无人车并进行信息交换,考虑无人机的运动曲率约束、无人车的动态特性以及无人车的通讯范围等约束条件,利用无监督的竞争型神经网络SOM求解访问顺序和访问点,优化无人机的飞行路径,并在无人机遍历无人车的过程中采用滚动优化策略,使无人机每次访问一个无人车后重新求解优化问题,从而实现在无人机访问的过程中动态地更新最优路径,持续保证决策的优越性。
以上仅为发明的较佳实例而已,并非用来限定本发明的实施范围。即凡依本发明申请专利范围的内容所作的等效变化与修饰,都应该为本发明的技术范畴。

Claims (6)

1.一种多动态任务目标点下的无人机路径规划方法,其特征在于,包括如下步骤:
S1,确认获胜点、访问点和访问序列:
输入无人机和无人车的位置坐标集合P,训练SOM神经网络,输出获胜点、访问点和访问序列;
初始化:输入无人机位置坐标和任意多个无人车位置坐标,把竞争层初始化为环形结构,并把竞争层携带的权向量初始化为环形上获胜点的位置坐标;
依次输入集合P中的其他目标点坐标,输入层每输入一个目标点pm,输出层确定一个获胜点wm、更新访问序列S、确定访问点
Figure FDA0002164566850000011
并调整获胜点wi′及其邻近节点;
确定获胜点:获胜点是指在竞争层环形结构上与输入样本相似性最高的点,即与目标无人车欧氏距离最小的点;
更新访问序列:假设获胜点
Figure FDA0002164566850000012
其中sj为序列S中的第j个元素,则将序号m插入到sj和sj+1之间;
确定访问点:获胜点wm、访问点
Figure FDA0002164566850000013
与目标点pm的关系如下所示:
Figure FDA0002164566850000014
其中,R为目标点的通讯邻域半径,∈是一个常数,用于确保访问点
Figure FDA0002164566850000015
在目标点pm的邻域范围内能够正常通讯;
调整获胜点wm及其邻近节点权值:采用邻近函数f(σ,d)量化获胜点wm对其临近节点的影响:
Figure FDA0002164566850000016
其中,η是一个小于1的常数,M是当前环形结构中的节点总数,σ为学习增益,d是邻近节点与获胜点wm之间的距离,即两点之间相隔节点数;与获胜点wm之间的距离大于等于ηM的节点将不会移动,仅把获胜点wm左右[ηM]个节点纳入调整范围;
环形结构上原节点坐标记作wi,调整后的节点坐标记作wi′,则调整获胜点及其邻近节点权值的规则为:
Figure FDA0002164566850000021
其中,μ为学习率,μf(σ,d)决定了节点的调整幅度大小;
S2,确定飞行方向以及最优路径:
提取解决方案:在每轮训练结束时,删除上一轮的n个获胜点,输出层环形结构上留下本轮获得的n个获胜点,同时获得n个相应的访问点以及访问序列S;
确定飞行方向:按照访问序列依次连接访问点形成闭环,对于每一条闭环环路,采用启发式方法确定顺时针或逆时针飞行方向;
计算加权路径长度:在计算路径长度时为每一段Dubins路径加权,加权路径长度D的计算方法为:
Figure FDA0002164566850000022
其中,
Figure FDA0002164566850000023
为序号为si的无人车对应的访问点位置坐标,
Figure FDA0002164566850000024
为无人机在
Figure FDA0002164566850000025
处的航向,
Figure FDA0002164566850000026
为给定起点状态和终点位置的最短Dubins路径长度,n为集合P的元素数量;
更新最优路径:将加权路径长度D与当前最短路径长度Dmin比较,更新最短路径长度Dmin、最优访问序列Sfinal、最优访问点
Figure FDA0002164566850000027
为:
Figure FDA0002164566850000028
其中,P*为访问点集合;
S3,迭代:有限次迭代S1和S2,得到最终的最优访问序列Sfinal和最优访问点
Figure FDA0002164566850000029
S4,滚动优化:无人机每次访问一个无人车后重新预估所有无人车的位置,重复S1~S3,直至遍历所有无人车。
2.根据权利要求1所述的多动态任务目标点下的无人机路径规划方法,其特征在于,∈=0.001。
3.根据权利要求1所述的多动态任务目标点下的无人机路径规划方法,其特征在于,η=0.2。
4.根据权利要求1所述的多动态任务目标点下的无人机路径规划方法,其特征在于,采用启发式方法确定顺时针或逆时针飞行方向,具体为:分别计算无人机的朝向与相邻两条路径之间的夹角,取夹角较小者作为飞行方向。
5.根据权利要求1所述的多动态任务目标点下的无人机路径规划方法,其特征在于,S4中,在重复S1~S3的优化过程中,只把尚未访问的无人车纳入求解范围;即,对于n个无人车,无人机的一次遍历任务中共需要进行n-1次优化问题的求解,每次求解涉及的无人车数量分别为n、n-1、n-2、…、2。
6.根据权利要求1至5中任一项所述的多动态任务目标点下的无人机路径规划方法,其特征在于,在无人机的一次遍历任务完成后,待访问的无人车数量恢复为n,继续进行下一次遍历任务。
CN201910742860.5A 2019-08-13 2019-08-13 多动态任务目标点下的无人机路径规划方法 Active CN110470301B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910742860.5A CN110470301B (zh) 2019-08-13 2019-08-13 多动态任务目标点下的无人机路径规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910742860.5A CN110470301B (zh) 2019-08-13 2019-08-13 多动态任务目标点下的无人机路径规划方法

Publications (2)

Publication Number Publication Date
CN110470301A CN110470301A (zh) 2019-11-19
CN110470301B true CN110470301B (zh) 2020-12-11

Family

ID=68510573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910742860.5A Active CN110470301B (zh) 2019-08-13 2019-08-13 多动态任务目标点下的无人机路径规划方法

Country Status (1)

Country Link
CN (1) CN110470301B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111105190B (zh) * 2019-12-12 2024-01-23 北京旷视机器人技术有限公司 站点访问顺序的确定方法、装置及电子设备
CN111123963B (zh) * 2019-12-19 2021-06-08 南京航空航天大学 基于强化学习的未知环境自主导航系统及方法
CN113009884B (zh) * 2019-12-19 2022-06-21 广州极飞科技股份有限公司 无人设备的作业控制方法、装置、设备及存储介质
CN111144827B (zh) * 2020-01-21 2022-10-18 重庆邮电大学 基于历史增益估计的无人机巡航路径动态规划方法
CN111984031B (zh) * 2020-07-20 2023-09-26 鹏城实验室 一种无人机路径规划方法、无人机及存储介质
CN114578842B (zh) * 2020-11-30 2023-04-21 南京理工大学 一种无人车载旋翼无人机集群侦察的协同路径规划方法
CN112578812B (zh) * 2020-12-01 2023-02-03 一飞(海南)科技有限公司 无人机编队、路径规划目标点交换方法、系统、介质及终端
CN112882380B (zh) * 2021-01-07 2022-06-14 上海交通大学 时序逻辑任务下多无人艇系统协同控制方法、终端及介质
CN112947555B (zh) * 2021-02-04 2022-06-14 中国人民解放军国防科技大学 多机协同打击的快速航迹规划方法、装置及计算机设备
CN114003059B (zh) * 2021-11-01 2024-04-16 河海大学常州校区 运动学约束条件下基于深度强化学习的uav路径规划方法
CN114510072B (zh) * 2022-01-18 2022-12-06 香港理工大学深圳研究院 基于进化迁移优化的多无人机路径规划方法、终端及介质
CN115171432B (zh) * 2022-06-29 2024-05-03 中国航空无线电电子研究所 基于要求到达时间和性能预测的速度求解方法及系统
CN115237157B (zh) * 2022-08-08 2024-01-23 南京理工大学 一种路网约束下的空地无人集群多任务点路径规划方法
CN115574826B (zh) * 2022-12-08 2023-04-07 南开大学 基于强化学习的国家公园无人机巡护路径优化方法
CN116540784B (zh) * 2023-06-28 2023-09-19 西北工业大学 一种基于视觉的无人系统空地协同导航与避障方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2561745A1 (en) * 2004-04-05 2005-10-27 Motorola, Inc. Method for enabling communications dependent on user location, user-specified location, or orientation

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106643721B (zh) * 2016-10-11 2020-04-03 北京工业大学 一种环境拓扑地图的构建方法
CN108170147B (zh) * 2017-12-31 2020-10-16 南京邮电大学 一种基于自组织神经网络的无人机任务规划方法
CN108985563B (zh) * 2018-06-12 2021-05-28 西安交通大学 一种基于自组织特征映射的机电系统服役动态标记方法
CN110006428A (zh) * 2019-01-21 2019-07-12 武汉大学 一种基于无人机能量的覆盖路径规划方法及装置
CN109839933B (zh) * 2019-02-20 2022-04-29 哈尔滨工程大学 一种基于vdsom算法的多机器人任务分配方法
CN109799829B (zh) * 2019-02-28 2020-06-02 清华大学 一种基于自组织映射的机器人群体协同主动感知方法
CN110034596B (zh) * 2019-04-10 2022-08-19 河海大学常州校区 WRSNs中基于SOM神经网络的多基站充电方法
CN110053052B (zh) * 2019-05-28 2021-02-09 北京理工大学 多层som异构焊接机器人的任务分配与路径规划方法
CN110083166A (zh) * 2019-05-30 2019-08-02 浙江远传信息技术股份有限公司 针对多机器人的协同调度方法、装置、设备及介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2561745A1 (en) * 2004-04-05 2005-10-27 Motorola, Inc. Method for enabling communications dependent on user location, user-specified location, or orientation

Also Published As

Publication number Publication date
CN110470301A (zh) 2019-11-19

Similar Documents

Publication Publication Date Title
CN110470301B (zh) 多动态任务目标点下的无人机路径规划方法
US11727812B2 (en) Airplane flight path planning method and device based on the pigeon-inspired optimization
CN111351488B (zh) 飞行器智能轨迹重构再入制导方法
CN110703766B (zh) 一种基于迁移学习策略深度q网络的无人机路径规划方法
CN113110592A (zh) 一种无人机避障与路径规划方法
CN112511250B (zh) 一种基于drl的多无人机空中基站动态部署方法及系统
CN110442129B (zh) 一种多智能体编队的控制方法和系统
CN108919818B (zh) 基于混沌种群变异pio的航天器姿态轨道协同规划方法
CN113377131B (zh) 一种使用强化学习获得无人机收集数据轨迹的方法
CN113268074B (zh) 一种基于联合优化的无人机航迹规划方法
CN112363539B (zh) 多无人机协同目标搜索方法
CN114167898B (zh) 一种无人机收集数据的全局路径规划方法及系统
CN115016534A (zh) 一种基于记忆增强学习的无人机自主避障导航方法
CN115060263A (zh) 一种考虑低空风和无人机能耗的航迹规划方法
Wang et al. 3M-RL: Multi-resolution, multi-agent, mean-field reinforcement learning for autonomous UAV routing
CN114859932A (zh) 基于强化学习的探索方法、装置和智能设备
Wang et al. Oracle-guided deep reinforcement learning for large-scale multi-UAVs flocking and navigation
CN113805609A (zh) 一种混沌迷失鸽群优化机制的无人机群目标搜索方法
CN112770256A (zh) 一种无人机自组织网络中的节点轨迹预测方法
CN116321237A (zh) 一种基于深度强化学习的无人机辅助车联网数据收集方法
CN114326826B (zh) 多无人机队形变换方法及系统
Wu et al. An adaptive conversion speed Q-learning algorithm for search and rescue UAV path planning in unknown environments
CN115202357A (zh) 一种基于脉冲神经网络的自主建图方法
CN114997306A (zh) 一种基于动态贝叶斯网络的目标意图识别方法
Leng et al. Multi-agent reward-iteration fuzzy Q-learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant