CN114167898A - 一种无人机收集数据的全局路径规划方法及系统 - Google Patents

一种无人机收集数据的全局路径规划方法及系统 Download PDF

Info

Publication number
CN114167898A
CN114167898A CN202111538873.4A CN202111538873A CN114167898A CN 114167898 A CN114167898 A CN 114167898A CN 202111538873 A CN202111538873 A CN 202111538873A CN 114167898 A CN114167898 A CN 114167898A
Authority
CN
China
Prior art keywords
sensor
unmanned aerial
aerial vehicle
path planning
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111538873.4A
Other languages
English (en)
Other versions
CN114167898B (zh
Inventor
张荣涛
郝洁
邓海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202111538873.4A priority Critical patent/CN114167898B/zh
Publication of CN114167898A publication Critical patent/CN114167898A/zh
Application granted granted Critical
Publication of CN114167898B publication Critical patent/CN114167898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/106Change initiated in response to external conditions, e.g. avoidance of elevated terrain or of no-fly zones

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明涉及一种无人机收集数据的全局路径规划方法及系统,方法包括:以最大化数据收集收益和最小化数据收集过程花费时间为目标构建多目标无人机全局路径规划问题;采用分解策略将多目标无人机全局路径规划问题分解为多个子问题,并构建每个子问题对应的模型;采用各模型对多目标全局路径规划问题进行求解,得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序;基于领域的参数转移策略和演员评论家算法,对每个子问题的参数进行协同优化,获得各子问题对应的最优参数;基于各子问题对应的最优参数确定帕累托最优的路径规划集合。本发明公开的方案实现在最小化无人机收集传感器数据花费时间的同时,最大化数据收集收益。

Description

一种无人机收集数据的全局路径规划方法及系统
技术领域
本发明涉及路径规划技术领域,特别是涉及一种无人机收集数据的全局路径规划方法及系统。
背景技术
与组建无线传感网进行数据收集的方法相比,基于无人机的数据收集方法具有很大的优势。首先,基于无人机的数据收集方法不需要构建昂贵的无线传感网络。基于无线传感网数据收集方法需要通过组建的自组网,将自身采集的传感器数据经过多跳上传到数据中心,这需要昂贵的资金来进行自组网络的构建。尤其在一些自然环境恶劣的地方,构建自组网的经济代价和经济效益严重失衡。
另外,无人机收集数据过程中考虑的目标不止一个,综合考虑数据收集收益和数据收集时间代价。前者只关注收集数据量,后者涉及飞行距离和数据收集速率。显然这两个方面是相互冲突,因为更少的收据收集时间会导致数据收集量减少,从而减少数据收集收益。如何综合地对多种条件作取舍,得到一个可行的多目标无人机数据收集路径是本领域亟需解决的技术问题。
发明内容
本发明的目的是提供一种无人机收集数据的全局路径规划方法及系统,以实现在最小化无人机收集传感器数据花费时间的同时,最大化数据收集收益。
为实现上述目的,本发明提供了一种无人机收集数据的全局路径规划方法,所述方法包括:
S1:以最大化数据收集收益和最小化数据收集过程花费时间为目标,基于无人机系统模型构建多目标无人机全局路径规划问题;
S2:采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题,并构建每个子问题对应的指针网络深度学习神经模型;
S3:采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解,得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序;
S4:基于领域的参数转移策略和演员评论家算法,对每个子问题的参数进行协同优化,获得各子问题对应的最优参数;
S5:基于各子问题对应的最优参数确定帕累托最优的解。
可选地,S1具体包括:
S11:对各传感器节点按照二维地理位置进行分簇,获得多个簇;
S12:以不同的顺序访问各簇的过程中,以最大化数据收集收益和最小化数据收集过程中花费时间为目标,构建多目标无人机全局路径规划问题。
可选地,所述构建多目标无人机全局路径规划问题,具体计算公式为:
Figure BDA0003413329730000021
Figure BDA0003413329730000022
Figure BDA0003413329730000023
Figure BDA0003413329730000024
其中,f1表示在无人机收集数据的过程中期望收集到的数据,D表示这些簇内包含的数据量,D=[d1,d2,...,dk,...]T,dk表示第k个访问的簇中拥有的数据量,ρ表示访问这些簇的顺序,N表示总簇个数,f2表示无人机在收集传感器数据的过程中所花的时间,tcol表示无人机在传感器节点收集数据所花费的时间,ε表示无人机收集传感器数据的数据传输速率,ttra表示无人机收集数据的过程中访问不同传感器物理位置所花的时间,dist(ρ(k),ρ(k+1))表示第k个传感器节点ρ(k)与第k+1个传感器节点ρ(k+1)之间的物理距离,v表示无人机的飞行速度,n表示无人机访问传感器的个数。
可选地,S3具体包括:
使用注意力机制计算访问每个传感器簇的概率大小,选择概率最大的传感器簇作为下一次访问的簇,直到数量为总传感器簇一半时停止访问,获得收集传感器簇的集合及访问顺序。
可选地,使用注意力机制计算访问每个传感器簇的概率大小,具体公式为:
Figure BDA0003413329730000031
P(ρt+11,...,ρt,Xt)=softmax(ut)
其中,
Figure BDA0003413329730000032
表示t时刻第j个传感器簇被选中的概率,W1、W2和W3表示可训练参数,ht表示t时刻时已经访问过的传感器簇节点信息,ej表示第j个传感器簇节点经过编码器编码后的隐藏状态,ρt表示聚类之后第t个访问的传感器簇的信息,Xt表示传感器簇的地理位置信息和数据量信息,ut表示t时刻各个传感器簇被选中的概率,tanh()表示一种激活函数,将值压缩在-1到+1之间,softmax()表示将计算出的访问各传感器簇节点的概率值映射到0和1之间,取概率最大的传感器簇节点作为下一个访问目标,P()表示访问每个传感器簇的条件概率。
本发明还提供一种无人机收集数据的全局路径规划系统,所述系统包括:
全局路径规划问题构建模块,用于以最大化数据收集收益和最小化数据收集过程花费时间为目标,基于无人机系统模型构建多目标无人机全局路径规划问题;
指针网络深度学习神经模型构建模块,用于采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题,并构建每个子问题对应的指针网络深度学习神经模型;
求解模块,用于采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解,得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序;
协同优化模块,用于基于领域的参数转移策略和演员评论家算法,对每个子问题的参数进行协同优化,获得各子问题对应的最优参数;
帕累托最优解确定模块,用于基于各子问题对应的最优参数确定帕累托最优的解。
可选地,所述全局路径规划问题构建模块具体包括:
分簇单元,用于对各传感器节点按照二维地理位置进行分簇,获得多个簇;
全局路径规划问题构建单元,用于以不同的顺序访问各簇的过程中,以最大化数据收集收益和最小化数据收集过程中花费时间为目标,构建多目标无人机全局路径规划问题。
可选地,所述构建多目标无人机全局路径规划问题,具体计算公式为:
Figure BDA0003413329730000041
Figure BDA0003413329730000042
Figure BDA0003413329730000043
Figure BDA0003413329730000044
其中,f1表示在无人机收集数据的过程中期望收集到的数据,D表示这些簇内包含的数据量,D=[d1,d2,...,dk,...]T,dk表示第k个访问的簇中拥有的数据量,ρ表示访问这些簇的顺序,N表示总簇个数,f2表示无人机在收集传感器数据的过程中所花的时间,tcol表示无人机在传感器节点收集数据所花费的时间,ε表示无人机收集传感器数据的数据传输速率,ttra表示无人机收集数据的过程中访问不同传感器物理位置所花的时间,dist(ρ(k),ρ(k+1))表示第k个传感器节点ρ(k)与第k+1个传感器节点ρ(k+1)之间的物理距离,v表示无人机的飞行速度,n表示无人机访问传感器节点的个数。
可选地,所述求解模块具体包括:
使用注意力机制计算访问每个传感器簇的概率大小,选择概率最大的传感器簇作为下一次访问的簇,直到数量为总传感器簇一半时停止访问,获得收集传感器簇的集合及访问顺序。
可选地,使用注意力机制计算访问每个传感器簇的概率大小,具体公式为:
Figure BDA0003413329730000051
P(ρt+11,...,ρt,Xt)=softmax(ut)
其中,ut j表示t时刻第j个传感器簇被选中的概率,W1、W2和W3表示可训练参数,ht表示t时刻时已经访问过的传感器簇节点信息,ej表示第j个传感器簇节点经过编码器编码后的隐藏状态,ρt表示聚类之后第t个访问的传感器簇的信息,Xt表示传感器簇的地理位置信息和数据量信息,ut表示t时刻各个传感器簇被选中的概率,tanh()表示一种激活函数,将值压缩在-1到+1之间,softmax()表示将计算出的访问各传感器簇节点的概率值映射到0和1之间,取概率最大的传感器簇节点作为下一个访问目标,P()表示访问每个传感器簇的条件概率。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明涉及一种无人机收集数据的全局路径规划方法及系统,方法包括:以最大化数据收集收益和最小化数据收集过程花费时间为目标构建多目标无人机全局路径规划问题;采用分解策略将多目标无人机全局路径规划问题分解为多个子问题,并构建每个子问题对应的模型;采用各模型对多目标全局路径规划问题进行求解,得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序;基于领域的参数转移策略和演员评论家算法,对每个子问题的参数进行协同优化,获得各子问题对应的最优参数;基于各子问题对应的最优参数确定帕累托最优的路径规划集合。本发明公开的方案实现在最小化无人机收集传感器数据花费时间的同时,最大化数据收集收益。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明无人机收集数据的全局路径规划方法流程图;
图2为本发明无人机收集数据的全局路径规划系统结构图;
图3为随机生成的50个双目标传感器簇全局路径规划方法对比示意图一;
图4为随机生成的50个双目标传感器簇全局路径规划方法对比示意图二;
图5为随机生成的40个双目标传感器簇全局路径规划方法对比示意图一;
图6为随机生成的40个双目标传感器簇全局路径规划方法对比示意图二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种无人机收集数据的全局路径规划方法及系统,以实现在最小化无人机收集传感器数据花费时间的同时,最大化数据收集收益。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
如图1所示,本发明公开一种无人机收集数据的全局路径规划方法,所述方法包括:
S1:以最大化数据收集收益和最小化数据收集过程花费时间为目标,基于无人机系统模型构建多目标无人机全局路径规划问题。
S2:采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题,并构建每个子问题对应的指针网络深度学习神经模型。
S3:采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解,得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序。
S4:基于领域的参数转移策略和演员评论家算法,对每个子问题的参数进行协同优化,获得各子问题对应的最优参数。
S5:基于各子问题对应的最优参数确定帕累托最优的解。
下面对各个步骤进行详细论述:
在步骤S1之前,方法还包括:
建立多目标传感器数据收集网络的无人机系统模型;无人机系统模型包括一架无人机、和等待无人机收集数据的传感器节点,无人机一次只能收集一个传感器的数据,且同一个传感器节点最多只会访问一次。
传感器节点的位置随机分布在地图上,也可根据任务需求人为改变安装位置。传感器信息分为二维物理坐标信息和存储数据量信息。传感器随机分布在面积为100平方千米的地图上,每个传感器都携带一定数量的数据。传感器的位置信息由历史经验数据分析得到,也可以采用节点定位技术人为地获取和更新。
S1:以最大化数据收集收益和最小化数据收集过程花费时间为目标,基于无人机系统模型构建多目标无人机全局路径规划问题,具体包括:
S11:对各传感器节点按照二维地理位置进行分簇,获得多个簇;
S12:以不同的顺序访问各簇的过程中,以最大化数据收集收益和最小化数据收集过程中花费时间为目标,构建多目标无人机全局路径规划问题,具体计算公式为:
Figure BDA0003413329730000071
Figure BDA0003413329730000072
Figure BDA0003413329730000081
Figure BDA0003413329730000082
其中,f1表示在无人机收集数据的过程中期望收集到的数据,D表示这些簇内包含的数据量,D=[d1,d2,...,dk,...]T,dk表示第k个访问的簇中拥有的数据量,ρ表示访问这些簇的顺序,ρ=[ρ12,...,ρk,...]T,ρk表示聚类之后第k个访问的传感器簇的信息,N表示总簇个数,f2表示无人机在收集传感器数据的过程中所花的时间,tcol表示无人机在传感器节点收集数据所花费的时间,ε表示无人机收集传感器数据的数据传输速率,ttra表示无人机收集数据的过程中访问不同传感器物理位置所花的时间,dist(ρ(k),ρ(k+1))表示第k个传感器节点ρ(k)与第k+1个传感器节点ρ(k+1)之间的物理距离,这里使用欧几里得距离,v表示无人机的飞行速度,n表示无人机访问传感器簇节点的个数。
S2:采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题,并构建每个子问题对应的指针网络深度学习神经模型,具体包括:
S21:采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题,具体公式为:
Figure BDA0003413329730000083
其中,D表示这些簇内包含的数据量,ρ表示访问这些簇的顺序,λi表示第i个子问题对应的权重向量,
Figure BDA0003413329730000084
i=0,1,...,M,
Figure BDA0003413329730000085
M=100,f表示综合考虑f1和f2,研究对两个目标函数关注程度不同的时候得到帕累托最优解。f1表示在无人机收集数据的过程中期望收集到的数据量,f2表示无人机在收集传感器数据的过程中所花的时间。
本实施例中,f1要求尽量地多,f2要求尽量地少,使用分解策略来解决多目标优化问题,将多目标优化问题分解为一系列标量优化子问题,用子目标相互协同的方式来解决。求解所有的标量优化子问题后,可以得到期望的帕累托前沿。定义一组均匀的权重向量λ01,...,λM,其中,M=100,
Figure BDA0003413329730000091
根据不同的λ,把原始的多目标优化问题分解为M+1个标量子优化问题。其中,
Figure BDA0003413329730000092
,i=0,1,...,100
Figure BDA0003413329730000093
S22:构建每个子问题对应的指针网络深度学习神经模型,具体公式为:
Pi=[ωi,bi] (6)
其中,Pi表示第i个子问题的参数,ωi表示可训练参数,bi表示偏置项,i=0,1,...,M。
网络的输入是传感器节点聚合后形成的簇的信息,用X表示,X={x1,...,xN}。其中,xi表示第i个簇的地理位置信息和数据量信息构成的元组,xi=(ai,bi,di)。ai表示第i个簇的水平坐标信息,bi表示第i个簇的垂直坐标信息,di表示第i个簇的数据量信息。网络的输出是按照一定顺序所要访问的簇的信息,用Y表示,Y={ρt,t=1,...,T},T是决策步骤的长度,在这里是总簇数的一半。
S3:采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解,得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序。具体地,使用注意力机制计算访问每个传感器簇的概率,选择概率最大的传感器簇作为下一次访问的簇,直到数量为总传感器簇一半时停止访问,获得收集传感器簇的集合及访问顺序。
指针网络深度学习神经模型根据每次输入的传感器簇信息和之前所收集的传感器簇的信息决定下一个所要访问的传感器簇,直到得到一个数量为总传感器簇一半的访问序列。
访问序列的产生遵循概率链式法则:
Figure BDA0003413329730000094
指针网络深度学习神经模型由编码器和解码器组成,两者都是RNN循环神经网络。编码器的作用是将输入的低维向量xj映射为高维向量ej输出。解码器的作用是依据编码器输出的高维向量ej得到传感器簇的访问序列。解码器的输入是上一步所选的传感器簇的信息,输出是访问每一个传感器簇的概率。我们使用解码器的中间隐藏变量ht,其中包含之前步骤所选择的传感器簇ρ1,...ρt的信息,然后结合编码器的输出e1,...et,按照公式(7)来计算得出下一次访问各传感器簇的概率。该计算过程具体使用注意力机制实现。注意力机制会分别计算访问每个传感器簇的概率大小,选择概率最大的簇作为下一次访问的簇。
本发明使用注意力机制计算访问每个传感器簇的概率大小,具体公式如下:
Figure BDA0003413329730000101
P(ρt+11,...,ρt,Xt)=softmax(ut) (9)
其中,
Figure BDA0003413329730000102
表示t时刻第j个传感器簇被选中的概率,W1、W2和W3表示可训练参数。ht表示t时刻时已经访问过的传感器簇节点信息,ej表示第j个传感器簇节点经过编码器编码后的隐藏状态,ρt表示聚类之后第t个访问的传感器簇的信息,Xt表示传感器簇的地理位置信息和数据量信息,ut表示t时刻各个传感器簇被选中的概率,tanh()表示一种激活函数,将值压缩在-1到+1之间,softmax()表示将计算出的访问各传感器簇节点的概率值映射到0和1之间,取概率最大的传感器簇节点作为下一个访问目标,P()表示访问每个传感器簇的条件概率。
公式(8)和公式(9)是对公式(7)的具体实现,公式(7)中ej对应公式(7)中的Xt,表示的是传感器簇的地理位置信息和数据量信息,公式(8)中ht对应公式(7)中的ρ1,...ρt,W1、W2和W3是网络中注意力机制部分要训练的参数。
S4:基于领域的参数转移策略和演员评论家算法,对每个子问题的参数进行协同优化,获得各子问题对应的最优参数。
基于领域参数传递的多目标深度强化学习算法如下算法1所示。用P表示多目标优化问题分解出的M+1个子问题建模成的神经网络的参数,P=[ω,b],深度学习中常用ω,b来表示一个模型的参数。按照不同的λi把多目标优化问题分解成子问题,每一个子问题使用演员评论家算法(算法2)训练得到最优参数
Figure BDA0003413329730000111
在训练下一个子问题之前,用当前训练好的
Figure BDA0003413329730000112
对下一个子问题模型的参数进行初始化,再使用算法2得到期望的模型最优参数
Figure BDA0003413329730000113
为了防止混淆,这里说明:上面提到的W1、W2和W3是模型中注意力机制部分的参数,也就是说W1、W2和W3是ω,b的一部分;在算法1的求解过程中使用到了算法2,算法2是算法1的一部分。
Figure BDA0003413329730000114
Figure BDA0003413329730000121
本发明使用演员评论家算法对子问题进行训练求解。演员评论家算法实际上包含两个网络:(Ⅰ)演员网络,在这里就是之前描述的指针网络,用来计算下一次访问各传感器簇的概率。(Ⅱ)评论家网络,用来估计每个问题状态的奖励。算法2描述了训练过程。
训练是以无监督方式进行的,θ,
Figure BDA0003413329730000122
均是多目标优化问题分解出的标量子问题对应的神经网络的初始参数。θ代表演员网络参数,也就是上文提到的编码器解码器网络。
Figure BDA0003413329730000123
代表评论家网络的参数。S表示样本数目。
Figure BDA0003413329730000124
表示第k个样本在t+1时刻访问的传感器簇节点。
Figure BDA0003413329730000125
表示求梯度操作。η表示学习率。
Figure BDA0003413329730000126
当表示第k个样本在初始时刻的状态。算法2首先从
Figure BDA0003413329730000127
中生成S个多目标传感器簇数据样本实例,这里M代表不同的传感器簇的输入特征,例如传感器簇的物理横坐标、物理纵坐标、数据量。M1、M2和M3分别是物理坐标信息和数据量,
Figure BDA0003413329730000128
Figure BDA0003413329730000129
可以用标准正太分布[0,1]表示。当未满足终止条件时,利用公式(8)和公式(9)求解下一个应该访问的传感器节点。当传感器簇节点的数量满足要求时,根据演员网络产生传感器簇的访问顺序和公式(5)可以计算出奖励值当前样本的奖励值Rk,然后评论家网络估计出一个奖励值V(·)。最后按照策略梯度算法,以减小演员网络求解得到的奖励Rk和评论家网络估计出的奖励V(·)和样本k真实奖励Rk之间差距为目标,分别按照学习率η更新演员网络和评论家网络,完成训练过程。
Figure BDA00034133297300001210
Figure BDA0003413329730000131
S5:基于各子问题对应的最优参数确定帕累托最优的解。
步骤S4完成之后,会得到每个子问题训练好的权重,即最优参数
Figure BDA0003413329730000132
i=0,1,...,M,每个子问题网络加载各自的权重,输入无人机簇地理位置坐标和数据量信息X={x1,x2,...,xi,...},xi=(ai,bi,di),i=1,2,...,N,得到每个子问题的解输出Yi={ρt,t=1,...,T},i=0,1,...,M。Yi是访问无人机簇的顺序。综合M个无人机簇访问顺序Yi在目标函数f1、f2上的结果,得到帕累托最优的解,从而得知在多目标无人机收集数据全局路径规划问题中,当对多个目标的关注程度不同时,按怎样的序列访问无人机簇才能达到帕累托最优。
实施例2
如图2所示,本发明还提供一种无人机收集数据的全局路径规划系统,所述系统包括:
全局路径规划问题构建模块201,用于以最大化数据收集收益和最小化数据收集过程花费时间为目标,基于无人机系统模型构建多目标无人机全局路径规划问题。
指针网络深度学习神经模型构建模块202,用于采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题,并构建每个子问题对应的指针网络深度学习神经模型。
求解模块203,用于采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解,得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序。
协同优化模块204,用于基于领域的参数转移策略和演员评论家算法,对每个子问题的参数进行协同优化,获得各子问题对应的最优参数。
帕累托最优解确定模块205,用于基于各子问题对应的最优参数确定帕累托最优的解。
作为一种可选的实施方式,本发明所述全局路径规划问题构建模块201具体包括:
分簇单元,用于对各传感器节点按照二维地理位置进行分簇,获得多个簇;
全局路径规划问题构建单元,用于以不同的顺序访问各簇的过程中,以最大化数据收集收益和最小化数据收集过程中花费时间为目标,构建多目标无人机全局路径规划问题。
实施例3
图3为随机生成的50个双目标传感器簇全局路径规划方法对比示意图一:本发明方法获得的帕累托前沿(即帕累托最优的解)和传统启发式算法NSGA-Ⅱ上运行500、1000、2000和4000轮获得的帕累托前沿比较。
图4为随机生成的50个双目标传感器簇全局路径规划方法对比示意图二:本发明方法获得的帕累托前沿和传统启发式算法MOEAD上运行500、1000、2000和4000轮获得的帕累托前沿比较。
图5为随机生成的40个双目标传感器簇全局路径规划方法对比示意图一:本发明方法获得的帕累托前沿和传统启发式算法NSGA-Ⅱ上运行500、1000、2000和4000轮获得的帕累托前沿比较。
图6为随机生成的40个双目标传感器簇全局路径规划方法对比示意图二:本发明方法获得的帕累托前沿和传统启发式算法MOEAD上运行500、1000、2000和4000轮获得的帕累托前沿比较。
图3-图6中可以看出,本发明的方法与两种传统启发式算法相比,可以获得更好的帕累托前沿,获得更好的收敛性和多样性。另外,一旦模型训练好,本发明的算法可以快速求得帕累托前沿。且由于指针神经网络的优越性,一旦传感器簇的数量发生变化,本算法不需要重新训练,可以直接快速求解出在传感器簇数量变化的新场景下的帕累托前沿,而传统启发式算法需要重新训练。
表1为本发明使用的算法和两种启发式算法NSGA-Ⅱ和MOEAD在运行时间上的比较。
表1
Figure BDA0003413329730000151
Figure BDA0003413329730000161
由表1可知,本发明方法使用的算法在时间开销方面也优于其他两种启发式算法。DRL-MOA代表本发明使用的算法,其运行时间不包括模型训练的时间。DRL-MOA一旦训练好,可以快速地求解出帕累托前沿,且对传感器簇数量变化具有鲁棒性。而传统启发式算法运行虽然可以增加迭代次数改进运行效果,但是所付出的时间开销非常大,且效果提升很小,且一旦传感器簇的数量发生变化,需要重新获取数据从头训练。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

Claims (10)

1.一种无人机收集数据的全局路径规划方法,其特征在于,所述方法包括:
S1:以最大化数据收集收益和最小化数据收集过程花费时间为目标,基于无人机系统模型构建多目标无人机全局路径规划问题;
S2:采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题,并构建每个子问题对应的指针网络深度学习神经模型;
S3:采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解,得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序;
S4:基于领域的参数转移策略和演员评论家算法,对每个子问题的参数进行协同优化,获得各子问题对应的最优参数;
S5:基于各子问题对应的最优参数确定帕累托最优的解。
2.根据权利要求1所述的无人机收集数据的全局路径规划方法,其特征在于,S1具体包括:
S11:对各传感器节点按照二维地理位置进行分簇,获得多个簇;
S12:以不同的顺序访问各簇的过程中,以最大化数据收集收益和最小化数据收集过程中花费时间为目标,构建多目标无人机全局路径规划问题。
3.根据权利要求2所述的无人机收集数据的全局路径规划方法,其特征在于,所述构建多目标无人机全局路径规划问题,具体计算公式为:
Figure FDA0003413329720000011
Figure FDA0003413329720000012
Figure FDA0003413329720000013
Figure FDA0003413329720000021
其中,f1表示在无人机收集数据的过程中期望收集到的数据,D表示这些簇内包含的数据量,D=[d1,d2,...,dk,...]T,dk表示第k个访问的簇中拥有的数据量,ρ表示访问这些簇的顺序,N表示总簇个数,f2表示无人机在收集传感器数据的过程中所花的时间,tcol表示无人机在传感器节点收集数据所花费的时间,ε表示无人机收集传感器数据的数据传输速率,ttra表示无人机收集数据的过程中访问不同传感器物理位置所花的时间,dist(ρ(k),ρ(k+1))表示第k个传感器节点ρ(k)与第k+1个传感器节点ρ(k+1)之间的物理距离,v表示无人机的飞行速度,n表示无人机访问传感器节点的个数。
4.根据权利要求1所述的无人机收集数据的全局路径规划方法,其特征在于,S3具体包括:
使用注意力机制计算访问每个传感器簇的概率大小,选择概率最大的传感器簇作为下一次访问的簇,直到数量为总传感器簇一半时停止访问,获得收集传感器簇的集合及访问顺序。
5.根据权利要求4所述的无人机收集数据的全局路径规划方法,其特征在于,使用注意力机制计算访问每个传感器簇的概率大小,具体公式为:
Figure FDA0003413329720000022
P(ρt+11,...,ρt,Xt)=softmax(ut)
其中,
Figure FDA0003413329720000023
表示t时刻第j个传感器簇被选中的概率,W1、W2和W3表示可训练参数,dt表示t时刻时已经访问过的传感器簇节点信息,ej表示第j个传感器簇节点经过编码器编码后的隐藏状态,ρt表示聚类之后第t个访问的传感器簇的信息,Xt表示传感器簇的地理位置信息和数据量信息,ut表示t时刻各个传感器簇被选中的概率,tanh()表示一种激活函数,将值压缩在-1到+1之间,softmax()表示将计算出的访问各传感器簇节点的概率值映射到0和1之间,取概率最大的传感器簇节点作为下一个访问目标,P()表示访问每个传感器簇的条件概率。
6.一种无人机收集数据的全局路径规划系统,其特征在于,所述系统包括:
全局路径规划问题构建模块,用于以最大化数据收集收益和最小化数据收集过程花费时间为目标,基于无人机系统模型构建多目标无人机全局路径规划问题;
指针网络深度学习神经模型构建模块,用于采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题,并构建每个子问题对应的指针网络深度学习神经模型;
求解模块,用于采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解,得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序;
协同优化模块,用于基于领域的参数转移策略和演员评论家算法,对每个子问题的参数进行协同优化,获得各子问题对应的最优参数;
帕累托最优解确定模块,用于基于各子问题对应的最优参数确定帕累托最优的解。
7.根据权利要求6所述的无人机收集数据的全局路径规划系统,其特征在于,所述全局路径规划问题构建模块具体包括:
分簇单元,用于对各传感器节点按照二维地理位置进行分簇,获得多个簇;
全局路径规划问题构建单元,用于以不同的顺序访问各簇的过程中,以最大化数据收集收益和最小化数据收集过程中花费时间为目标,构建多目标无人机全局路径规划问题。
8.根据权利要求7所述的无人机收集数据的全局路径规划系统,其特征在于,所述构建多目标无人机全局路径规划问题,具体计算公式为:
Figure FDA0003413329720000031
Figure FDA0003413329720000041
Figure FDA0003413329720000042
Figure FDA0003413329720000043
其中,f1表示在无人机收集数据的过程中期望收集到的数据,D表示这些簇内包含的数据量,D=[d1,d2,...,dk,...]T,dk表示第k个访问的簇中拥有的数据量,ρ表示访问这些簇的顺序,N表示总簇个数,f2表示无人机在收集传感器数据的过程中所花的时间,tcol表示无人机在传感器节点收集数据所花费的时间,ε表示无人机收集传感器数据的数据传输速率,ttra表示无人机收集数据的过程中访问不同传感器物理位置所花的时间,dist(ρ(k),ρ(k+1))表示第k个传感器节点ρ(k)与第k+1个传感器节点ρ(k+1)之间的物理距离,v表示无人机的飞行速度,n表示无人机访问传感器簇节点的个数。
9.根据权利要求6所述的无人机收集数据的全局路径规划系统,其特征在于,所述求解模块具体包括:
使用注意力机制计算访问每个传感器簇的概率大小,选择概率最大的传感器簇作为下一次访问的簇,直到数量为总传感器簇一半时停止访问,获得收集传感器簇的集合及访问顺序。
10.根据权利要求9所述的无人机收集数据的全局路径规划系统,其特征在于,使用注意力机制计算访问每个传感器簇的概率大小,具体公式为:
Figure FDA0003413329720000044
P(ρt+11,...,ρt,Xt)=softmax(ut)
其中,
Figure FDA0003413329720000045
表示t时刻第j个传感器簇被选中的概率,W1、W2和W3表示可训练参数,dt表示t时刻时已经访问过的传感器簇节点信息,ej表示第j个传感器簇节点经过编码器编码后的隐藏状态,ρt表示聚类之后第t个访问的传感器簇的信息,Xt表示传感器簇的地理位置信息和数据量信息,ut表示t时刻各个传感器簇被选中的概率,tanh()表示一种激活函数,将值压缩在-1到+1之间,softmax()表示将计算出的访问各传感器簇节点的概率值映射到0和1之间,取概率最大的传感器簇节点作为下一个访问目标,P()表示访问每个传感器簇的条件概率。
CN202111538873.4A 2021-12-15 2021-12-15 一种无人机收集数据的全局路径规划方法及系统 Active CN114167898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111538873.4A CN114167898B (zh) 2021-12-15 2021-12-15 一种无人机收集数据的全局路径规划方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111538873.4A CN114167898B (zh) 2021-12-15 2021-12-15 一种无人机收集数据的全局路径规划方法及系统

Publications (2)

Publication Number Publication Date
CN114167898A true CN114167898A (zh) 2022-03-11
CN114167898B CN114167898B (zh) 2023-10-03

Family

ID=80486842

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111538873.4A Active CN114167898B (zh) 2021-12-15 2021-12-15 一种无人机收集数据的全局路径规划方法及系统

Country Status (1)

Country Link
CN (1) CN114167898B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116090688A (zh) * 2023-04-10 2023-05-09 中国人民解放军国防科技大学 基于改进指针网络的移动目标遍历访问序列规划方法
CN116318346A (zh) * 2023-03-07 2023-06-23 中国科学院软件研究所 多无人机间数据实时汇聚路径选择方法及装置
CN117055621A (zh) * 2023-09-08 2023-11-14 中国矿业大学 面向数据采集的多无人机路径规划方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018007677A (ja) * 2017-07-19 2018-01-18 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd 目標物体を誘導する方法及びuav
CN107743302A (zh) * 2017-10-27 2018-02-27 南京航空航天大学 无线传感器网络中基于压缩感知的速率分配和路由联合优化算法
CN112902969A (zh) * 2021-02-03 2021-06-04 重庆大学 一种无人机在数据收集过程中的路径规划方法
WO2021135554A1 (zh) * 2019-12-31 2021-07-08 歌尔股份有限公司 一种无人车全局路径规划方法和装置
CN113325875A (zh) * 2021-06-21 2021-08-31 西安电子科技大学 一种实现无人机数目最小化的无人机路径规划方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018007677A (ja) * 2017-07-19 2018-01-18 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd 目標物体を誘導する方法及びuav
CN107743302A (zh) * 2017-10-27 2018-02-27 南京航空航天大学 无线传感器网络中基于压缩感知的速率分配和路由联合优化算法
WO2021135554A1 (zh) * 2019-12-31 2021-07-08 歌尔股份有限公司 一种无人车全局路径规划方法和装置
CN112902969A (zh) * 2021-02-03 2021-06-04 重庆大学 一种无人机在数据收集过程中的路径规划方法
CN113325875A (zh) * 2021-06-21 2021-08-31 西安电子科技大学 一种实现无人机数目最小化的无人机路径规划方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HARALD BAYERLEIN 等: "Multi-UAV Path Planning for Wireless Data Harvesting With Deep Reinforcement Learning", 《IEEE OPEN JOURNAL OF THE COMMUNICATION SOCIETY》, pages 1171 - 1187 *
胡春宇 等: "基于无人机实时数据多波次任务规划模型分析", 《系统工程与电子技术》, vol. 43, no. 3, pages 747 - 754 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116318346A (zh) * 2023-03-07 2023-06-23 中国科学院软件研究所 多无人机间数据实时汇聚路径选择方法及装置
CN116318346B (zh) * 2023-03-07 2024-04-16 中国科学院软件研究所 多无人机间数据实时汇聚路径选择方法及装置
CN116090688A (zh) * 2023-04-10 2023-05-09 中国人民解放军国防科技大学 基于改进指针网络的移动目标遍历访问序列规划方法
CN116090688B (zh) * 2023-04-10 2023-06-23 中国人民解放军国防科技大学 基于改进指针网络的移动目标遍历访问序列规划方法
CN117055621A (zh) * 2023-09-08 2023-11-14 中国矿业大学 面向数据采集的多无人机路径规划方法
CN117055621B (zh) * 2023-09-08 2024-04-16 中国矿业大学 面向数据采集的多无人机路径规划方法

Also Published As

Publication number Publication date
CN114167898B (zh) 2023-10-03

Similar Documents

Publication Publication Date Title
CN114167898A (zh) 一种无人机收集数据的全局路径规划方法及系统
CN107247961B (zh) 一种应用模糊轨迹序列的轨迹预测方法
CN107886201B (zh) 多无人机任务分配的多目标优化方法及装置
CN107807665B (zh) 无人机编队探测任务协同分配方法及装置
CN107368926A (zh) 一种智能环境运载机器人识别楼层的多自然传感参数融合处理方法
CN110737968B (zh) 基于深层次卷积长短记忆网络的人群轨迹预测方法及系统
CN108492568B (zh) 一种基于时空特性分析的短时交通流预测方法
CN106529818B (zh) 基于模糊小波神经网络的水质评价预测方法
CN106527381B (zh) 一种面向并行批处理机动态调度的快速评估方法
CN107544516A (zh) 基于相对熵深度逆强化学习的自动驾驶系统及方法
CN110442143B (zh) 一种基于组合多目标鸽群优化的无人机态势数据聚类方法
CN109726802B (zh) 一种铁路和风电场环境风速机器学习预测方法
CN105701482A (zh) 基于非平衡标签信息融合的人脸识别算法架构
CN112862090A (zh) 一种基于深度时空神经网络的气温预报方法
CN115376317B (zh) 一种基于动态图卷积和时序卷积网络的交通流预测方法
CN112101676A (zh) 一种乘车路径规划方法、装置、计算机设备及存储介质
CN115629160A (zh) 一种基于时空图的空气污染物浓度预测方法及系统
CN115599779A (zh) 一种城市道路交通缺失数据插值方法及相关设备
CN113342029B (zh) 基于无人机群的最大传感器数据采集路径规划方法及系统
CN113805609A (zh) 一种混沌迷失鸽群优化机制的无人机群目标搜索方法
CN112008707B (zh) 一种基于部件分解的机器人控制方法及装置
CN112101132B (zh) 一种基于图嵌入模型和度量学习的交通状况预测方法
CN111310919B (zh) 基于场景切分和局部路径规划的驾驶控制策略训练方法
CN117241215A (zh) 一种基于图神经网络的无线传感器网络分布式节点协作定位方法
Liu et al. Swarm intelligence for classification of remote sensing data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant