CN114167898A

CN114167898A - 一种无人机收集数据的全局路径规划方法及系统

Info

Publication number: CN114167898A
Application number: CN202111538873.4A
Authority: CN
Inventors: 张荣涛; 郝洁; 邓海
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2021-12-15
Filing date: 2021-12-15
Publication date: 2022-03-11
Anticipated expiration: 2041-12-15
Also published as: CN114167898B

Abstract

本发明涉及一种无人机收集数据的全局路径规划方法及系统，方法包括：以最大化数据收集收益和最小化数据收集过程花费时间为目标构建多目标无人机全局路径规划问题；采用分解策略将多目标无人机全局路径规划问题分解为多个子问题，并构建每个子问题对应的模型；采用各模型对多目标全局路径规划问题进行求解，得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序；基于领域的参数转移策略和演员评论家算法，对每个子问题的参数进行协同优化，获得各子问题对应的最优参数；基于各子问题对应的最优参数确定帕累托最优的路径规划集合。本发明公开的方案实现在最小化无人机收集传感器数据花费时间的同时，最大化数据收集收益。

Description

一种无人机收集数据的全局路径规划方法及系统

技术领域

本发明涉及路径规划技术领域，特别是涉及一种无人机收集数据的全局路径规划方法及系统。

背景技术

与组建无线传感网进行数据收集的方法相比，基于无人机的数据收集方法具有很大的优势。首先，基于无人机的数据收集方法不需要构建昂贵的无线传感网络。基于无线传感网数据收集方法需要通过组建的自组网，将自身采集的传感器数据经过多跳上传到数据中心，这需要昂贵的资金来进行自组网络的构建。尤其在一些自然环境恶劣的地方，构建自组网的经济代价和经济效益严重失衡。

另外，无人机收集数据过程中考虑的目标不止一个，综合考虑数据收集收益和数据收集时间代价。前者只关注收集数据量，后者涉及飞行距离和数据收集速率。显然这两个方面是相互冲突，因为更少的收据收集时间会导致数据收集量减少，从而减少数据收集收益。如何综合地对多种条件作取舍，得到一个可行的多目标无人机数据收集路径是本领域亟需解决的技术问题。

发明内容

本发明的目的是提供一种无人机收集数据的全局路径规划方法及系统，以实现在最小化无人机收集传感器数据花费时间的同时，最大化数据收集收益。

为实现上述目的，本发明提供了一种无人机收集数据的全局路径规划方法，所述方法包括：

S1：以最大化数据收集收益和最小化数据收集过程花费时间为目标，基于无人机系统模型构建多目标无人机全局路径规划问题；

S2：采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题，并构建每个子问题对应的指针网络深度学习神经模型；

S3：采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解，得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序；

S4：基于领域的参数转移策略和演员评论家算法，对每个子问题的参数进行协同优化，获得各子问题对应的最优参数；

S5：基于各子问题对应的最优参数确定帕累托最优的解。

可选地，S1具体包括：

S11：对各传感器节点按照二维地理位置进行分簇，获得多个簇；

S12：以不同的顺序访问各簇的过程中，以最大化数据收集收益和最小化数据收集过程中花费时间为目标，构建多目标无人机全局路径规划问题。

可选地，所述构建多目标无人机全局路径规划问题，具体计算公式为：

其中，f₁表示在无人机收集数据的过程中期望收集到的数据，D表示这些簇内包含的数据量，D＝[d¹,d²,...,d^k,...]^T，d^k表示第k个访问的簇中拥有的数据量，ρ表示访问这些簇的顺序，N表示总簇个数，f₂表示无人机在收集传感器数据的过程中所花的时间，t^col表示无人机在传感器节点收集数据所花费的时间，ε表示无人机收集传感器数据的数据传输速率，t^tra表示无人机收集数据的过程中访问不同传感器物理位置所花的时间，dist(ρ(k),ρ(k+1))表示第k个传感器节点ρ(k)与第k+1个传感器节点ρ(k+1)之间的物理距离，v表示无人机的飞行速度，n表示无人机访问传感器的个数。

可选地，S3具体包括：

使用注意力机制计算访问每个传感器簇的概率大小，选择概率最大的传感器簇作为下一次访问的簇，直到数量为总传感器簇一半时停止访问，获得收集传感器簇的集合及访问顺序。

可选地，使用注意力机制计算访问每个传感器簇的概率大小，具体公式为：

P(ρ_t+1|ρ₁,...,ρ_t,X_t)＝softmax(u^t)

其中，

表示t时刻第j个传感器簇被选中的概率，W₁、W₂和W₃表示可训练参数，h_t表示t时刻时已经访问过的传感器簇节点信息，e_j表示第j个传感器簇节点经过编码器编码后的隐藏状态，ρ_t表示聚类之后第t个访问的传感器簇的信息，X_t表示传感器簇的地理位置信息和数据量信息，u^t表示t时刻各个传感器簇被选中的概率，tanh()表示一种激活函数，将值压缩在-1到+1之间，softmax()表示将计算出的访问各传感器簇节点的概率值映射到0和1之间，取概率最大的传感器簇节点作为下一个访问目标，P()表示访问每个传感器簇的条件概率。

本发明还提供一种无人机收集数据的全局路径规划系统，所述系统包括：

全局路径规划问题构建模块，用于以最大化数据收集收益和最小化数据收集过程花费时间为目标，基于无人机系统模型构建多目标无人机全局路径规划问题；

指针网络深度学习神经模型构建模块，用于采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题，并构建每个子问题对应的指针网络深度学习神经模型；

求解模块，用于采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解，得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序；

协同优化模块，用于基于领域的参数转移策略和演员评论家算法，对每个子问题的参数进行协同优化，获得各子问题对应的最优参数；

帕累托最优解确定模块，用于基于各子问题对应的最优参数确定帕累托最优的解。

可选地，所述全局路径规划问题构建模块具体包括：

分簇单元，用于对各传感器节点按照二维地理位置进行分簇，获得多个簇；

全局路径规划问题构建单元，用于以不同的顺序访问各簇的过程中，以最大化数据收集收益和最小化数据收集过程中花费时间为目标，构建多目标无人机全局路径规划问题。

其中，f₁表示在无人机收集数据的过程中期望收集到的数据，D表示这些簇内包含的数据量，D＝[d¹,d²,...,d^k,...]^T，d^k表示第k个访问的簇中拥有的数据量，ρ表示访问这些簇的顺序，N表示总簇个数，f₂表示无人机在收集传感器数据的过程中所花的时间，t^col表示无人机在传感器节点收集数据所花费的时间，ε表示无人机收集传感器数据的数据传输速率，t^tra表示无人机收集数据的过程中访问不同传感器物理位置所花的时间，dist(ρ(k),ρ(k+1))表示第k个传感器节点ρ(k)与第k+1个传感器节点ρ(k+1)之间的物理距离，v表示无人机的飞行速度，n表示无人机访问传感器节点的个数。

可选地，所述求解模块具体包括：

P(ρ_t+1|ρ₁,...,ρ_t,X_t)＝softmax(u^t)

其中，u^t _j表示t时刻第j个传感器簇被选中的概率，W₁、W₂和W₃表示可训练参数，h_t表示t时刻时已经访问过的传感器簇节点信息，e_j表示第j个传感器簇节点经过编码器编码后的隐藏状态，ρ_t表示聚类之后第t个访问的传感器簇的信息，X_t表示传感器簇的地理位置信息和数据量信息，u^t表示t时刻各个传感器簇被选中的概率，tanh()表示一种激活函数，将值压缩在-1到+1之间，softmax()表示将计算出的访问各传感器簇节点的概率值映射到0和1之间，取概率最大的传感器簇节点作为下一个访问目标，P()表示访问每个传感器簇的条件概率。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明无人机收集数据的全局路径规划方法流程图；

图2为本发明无人机收集数据的全局路径规划系统结构图；

图3为随机生成的50个双目标传感器簇全局路径规划方法对比示意图一；

图4为随机生成的50个双目标传感器簇全局路径规划方法对比示意图二；

图5为随机生成的40个双目标传感器簇全局路径规划方法对比示意图一；

图6为随机生成的40个双目标传感器簇全局路径规划方法对比示意图二。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1

如图1所示，本发明公开一种无人机收集数据的全局路径规划方法，所述方法包括：

S1：以最大化数据收集收益和最小化数据收集过程花费时间为目标，基于无人机系统模型构建多目标无人机全局路径规划问题。

S2：采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题，并构建每个子问题对应的指针网络深度学习神经模型。

S3：采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解，得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序。

S4：基于领域的参数转移策略和演员评论家算法，对每个子问题的参数进行协同优化，获得各子问题对应的最优参数。

S5：基于各子问题对应的最优参数确定帕累托最优的解。

下面对各个步骤进行详细论述：

在步骤S1之前，方法还包括：

建立多目标传感器数据收集网络的无人机系统模型；无人机系统模型包括一架无人机、和等待无人机收集数据的传感器节点，无人机一次只能收集一个传感器的数据，且同一个传感器节点最多只会访问一次。

传感器节点的位置随机分布在地图上，也可根据任务需求人为改变安装位置。传感器信息分为二维物理坐标信息和存储数据量信息。传感器随机分布在面积为100平方千米的地图上，每个传感器都携带一定数量的数据。传感器的位置信息由历史经验数据分析得到，也可以采用节点定位技术人为地获取和更新。

S1：以最大化数据收集收益和最小化数据收集过程花费时间为目标，基于无人机系统模型构建多目标无人机全局路径规划问题，具体包括：

S12：以不同的顺序访问各簇的过程中，以最大化数据收集收益和最小化数据收集过程中花费时间为目标，构建多目标无人机全局路径规划问题，具体计算公式为：

其中，f₁表示在无人机收集数据的过程中期望收集到的数据，D表示这些簇内包含的数据量，D＝[d¹,d²,...,d^k,...]^T，d^k表示第k个访问的簇中拥有的数据量，ρ表示访问这些簇的顺序，ρ＝[ρ₁,ρ₂,...,ρ_k,...]^T，ρ_k表示聚类之后第k个访问的传感器簇的信息，N表示总簇个数，f₂表示无人机在收集传感器数据的过程中所花的时间，t^col表示无人机在传感器节点收集数据所花费的时间，ε表示无人机收集传感器数据的数据传输速率，t^tra表示无人机收集数据的过程中访问不同传感器物理位置所花的时间，dist(ρ(k),ρ(k+1))表示第k个传感器节点ρ(k)与第k+1个传感器节点ρ(k+1)之间的物理距离，这里使用欧几里得距离，v表示无人机的飞行速度，n表示无人机访问传感器簇节点的个数。

S2：采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题，并构建每个子问题对应的指针网络深度学习神经模型，具体包括：

S21：采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题，具体公式为：

其中，D表示这些簇内包含的数据量，ρ表示访问这些簇的顺序，λⁱ表示第i个子问题对应的权重向量，

i＝0,1,...,M，

M＝100，f表示综合考虑f₁和f₂，研究对两个目标函数关注程度不同的时候得到帕累托最优解。f₁表示在无人机收集数据的过程中期望收集到的数据量，f₂表示无人机在收集传感器数据的过程中所花的时间。

本实施例中，f₁要求尽量地多，f₂要求尽量地少，使用分解策略来解决多目标优化问题，将多目标优化问题分解为一系列标量优化子问题，用子目标相互协同的方式来解决。求解所有的标量优化子问题后，可以得到期望的帕累托前沿。定义一组均匀的权重向量λ⁰,λ¹,...,λ^M,其中，M＝100，

根据不同的λ，把原始的多目标优化问题分解为M+1个标量子优化问题。其中,

,i＝0,1,...,100

S22：构建每个子问题对应的指针网络深度学习神经模型，具体公式为：

Pⁱ＝[ωⁱ,bⁱ] (6)

其中，Pⁱ表示第i个子问题的参数，ωⁱ表示可训练参数，bⁱ表示偏置项，i＝0,1,...,M。

网络的输入是传感器节点聚合后形成的簇的信息，用X表示，X＝{x¹,...,x^N}。其中，xⁱ表示第i个簇的地理位置信息和数据量信息构成的元组，xⁱ＝(aⁱ,bⁱ,dⁱ)。aⁱ表示第i个簇的水平坐标信息，bⁱ表示第i个簇的垂直坐标信息，dⁱ表示第i个簇的数据量信息。网络的输出是按照一定顺序所要访问的簇的信息，用Y表示，Y＝{ρ_t,t＝1,...,T}，T是决策步骤的长度，在这里是总簇数的一半。

S3：采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解，得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序。具体地，使用注意力机制计算访问每个传感器簇的概率，选择概率最大的传感器簇作为下一次访问的簇，直到数量为总传感器簇一半时停止访问，获得收集传感器簇的集合及访问顺序。

指针网络深度学习神经模型根据每次输入的传感器簇信息和之前所收集的传感器簇的信息决定下一个所要访问的传感器簇，直到得到一个数量为总传感器簇一半的访问序列。

访问序列的产生遵循概率链式法则：

指针网络深度学习神经模型由编码器和解码器组成，两者都是RNN循环神经网络。编码器的作用是将输入的低维向量x^j映射为高维向量e^j输出。解码器的作用是依据编码器输出的高维向量e^j得到传感器簇的访问序列。解码器的输入是上一步所选的传感器簇的信息，输出是访问每一个传感器簇的概率。我们使用解码器的中间隐藏变量h_t，其中包含之前步骤所选择的传感器簇ρ₁，...ρ_t的信息，然后结合编码器的输出e₁，...e_t，按照公式(7)来计算得出下一次访问各传感器簇的概率。该计算过程具体使用注意力机制实现。注意力机制会分别计算访问每个传感器簇的概率大小，选择概率最大的簇作为下一次访问的簇。

本发明使用注意力机制计算访问每个传感器簇的概率大小，具体公式如下：

P(ρ_t+1|ρ₁,...,ρ_t,X_t)＝softmax(u^t) (9)

其中，

表示t时刻第j个传感器簇被选中的概率，W₁、W₂和W₃表示可训练参数。h_t表示t时刻时已经访问过的传感器簇节点信息，e_j表示第j个传感器簇节点经过编码器编码后的隐藏状态，ρ_t表示聚类之后第t个访问的传感器簇的信息，X_t表示传感器簇的地理位置信息和数据量信息，u^t表示t时刻各个传感器簇被选中的概率，tanh()表示一种激活函数，将值压缩在-1到+1之间，softmax()表示将计算出的访问各传感器簇节点的概率值映射到0和1之间，取概率最大的传感器簇节点作为下一个访问目标，P()表示访问每个传感器簇的条件概率。

公式(8)和公式(9)是对公式(7)的具体实现，公式(7)中e_j对应公式(7)中的X_t，表示的是传感器簇的地理位置信息和数据量信息，公式(8)中h_t对应公式(7)中的ρ₁，...ρ_t，W₁、W₂和W₃是网络中注意力机制部分要训练的参数。

基于领域参数传递的多目标深度强化学习算法如下算法1所示。用P表示多目标优化问题分解出的M+1个子问题建模成的神经网络的参数，P＝[ω,b]，深度学习中常用ω,b来表示一个模型的参数。按照不同的λⁱ把多目标优化问题分解成子问题，每一个子问题使用演员评论家算法(算法2)训练得到最优参数

在训练下一个子问题之前，用当前训练好的

对下一个子问题模型的参数进行初始化，再使用算法2得到期望的模型最优参数

为了防止混淆，这里说明：上面提到的W₁、W₂和W₃是模型中注意力机制部分的参数，也就是说W₁、W₂和W₃是ω,b的一部分；在算法1的求解过程中使用到了算法2，算法2是算法1的一部分。

本发明使用演员评论家算法对子问题进行训练求解。演员评论家算法实际上包含两个网络：(Ⅰ)演员网络，在这里就是之前描述的指针网络，用来计算下一次访问各传感器簇的概率。(Ⅱ)评论家网络，用来估计每个问题状态的奖励。算法2描述了训练过程。

训练是以无监督方式进行的，θ，

均是多目标优化问题分解出的标量子问题对应的神经网络的初始参数。θ代表演员网络参数，也就是上文提到的编码器解码器网络。

代表评论家网络的参数。S表示样本数目。

表示第k个样本在t+1时刻访问的传感器簇节点。

表示求梯度操作。η表示学习率。

当表示第k个样本在初始时刻的状态。算法2首先从

中生成S个多目标传感器簇数据样本实例，这里M代表不同的传感器簇的输入特征，例如传感器簇的物理横坐标、物理纵坐标、数据量。M₁、M₂和M₃分别是物理坐标信息和数据量，

和

可以用标准正太分布[0,1]表示。当未满足终止条件时，利用公式(8)和公式(9)求解下一个应该访问的传感器节点。当传感器簇节点的数量满足要求时，根据演员网络产生传感器簇的访问顺序和公式(5)可以计算出奖励值当前样本的奖励值R^k，然后评论家网络估计出一个奖励值V(·)。最后按照策略梯度算法，以减小演员网络求解得到的奖励R^k和评论家网络估计出的奖励V(·)和样本k真实奖励R^k之间差距为目标，分别按照学习率η更新演员网络和评论家网络，完成训练过程。

S5：基于各子问题对应的最优参数确定帕累托最优的解。

步骤S4完成之后，会得到每个子问题训练好的权重，即最优参数

i＝0,1,...,M,每个子问题网络加载各自的权重，输入无人机簇地理位置坐标和数据量信息X＝{x¹,x²,...,xⁱ,...},xⁱ＝(aⁱ,bⁱ,dⁱ)，i＝1,2,...,N,得到每个子问题的解输出Yⁱ＝{ρ_t,t＝1,...,T}，i＝0,1,...,M。Yⁱ是访问无人机簇的顺序。综合M个无人机簇访问顺序Yⁱ在目标函数f₁、f₂上的结果，得到帕累托最优的解，从而得知在多目标无人机收集数据全局路径规划问题中，当对多个目标的关注程度不同时，按怎样的序列访问无人机簇才能达到帕累托最优。

实施例2

如图2所示，本发明还提供一种无人机收集数据的全局路径规划系统，所述系统包括：

全局路径规划问题构建模块201，用于以最大化数据收集收益和最小化数据收集过程花费时间为目标，基于无人机系统模型构建多目标无人机全局路径规划问题。

指针网络深度学习神经模型构建模块202，用于采用分解策略将所述多目标无人机全局路径规划问题分解为多个子问题，并构建每个子问题对应的指针网络深度学习神经模型。

求解模块203，用于采用各所述指针网络深度学习神经模型对所述多目标全局路径规划问题进行求解，得到无人机在无需访问所有传感器节点的情况下的收集传感器簇的集合及访问顺序。

协同优化模块204，用于基于领域的参数转移策略和演员评论家算法，对每个子问题的参数进行协同优化，获得各子问题对应的最优参数。

帕累托最优解确定模块205，用于基于各子问题对应的最优参数确定帕累托最优的解。

作为一种可选的实施方式，本发明所述全局路径规划问题构建模块201具体包括：

实施例3

图3为随机生成的50个双目标传感器簇全局路径规划方法对比示意图一：本发明方法获得的帕累托前沿(即帕累托最优的解)和传统启发式算法NSGA-Ⅱ上运行500、1000、2000和4000轮获得的帕累托前沿比较。

图4为随机生成的50个双目标传感器簇全局路径规划方法对比示意图二：本发明方法获得的帕累托前沿和传统启发式算法MOEAD上运行500、1000、2000和4000轮获得的帕累托前沿比较。

图5为随机生成的40个双目标传感器簇全局路径规划方法对比示意图一：本发明方法获得的帕累托前沿和传统启发式算法NSGA-Ⅱ上运行500、1000、2000和4000轮获得的帕累托前沿比较。

图6为随机生成的40个双目标传感器簇全局路径规划方法对比示意图二：本发明方法获得的帕累托前沿和传统启发式算法MOEAD上运行500、1000、2000和4000轮获得的帕累托前沿比较。

图3-图6中可以看出，本发明的方法与两种传统启发式算法相比，可以获得更好的帕累托前沿，获得更好的收敛性和多样性。另外，一旦模型训练好，本发明的算法可以快速求得帕累托前沿。且由于指针神经网络的优越性，一旦传感器簇的数量发生变化，本算法不需要重新训练，可以直接快速求解出在传感器簇数量变化的新场景下的帕累托前沿，而传统启发式算法需要重新训练。

表1为本发明使用的算法和两种启发式算法NSGA-Ⅱ和MOEAD在运行时间上的比较。

表1

由表1可知，本发明方法使用的算法在时间开销方面也优于其他两种启发式算法。DRL-MOA代表本发明使用的算法，其运行时间不包括模型训练的时间。DRL-MOA一旦训练好，可以快速地求解出帕累托前沿，且对传感器簇数量变化具有鲁棒性。而传统启发式算法运行虽然可以增加迭代次数改进运行效果，但是所付出的时间开销非常大，且效果提升很小，且一旦传感器簇的数量发生变化，需要重新获取数据从头训练。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

Claims

1.一种无人机收集数据的全局路径规划方法，其特征在于，所述方法包括：

S5：基于各子问题对应的最优参数确定帕累托最优的解。

2.根据权利要求1所述的无人机收集数据的全局路径规划方法，其特征在于，S1具体包括：

3.根据权利要求2所述的无人机收集数据的全局路径规划方法，其特征在于，所述构建多目标无人机全局路径规划问题，具体计算公式为：

4.根据权利要求1所述的无人机收集数据的全局路径规划方法，其特征在于，S3具体包括：

5.根据权利要求4所述的无人机收集数据的全局路径规划方法，其特征在于，使用注意力机制计算访问每个传感器簇的概率大小，具体公式为：

P(ρ_t+1|ρ₁,...,ρ_t,X_t)＝softmax(u^t)

其中，

表示t时刻第j个传感器簇被选中的概率，W₁、W₂和W₃表示可训练参数，d_t表示t时刻时已经访问过的传感器簇节点信息，e_j表示第j个传感器簇节点经过编码器编码后的隐藏状态，ρ_t表示聚类之后第t个访问的传感器簇的信息，X_t表示传感器簇的地理位置信息和数据量信息，u^t表示t时刻各个传感器簇被选中的概率，tanh()表示一种激活函数，将值压缩在-1到+1之间，softmax()表示将计算出的访问各传感器簇节点的概率值映射到0和1之间，取概率最大的传感器簇节点作为下一个访问目标，P()表示访问每个传感器簇的条件概率。

6.一种无人机收集数据的全局路径规划系统，其特征在于，所述系统包括：

7.根据权利要求6所述的无人机收集数据的全局路径规划系统，其特征在于，所述全局路径规划问题构建模块具体包括：

8.根据权利要求7所述的无人机收集数据的全局路径规划系统，其特征在于，所述构建多目标无人机全局路径规划问题，具体计算公式为：

其中，f₁表示在无人机收集数据的过程中期望收集到的数据，D表示这些簇内包含的数据量，D＝[d¹,d²,...,d^k,...]^T，d^k表示第k个访问的簇中拥有的数据量，ρ表示访问这些簇的顺序，N表示总簇个数，f₂表示无人机在收集传感器数据的过程中所花的时间，t^col表示无人机在传感器节点收集数据所花费的时间，ε表示无人机收集传感器数据的数据传输速率，t^tra表示无人机收集数据的过程中访问不同传感器物理位置所花的时间，dist(ρ(k),ρ(k+1))表示第k个传感器节点ρ(k)与第k+1个传感器节点ρ(k+1)之间的物理距离，v表示无人机的飞行速度，n表示无人机访问传感器簇节点的个数。

9.根据权利要求6所述的无人机收集数据的全局路径规划系统，其特征在于，所述求解模块具体包括：

10.根据权利要求9所述的无人机收集数据的全局路径规划系统，其特征在于，使用注意力机制计算访问每个传感器簇的概率大小，具体公式为：

P(ρ_t+1|ρ₁,...,ρ_t,X_t)＝softmax(u^t)

其中，