CN114841055A - 一种基于生成对抗网络的无人机集群任务预分配方法 - Google Patents
一种基于生成对抗网络的无人机集群任务预分配方法 Download PDFInfo
- Publication number
- CN114841055A CN114841055A CN202210336032.3A CN202210336032A CN114841055A CN 114841055 A CN114841055 A CN 114841055A CN 202210336032 A CN202210336032 A CN 202210336032A CN 114841055 A CN114841055 A CN 114841055A
- Authority
- CN
- China
- Prior art keywords
- model
- sequence
- network
- unmanned aerial
- aerial vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000005457 optimization Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 37
- 239000011159 matrix material Substances 0.000 claims description 29
- 238000011156 evaluation Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 230000003042 antagnostic effect Effects 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000002945 steepest descent method Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 2
- 230000008859 change Effects 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims 1
- 230000009471 action Effects 0.000 abstract description 2
- 238000013459 approach Methods 0.000 abstract description 2
- 230000008485 antagonism Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06316—Sequencing of tasks or work
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Geometry (AREA)
- Primary Health Care (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于生成对抗网络的无人机集群任务预分配方法,对无人机信息与目标信息进行预处理,建立生成对抗网络的生成模型G(x)并生成分配序列,建立生成对抗网络的判别模型并对生成序列评价,采用梯度下降最优化目标,计算生成模型优化目标,采用梯度下降最优化目标,通过对抗训练,得到任务分配生成模型,最终得到期望的任务分配结果。本发明利用了生成对抗网络能在高实时性、高对抗性和不确定性的大容量、多维度数据战场环境下挖掘作战行动模型,在理论上能够逼近任意函数的这一特点,能够给出合理的任务分配方案,同时由于生成对抗网络在处理数据方面的高效保证了本发明方法能够快速得到任务分配结果。
Description
技术领域
本发明涉及无人机集群与深度学习领域,特别是一种任务预分配方法。
背景技术
无人机集群任务分配技术作为无人机集群作战的关键技术之一,旨在结合战场态势和自身能力信息,进行最优的任务部署,提高集群的作战效能。其中任务预分配作为无人机集群任务分配的初始环节,旨在满足各项战术和技术指标的前提下,将不同位置、价值、威胁程度的目标在作战初期合理分配给不同的无人机,形成有效的任务序列。
目前的任务预分配通常采用协同任务分配(Cooperative Multi-TaskAssignment Problem,CMTAP)方法进行建模,其考虑了真实战场环境下无人机的异构性与时间约束,建立一种多目标的组合优化问题。针对该类模型,以遗传算法、粒子群算法为代表的启发式算法在集群规模较小的情况下能够迅速找出较优解。但由于这类算法与模型在求解最优问题时存在以下缺点:
(1)算法在求解过程中有一定的随机性;
(2)算法求解时需要进行多次迭代,同时迭代次数与任务分配模型规模有关。
因此,通过启发式算法求解CMTAP模型得到任务分配结果的方法在大型任务分配场景下分配效率较低,分配时间过长。
发明内容
为了克服现有技术的不足,本发明提供一种基于生成对抗网络的无人机集群任务预分配方法。为了克服启发式算法求解大型CMTAP问题时计算效率低,计算时间长的缺点,本发明提供一种基于生成对抗网络的无人机集群任务预分配方法,根据已知的无人机和任务目标信息,能够快速地得到合理的任务预分配序列。
本发明解决其技术问题所采用的技术方案的具体步骤如下:
步骤1:数据预处理
对无人机信息与目标信息进行预处理,其中无人机信息包括弹药量、对目标的毁伤概率、对目标的侦察收益、无人机续航能力;目标信息包括目标重要度、目标打击收益、目标侦察收益。
预处理包括以下三个步骤:
a).将无人机信息表示为1×n1的信息向量la,其中n1为无人机数量,a=1,2,...,k1,k1为无人机信息种类数量;将目标信息表示为1×n2的信息向量kb,其中n2等于目标数量,b=1,2,...,k2,k2为目标信息种类数量;
b).由于n1、n2存在长度不同的情况,取n=max(n1,n2)为指定长度,将小于指定长度的向量la、kb后进行补零处理,最终得到长度都为n的无人机信息向量l_newa和目标信息向量k_newb,之后将各个信息向量按行组合成为(k1+k2,n)的信息矩阵M;
c).使用如下公式对信息矩阵M中每一行数据进行归一化处理:
式中x_norm(i,j)为第i行第j列进行归一化后的数据,xi,j为第i行第j个数据,Mini为第i行值最小的数据,Maxi为第i行值最大的数据,i=1,2,...,k1+k2,j=1,2,...,n,记经过归一化处理后的矩阵为M_norm;
将经过归一化后的矩阵M_norm作为模型的输入数据,记为datai,同时将与无人机和目标信息对应的真实的任务分配序列记为reali,进入步骤2;
步骤2:建立生成对抗网络的生成模型G(x)并生成分配序列;
步骤3:建立生成对抗网络的判别模型D(x)并对生成序列评价;
判别模型由词嵌入模型、深度卷积网络、全连接网络组成,三者作为判别模型的基本架构;
判别模型评价指标如下:
步骤4:采用梯度下降最优化目标:min-V(G,D);
根据步骤(3)中的序列评价指标V(D,G),使用随机最速下降法更新判别模型中的参数,包括判别模型中卷积网络每一个卷积核的参数、全连接网络中每一个神经元的权值以及每一个神经元的偏置;
步骤5:计算生成模型优化目标;
生成模型优化的目标函数如下:
J(θ)=E[RT|s0,θ] (2)
式(2)中s0为初始状态,θ为生成模型中的参数,RT为判别模型对完整的生成序列给出的评价;J(θ)表示对评价的期望,即在某一个初始条件s0和参数θ的条件下,产生某个完全的序列的评价的期望值;
期望的计算公式如下:
式中Gθ(y1|s0)表示利用生成模型生成某一个y1序列的概率;(表示当生成器Gθ生成了一个未完全序列y1后,通过蒙特卡洛方法对该序列进行多次补全后放入判别器Dφ中得到补全序列的评价指标值,随后对由y1产生的多个序列评价指标值取平均后的均值;
步骤6:采用梯度下降最优化目标min-J(θ)
根据式(2),使用随机最速下降法优化目标min-J(θ),更新生成模型中的参数,即生成模型中LSTM网络中的wi、bi与全连接网络的权重与偏置;
步骤7:对抗训练;
进行生成模型和判别模型的对抗训练,即重复步骤(2)到步骤(6),直到达到设定的终止条件,终止条件为达到最大训练次数或模型网络的loss值不再变化,即认为生成模型的网络收敛,保存生成模型,即为本发明的任务分配生成模型;
步骤8:任务分配序列生成
给定战场信息,按照步骤1对输入数据进行处理后,将无人机信息和目标信息输入任务分配生成模型,即可快速得到期望的任务分配结果。
所述步骤2建立生成对抗网络的生成模型G(x)并生成分配序列的具体步骤为:
待分配无人机数量为k,待完成任务数量为l;
使用序列到序列的模型框架,首先建立LSTM网络Net1,Net1由多个LSTM单元组成,单元数等于输入数据的列数n,设置相关网络参数:emb_dim,hid_dim,n_layer,分别表示输入词向量大小、特征向量维度和网络层数;该网络对输入数据实现一种变换其中xi为datai中的行向量,wi为可变参数,bi为偏置,h0为随机初始化的向量;通过该变换对输入数据矩阵的每一列数据进行计算后,取输出数据中包含数据特征的隐藏空间向量hn;
将隐藏空间向量hn用来初始化另一个LSTM网络Net2,其中LSTM单元数为任务数量l,每一个LSTM单元的输出经过全连接网络后将输出数据从向量空间映射到输出标签空间,最终经过l个LSTM单元后得到一个l×k的输出矩阵,设矩阵的行向量为zj,使用softmax公式:将每一行向量的k个实数映射为k个(0,1)之间的实数,并对每一行向量进行基于概率的抽样,即每一行依概率抽取一个数据,得到其位置索引,将得到的数据组成一个l×1的向量,即为生成的分配序列;
建立的基于LSTM的模型作为任务分配的生成模型G(x)。
所述步骤3中,D(y)、D(G(z))的计算步骤为:
a).建立关于无人机的索引词典,将生成的分配序列对应的每一个无人机编号映射为向量,设词维度为p,则生成的分配序列变为l×p的矩阵Matrix_1;
b).对Matrix_1矩阵做卷积处理,通过池化网络进行下采样,其中每一个卷积网络后连接一个池化网络,经过多次处理得到Matrix_final;
c).将Matrix_final通过两层全连接网络得到生成的分配序列的评分D(G(z)),其中全连接网络参数包括input_dim和outout_size,分别为全连接网络的输入维度和输出维度;
d).将真实的分配序列reali通过步骤a)建立的无人机索引词典找出分配序列中每个数字对应的无人机编号,即将分配序列映射为无人机编号序列,得到的矩阵Matrix_2,按照步骤b)、步骤c)得到真实分配序列的评分D(y)。
本发明的有益效果在于利用了生成对抗网络能在高实时性、高对抗性和不确定性的大容量、多维度数据战场环境下挖掘作战行动模型,在理论上能够逼近任意函数的这一特点,能够给出合理的任务分配方案,同时由于生成对抗网络在处理数据方面的高效保证了本发明方法能够快速得到任务分配结果。
附图说明
图1是本发明的数据预处理流程图。
图2是本发明的生成模型示意图。
图3是本发明的判别模型示意图。
图4是本发明的任务分配模型的训练架构示意图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
下面以某一实际任务分配场景说明上述具体实施过程。
假设战场信息数据包括无人机机信息数据和目标信息数据。这里无人机个数为40架,任务目标15个,则无人机信息数据为一个4×40的矩阵,代表无人机各项性能;目标信息数据为一个2×30的矩阵,代表任务收益。真实的分配数据由启发式算法根据不同的战场信息生成并表示为分配序列。
采用本发明所提出的任务分配方法,训练任务分配网络模型并根据战场信息进行任务分配,实施过程如下:
1.战场数据预处理流程。
将战场信息进行拼接得到输入矩阵,对每一行进行归一化处理,如图1所示,进行归一化后的样本数据的归一化信息矩阵M_norm的转置如下表所示:
步骤2.建立生成对抗网络的生成模型并生成分配序列;
搭建如图2所示的生成模型,并设定生成模型中各网络参数如下:
①LSTM单元网络参数:
其中emb_dim为词向量大小,本发明取36,hid_dim为隐藏层维度,本发明取128;
②全连接网络参数:
output_size在本实例中等于无人机数量,数值为40。
将预处理的数据输入进网络,得到对应战场数据的生成分配序列如下表所示。其中Ti为任务编号,i=1,2,...,l,l为任务数量;xj表示无人机编号数,j=1,2,...,n,n为无人机数量,该序列表示编号为Ti的任务由编号为xj的无人机执行;如下表所示:
T<sub>1</sub> | T<sub>2</sub> | T<sub>3</sub> | T<sub>4</sub> | T<sub>5</sub> | T<sub>6</sub> | T<sub>7</sub> | T<sub>8</sub> | T<sub>9</sub> | T<sub>10</sub> | … |
x<sub>1</sub> | x<sub>2</sub> | x<sub>3</sub> | x<sub>4</sub> | x<sub>5</sub> | x<sub>6</sub> | x<sub>7</sub> | x<sub>8</sub> | x<sub>9</sub> | x<sub>10</sub> | … |
步骤3.建立生成对抗网络的判别模型并对生成序列评价;
搭建如图3所示的判别模型,设定其中各网络参数如下:
①深度卷积网络为29层,每一层输入维度和输出维度如下:
每一层卷积核大小kernel_size为;
kernel_size={(1,40),(2,40),...,(29,40)}
②池化层参数设定
池化层层数与卷积层相同,每一层核大小kernel_size设为:
kernel_size={(29,1),(28,1),...,(2,1)}
③全连接层设定
将生成序列和真实序列混合并生成标签矩阵Tn×2,输入进判别模型进行计算得到对生成序列和真实序列的评价指标值,例如:(0.872,0.128),表示有0.872的概率认为该序列为生成序列,有0.128的概率认为该序列为真实序列。
随后设置判别模型参数为可变,根据式(1)计算评价指标。
步骤4.判别模型参数优化。
采用梯度下降方法最优化函数min-V(G,D),更新判别模型中卷积网络的卷积核参数与全连接层的权重与偏置参数后,固定已更新的判别模型参数。
步骤5.计算生成模型优化目标及参数优化。
步骤6.采用梯度下降方法最优化目标min-J(θ),更新生成模型的参数,即生成模型中LSTM网络中的wi、bi与全连接网络的权重与偏置,随后固定生成模型参数。
步骤7.以上计算模型为本发明中任务分配模型的训练模型,如图4所示,重复上述过程(2)-(6),进行生成模型和判别模型的对抗训练,直到损失函数保持在一定范围内,认为模型训练完毕,保存生成模型;
步骤8.使用该生成模型进行任务分配,得到某一次任务分配的部分序列如下表所示,该序列表示T1目标分配给编号37的无人机执行,T2目标分配给编号39的无人机执行,T5目标分配给编号11的无人机执行等:
T<sub>1</sub> | T<sub>2</sub> | T<sub>3</sub> | T<sub>4</sub> | T<sub>5</sub> | T<sub>6</sub> | T<sub>7</sub> | T<sub>8</sub> | T<sub>9</sub> | T<sub>10</sub> | … |
37 | 39 | 38 | 40 | 11 | 27 | 18 | 3 | 4 | 13 | … |
同时记录得到算法运行时间为0.16秒。
Claims (3)
1.一种基于生成对抗网络的无人机集群任务预分配方法,其特征在于包括下述步骤:
步骤1:数据预处理
对无人机信息与目标信息进行预处理,其中无人机信息包括弹药量、对目标的毁伤概率、对目标的侦察收益、无人机续航能力;目标信息包括目标重要度、目标打击收益、目标侦察收益;
预处理包括以下三个步骤:
a).将无人机信息表示为1×n1的信息向量la,其中n1为无人机数量,a=1,2,...,k1,k1为无人机信息种类数量;将目标信息表示为1×n2的信息向量kb,其中n2等于目标数量,b=1,2,...,k2,k2为目标信息种类数量;
b).由于n1、n2存在长度不同的情况,取n=max(n1,n2)为指定长度,将小于指定长度的向量la、kb后进行补零处理,最终得到长度都为n的无人机信息向量l_newa和目标信息向量k_newb,之后将各个信息向量按行组合成为(k1+k2,n)的信息矩阵M;
c).使用如下公式对信息矩阵M中每一行数据进行归一化处理:
式中x_norm(i,j)为第i行第j列进行归一化后的数据,xi,j为第i行第j个数据,Mini为第i行值最小的数据,Maxi为第i行值最大的数据,i=1,2,...,k1+k2,j=1,2,...,n,记经过归一化处理后的矩阵为M_norm;
将经过归一化后的矩阵M_norm作为模型的输入数据,记为datai,同时将与无人机和目标信息对应的真实的任务分配序列记为reali,进入步骤2;
步骤2:建立生成对抗网络的生成模型G(x)并生成分配序列;
步骤3:建立生成对抗网络的判别模型D(x)并对生成序列评价;
判别模型由词嵌入模型、深度卷积网络、全连接网络组成,三者作为判别模型的基本架构;
判别模型评价指标如下:
步骤4:采用梯度下降最优化目标:min-V(G,D);
根据步骤(3)中的序列评价指标V(D,G),使用随机最速下降法更新判别模型中的参数,包括判别模型中卷积网络每一个卷积核的参数、全连接网络中每一个神经元的权值以及每一个神经元的偏置;
步骤5:计算生成模型优化目标;
生成模型优化的目标函数如下:
J(θ)=E[RT|s0,θ] (2)
式(2)中s0为初始状态,θ为生成模型中的参数,RT为判别模型对完整的生成序列给出的评价;J(θ)表示对评价的期望,即在某一个初始条件s0和参数θ的条件下,产生某个完全的序列的评价的期望值;
期望的计算公式如下:
式中Gθ(y1|s0)表示利用生成模型生成某一个y1序列的概率;(表示当生成器Gθ生成了一个未完全序列y1后,通过蒙特卡洛方法对该序列进行多次补全后放入判别器Dφ中得到补全序列的评价指标值,随后对由y1产生的多个序列评价指标值取平均后的均值;
步骤6:采用梯度下降最优化目标min-J(θ)
根据式(2),使用随机最速下降法优化目标min-J(θ),更新生成模型中的参数,即生成模型中LSTM网络中的wi、bi与全连接网络的权重与偏置;
步骤7:对抗训练;
进行生成模型和判别模型的对抗训练,即重复步骤(2)到步骤(6),直到达到设定的终止条件,终止条件为达到最大训练次数或模型网络的loss值不再变化,即认为生成模型的网络收敛,保存生成模型,即为本发明的任务分配生成模型;
步骤8:任务分配序列生成
给定战场信息,按照步骤1对输入数据进行处理后,将无人机信息和目标信息输入任务分配生成模型,即可快速得到期望的任务分配结果。
2.根据权利要求1所述的基于生成对抗网络的无人机集群任务预分配方法,其特征在于:
所述步骤2建立生成对抗网络的生成模型G(x)并生成分配序列的具体步骤为:
待分配无人机数量为k,待完成任务数量为l;
使用序列到序列的模型框架,首先建立LSTM网络Net1,Net1由多个LSTM单元组成,单元数等于输入数据的列数n,设置相关网络参数:emb_dim,hid_dim,n_layer,分别表示输入词向量大小、特征向量维度和网络层数;该网络对输入数据实现一种变换其中xi为datai中的行向量,wi为可变参数,bi为偏置,h0为随机初始化的向量;通过该变换对输入数据矩阵的每一列数据进行计算后,取输出数据中包含数据特征的隐藏空间向量hn;
将隐藏空间向量hn用来初始化另一个LSTM网络Net2,其中LSTM单元数为任务数量l,每一个LSTM单元的输出经过全连接网络后将输出数据从向量空间映射到输出标签空间,最终经过l个LSTM单元后得到一个l×k的输出矩阵,设矩阵的行向量为zj,使用softmax公式:将每一行向量的k个实数映射为k个(0,1)之间的实数,并对每一行向量进行基于概率的抽样,即每一行依概率抽取一个数据,得到其位置索引,将得到的数据组成一个l×1的向量,即为生成的分配序列;
建立的基于LSTM的模型作为任务分配的生成模型G(x)。
3.根据权利要求1所述的基于生成对抗网络的无人机集群任务预分配方法,其特征在于:
所述步骤3中,D(y)、D(G(z))的计算步骤为:
a).建立关于无人机的索引词典,将生成的分配序列对应的每一个无人机编号映射为向量,设词维度为p,则生成的分配序列变为l×p的矩阵Matrix_1;
b).对Matrix_1矩阵做卷积处理,通过池化网络进行下采样,其中每一个卷积网络后连接一个池化网络,经过多次处理得到Matrix_final;
c).将Matrix_final通过两层全连接网络得到生成的分配序列的评分D(G(z)),其中全连接网络参数包括input_dim和outout_size,分别为全连接网络的输入维度和输出维度;
d).将真实的分配序列reali通过步骤a)建立的无人机索引词典找出分配序列中每个数字对应的无人机编号,即将分配序列映射为无人机编号序列,得到的矩阵Matrix_2,按照步骤b)、步骤c)得到真实分配序列的评分D(y)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210336032.3A CN114841055B (zh) | 2022-03-31 | 2022-03-31 | 一种基于生成对抗网络的无人机集群任务预分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210336032.3A CN114841055B (zh) | 2022-03-31 | 2022-03-31 | 一种基于生成对抗网络的无人机集群任务预分配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114841055A true CN114841055A (zh) | 2022-08-02 |
CN114841055B CN114841055B (zh) | 2024-03-19 |
Family
ID=82563456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210336032.3A Active CN114841055B (zh) | 2022-03-31 | 2022-03-31 | 一种基于生成对抗网络的无人机集群任务预分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114841055B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115426635A (zh) * | 2022-11-01 | 2022-12-02 | 北京航空航天大学 | 一种不可靠传输场景下无人机通信网络推断方法及系统 |
CN115695209A (zh) * | 2022-09-23 | 2023-02-03 | 西安电子科技大学 | 基于图模型的反制无人机蜂群评估方法 |
CN117707219A (zh) * | 2024-02-05 | 2024-03-15 | 西安羚控电子科技有限公司 | 基于深度强化学习的无人机集群侦查对抗方法及装置 |
CN117973820A (zh) * | 2024-04-01 | 2024-05-03 | 浙江数达智远科技有限公司 | 基于人工智能的任务动态分配系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021082809A1 (zh) * | 2019-10-29 | 2021-05-06 | 山东科技大学 | 一种外汇时间序列预测的训练优化方法 |
CN113159389A (zh) * | 2021-03-25 | 2021-07-23 | 大连海事大学 | 一种基于深度森林生成对抗网络的金融时间序列预测方法 |
US20220036194A1 (en) * | 2021-10-18 | 2022-02-03 | Intel Corporation | Deep neural network optimization system for machine learning model scaling |
-
2022
- 2022-03-31 CN CN202210336032.3A patent/CN114841055B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021082809A1 (zh) * | 2019-10-29 | 2021-05-06 | 山东科技大学 | 一种外汇时间序列预测的训练优化方法 |
CN113159389A (zh) * | 2021-03-25 | 2021-07-23 | 大连海事大学 | 一种基于深度森林生成对抗网络的金融时间序列预测方法 |
US20220036194A1 (en) * | 2021-10-18 | 2022-02-03 | Intel Corporation | Deep neural network optimization system for machine learning model scaling |
Non-Patent Citations (1)
Title |
---|
马纯超;尹栋;朱华勇;: "网络化战场环境下多无人机调度问题", 火力与指挥控制, no. 10, 15 October 2015 (2015-10-15) * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115695209A (zh) * | 2022-09-23 | 2023-02-03 | 西安电子科技大学 | 基于图模型的反制无人机蜂群评估方法 |
CN115695209B (zh) * | 2022-09-23 | 2024-06-07 | 西安电子科技大学 | 基于图模型的反制无人机蜂群评估方法 |
CN115426635A (zh) * | 2022-11-01 | 2022-12-02 | 北京航空航天大学 | 一种不可靠传输场景下无人机通信网络推断方法及系统 |
CN115426635B (zh) * | 2022-11-01 | 2023-03-03 | 北京航空航天大学 | 一种不可靠传输场景下无人机通信网络推断方法及系统 |
CN117707219A (zh) * | 2024-02-05 | 2024-03-15 | 西安羚控电子科技有限公司 | 基于深度强化学习的无人机集群侦查对抗方法及装置 |
CN117707219B (zh) * | 2024-02-05 | 2024-05-17 | 西安羚控电子科技有限公司 | 基于深度强化学习的无人机集群侦查对抗方法及装置 |
CN117973820A (zh) * | 2024-04-01 | 2024-05-03 | 浙江数达智远科技有限公司 | 基于人工智能的任务动态分配系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114841055B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114841055B (zh) | 一种基于生成对抗网络的无人机集群任务预分配方法 | |
CN109948029B (zh) | 基于神经网络自适应的深度哈希图像搜索方法 | |
Obayashi et al. | Multi-objective design exploration for aerodynamic configurations | |
CN110348708B (zh) | 一种基于极限学习机的地面目标动态威胁评估方法 | |
CN108573303A (zh) | 一种基于改进强化学习的复杂网络局部破坏的自改进恢复策略 | |
CN110473592A (zh) | 基于图卷积网络的有监督的多视角人类协同致死基因预测方法 | |
CN113190688A (zh) | 基于逻辑推理和图卷积的复杂网络链接预测方法及系统 | |
CN105760344B (zh) | 一种化学放热反应的分布式主元分析神经网络建模方法 | |
CN115329594B (zh) | 一种大规模导弹集群攻防对抗仿真加速方法及系统 | |
CN112861257B (zh) | 一种基于神经网络的飞机火控系统精度敏感性分析方法 | |
CN114167898B (zh) | 一种无人机收集数据的全局路径规划方法及系统 | |
CN113705641A (zh) | 基于富上下文网络的高光谱图像分类方法 | |
CN115222271A (zh) | 基于神经网络的武器目标分配方法 | |
CN113516019A (zh) | 高光谱图像解混方法、装置及电子设备 | |
CN116933948A (zh) | 基于改进海鸥算法与反向传播神经网络的预测方法和系统 | |
CN116011691A (zh) | 一种针对最优路径规划的分布式反馈混联注意力网络模型 | |
CN116611576B (zh) | 碳排量预测方法及装置 | |
CN109074348A (zh) | 用于对输入数据集进行迭代聚类的设备和迭代方法 | |
CN116956498A (zh) | 一种武器多体系统快速鲁棒性设计技术 | |
CN111353525A (zh) | 一种不均衡不完整数据集的建模及缺失值填补方法 | |
CN115640755A (zh) | 一种基于极限学习机的空战非完备信息数据处理方法 | |
CN113919425B (zh) | 一种空中目标自主分配方法及系统 | |
CN115984595A (zh) | 一种基于拉普拉斯秩约束的多元图聚类方法 | |
CN113962295A (zh) | 武器装备体系效能评估方法、系统及装置 | |
CN110059806A (zh) | 一种基于幂律函数的多阶段加权网络社团结构检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |