CN111160525B - 一种边缘计算环境下基于无人机群的任务卸载智能决策方法 - Google Patents

一种边缘计算环境下基于无人机群的任务卸载智能决策方法 Download PDF

Info

Publication number
CN111160525B
CN111160525B CN201911299550.7A CN201911299550A CN111160525B CN 111160525 B CN111160525 B CN 111160525B CN 201911299550 A CN201911299550 A CN 201911299550A CN 111160525 B CN111160525 B CN 111160525B
Authority
CN
China
Prior art keywords
model
decision
environment
task
aerial vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911299550.7A
Other languages
English (en)
Other versions
CN111160525A (zh
Inventor
曲冠锦
吴华明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201911299550.7A priority Critical patent/CN111160525B/zh
Publication of CN111160525A publication Critical patent/CN111160525A/zh
Application granted granted Critical
Publication of CN111160525B publication Critical patent/CN111160525B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种边缘计算环境下基于无人机群的任务卸载智能决策方法,(1)采集环境信息;(2)进行元学习,若发现边缘服务器或云中心的环境发生变化将修改模型的初始参数;(3)进行检索机制与强化学习,其中检索机制负责检索之前是否存在相似任务,若存在,直接输出决策结果;若不存在,进行强化学习,强化学习负责训练和判定整个强化学习系统,其中用到的两大模块是网络冻结和经验回放,判定完后取值函数最大的动作为决策结果进行输出。本方案采用元学习模型可以快速适应环境,当决策系统的环境发生改变时,本方案可以快速调整并迅速给出合理结果。针对无人机群任务相似,本方案引入记忆功能,对相似的任务可以作出快速的决策。

Description

一种边缘计算环境下基于无人机群的任务卸载智能决策方法
技术领域
本发明涉及无人机群任务卸载决策技术领域,尤其涉及一种边缘计算环境下基于无人机群的任务卸载智能决策方法。
背景技术
近年来,随着5G与无人机技术的日渐成熟,无人机群被越来越广泛的应用。通过与移动通信的结合,凭借其不受空间影响、响应能力强等特点,无人机群可以提供图像采集、信息传输等多项应用。然而,有限的计算能力和无人机缓存大小阻碍了其移动应用程序的应用,并导致大量的计算处理时间。此外,在无人机上进行任务计算会使得移动设备能耗增加,电池寿命缩短,降低无人机的使用时间。
移动边缘计算是一种新兴的计算范式,可通过靠近无人机群的边缘服务器,将无人机群与云计算中心进行连接,形成“无人机-边缘-云”计算环境下这一任务计算卸载模式,如图1所示。其中,云中心负责为执行移动应用程序提供弹性和按需的计算资源,边缘服务器负责决策哪些无人机群的计算任务需要卸载以及提供有限量的计算资源。这样无人机群所产生的计算任务先经边缘服务器进行任务卸载决策,再确定由哪一部分来进行计算处理。从而可以有效缓解无人机群计算能力差的缺陷。
无人机群在“无人机-边缘-云”计算环境下的任务卸载决策:即当无人机产生任务需求时,它可将计算任务迁移到边缘服务器或云服务器来进行计算。目前的卸载决策主要分为传统系统和智能系统。其中,传统系统多采用一些启发式算法,对于复杂问题往往无法求解,且计算量大,需要消耗大量计算资源;相反,最近兴起的智能算法可以有效的解决该类问题,通过引入深层神经网络可以使决策系统自动学习到合理可行的决策方案,但是仍存在学习速度慢,可移植性差等问题。
发明内容
为了解决上述问题,本申请的目的即是提供一种边缘计算环境下一种基于无人机群的任务卸载智能决策方法。
为实现本发明的目的,本发明提供了一种边缘计算环境下基于无人机群的任务卸载智能决策方法,包括如下步骤:
(1)采集环境信息;
(2)进行元学习,若发现边缘服务器或云中心的环境发生变化将修改模型的初始参数;
(3)进行检索机制与强化学习,其中检索机制负责检索之前是否存在相似任务,若存在,直接输出决策结果;若不存在,进行强化学习,强化学习负责训练和判定整个强化学习系统,其中用到的两大模块是网络冻结和经验回放,判定完后取值函数最大的动作为决策结果进行输出。
其中,
所述步骤(1)中采集环境信息包括采集无人机群的任务信息、无人机群的状态以及云中心的情况。
其中,
所述方法采用任务卸载智能决策模型,模型共分为两层,其中,内层是传统的卸载决策模型,负责接收工作流并训练、决策给出最终的卸载决定;外层是元学习部分,负责当决策系统的环境发生变化时,它可以调整内层系统中神经网络的参数,使得系统可以快速适应新环境,用很少的训练量就可以学习的很好。
其中,
模型采集任务数据和环境数据,然后外层模型判别环境是否发生变化,若发生环境变化将调整初始参数;之后输入到内层模型中,来检索是否存在相似任务,若存在相似任务则直接输出已有决策结果,否则将任务状态输入到内层模型的神经网络中进行计算,求出的结果通过网络冻结来求出损失函数进而更新网络参数;将值函数最大的动作设定为决策结果输入到记忆机制里,同时作为结果输出。
与现有技术相比,本发明的有益效果为,
针对传统方法计算量大,面对复杂问题无法求解的问题,本方案采用了智能算法,在强化学习的模型上加入了深度网络,可以针对具有相关性的复杂工作流进行卸载决策。
针对目前已有的智能算法的训练速度慢,可移植性差的缺点,本文引入了元学习的算法,引入了外层模型,观察模型所在环境是否发生变化,若发生变化则调整模型的初始参数,减去了模型初始参数从随机数开始学习的过程。使得模型可以快速适应新的环境,从而增强了模型的适应能力。
针对无人机群环境下任务往往重复或相似的情况,本文引入了记忆功能,模型在收到任务信息后会检查过往任务中是否存在相似任务,若存在则直接输出当时的决策结果而不必进入神经网络,从而使得模型可以针对相似的任务迅速给出决策,减少了系统的计算量,增加了模型的决策速度。
附图说明
图1为无人机群在无人机-边缘-云环境下的任务卸载示意图;
图2为本申请模型总体框架示意图;
图3为本申请内层模型流程图;
图4为本申请模型的流程图;
图5为本申请模型逻辑框图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用属于“包含”和/或“包括”时,其指明存在特征、步骤、操作、部件或者模块、组件和/或它们的组合。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本申请提出的任务卸载智能决策模型总体框架如图2所示。
从总体上看,该模型共分为两层,其中,内层是传统的卸载决策模型,负责接收工作流并训练、决策给出最终的卸载决定(这期间外层不参与);外层是元学习部分,负责当决策系统的环境发生变化时(如边缘服务器的性能或者带宽改变)时,它可以调整内层系统中神经网络的参数,使得系统可以快速适应新环境,用很少的训练量就可以学习的很好。
其中:
1.内层模型
内层模型主要负责对于输入的任务信息进行判断,并通过计算各种动作空间中的最大值函数来给出决策,同时内层模型里面嵌入记忆机制可以帮助训练模型和检索相似任务。任务信息进入决策系统后,先经过记忆机制,检索是否有相似任务,若有则直接输出当时的决策结果,减少计算量。没有的话则进入神经网络,进行Q学习(Q-Learning),得出的判别结果按最高价值进行选择,选取完后输出结果,同时将任务与其结论存到记忆机制里,以便进行训练和以后的检索。
1.1参数假设
a)状态s:对环境的描述,在本方案里,用工作流中的任务量v和各任务间的数据通信量e表示,决策模型将根据状态s来求出决策。
b)动作a:对决策模型可选择的决策的描述,在本方案中动作有三种:任务不卸载(即在本地执行)、任务卸载到边缘进行计算、任务卸载到云端进行计算。
c)策略π(a|s):是模型根据环境状态s来决定下一步的动作a的函数。
d)状态转移概率p(s′|s,a):模型根据当前状态s做出一个动作a之后,环境在下一个时刻转变为状态s′的概率。
e)及时奖励r(s,a,s′):及时奖励是一个标量函数,即模型根据当前状态s做出动作a之后,环境会反馈给模型一个奖励,这个奖励也经常和下一个时刻的状态s′有关。
f)神经网络NN:本模型是通过神经网络来进行动作空间值函数的计算。其中NNenv表示目标神经网络,其参数实时更新。NNtarget表示的是冻结神经网络,它的结构与NNenv一致,但是其参数是间断更新,负责消除任务间的关联性。
g)任务记录Φ[S,a,R,S′]:当模型决策完毕后要将任务记录存至记忆单元,其中S表示原状态,a表示所选择的动作,R表示所获得的及时奖励,S′表示执行动作后的状态。
h)状态值Vπ(S):表示从状态s开始,执行策略π得到的期望总汇报:
Figure BDA0002321518840000061
由于在本模型中,我们处理的是马尔科夫过程,所以Vπ(S)可展开成贝尔曼方程:
Vπ(S)=Ea~π(a|s)Es′~p(s′|s,a)[r(s,a,s′)+γVπ(s′)] (2)
该方程表示当前状态的值函数可以通过下个状态的值函数来计算。
i)状态-动作值函数Qπ(s,a):表示初始状态为s并进行动作a,然后执行策略π得到的期望总汇报:
Qπ(s,a)=Es′~p(s′|s,a)[r(s,a,s′)+γVπ(s′)] (3)
1.2内层模型的建立
内层模型中有关强化学习的部分,本方案采用Q学习与神经网络结合的深度强化学习方法。
Q学习部分:Q学习算法是一个异策略的时序差分学习算法。在Q学习中,Q函数的估计方法为:
Q(s,a)←Q(s,a)+α(r+γmaxa,Q(s′,a′)-Q(s,a)) (4)
相当于让Q(s,a)直接去估计最优状态值函数Q*(s,a)。
神经网络部分:神经网络部分则采用两个结构相同、参数不同的神经网络,其中一个是冻结目标网络,即在一个时间段内固定目标中的参数,来提高模型的稳定性。
除了参数更新算法,本方案还建立了一个记忆机制,即当任务决策完后,会把任务的状态、选择结果储存在记忆机制内,这个措施有两个作用:一是方便检索,当有新任务输入后,将检索有无与其相近的任务,若有的话直接输出当时的决策结果,提高决策速度;二是作为经验回放,通过构建一个经验池来去除数据的相关性,避免模型陷入局部最优。训练时,随机从经验池中抽取样布来进行训练。这样,也可以就打破了和相邻训练样本的相似性。提高训练速度。避免模型陷入局部最优。
如图3为内层模型流程图,无人机群将任务输入内层模型,模型首先通过检索机制检索以往有无相似任务,若有的话直接输出当时的结果。否则进入决策模型,在决策模型中将任务的状态输入神经网络NNenv、NNtarget,得出各个动作的值函数,选取最大值函数的动作amax进行输出,与此同时通过奖励函数和网络冻结来更新神经网络中的参数。得到输出动作后,将该任务的状态和动作输入记忆机制来进行经验回放的学习和检索功能,当在经验回放中得到新的动作时,将会替换原有动作以保证决策的合理性。
2.外层模型的建立
外层模型主要为了在环境发生变化时可以及时更新内层模型中的初始参数以保证模型可以快速适应新的环境。
在本方案中,我们假设环境变化后任务集为Γ其中第i个任务表示为Γi,内层网络中的神经网络采用常规的梯度下降来更新参数,则外层模型对于内层模型的初始参数更新算法为:
Figure BDA0002321518840000081
在下面给出卸载决策模型训练算法:
Figure BDA0002321518840000082
任务卸载智能决策模型的流程图如图4所示。
整个模型的流程为:
先采集环境信息,包括无人机群的任务信息、无人机群的状态以及云中心的情况等。然后进行元学习,若发现边缘服务器或云中心的环境发生变化将修改模型的初始参数。元学习之后将进行检索机制与强化学习。其中检索机制负责检索之前是否存在相似任务,有的话直接输出决策结果。强化学习负责训练和判定整个强化学习系统,其中用到的两大模块是网络冻结和经验回放。判定完后取值函数最大的动作为决策结果进行输出。
任务卸载智能决策模型的逻辑框图的内容如图5所示。首先,模型采集任务数据和环境数据,然后外层模型判别环境是否发生变化,若发生环境变化将调整初始参数。之后输入到内层模型中,来检索是否存在相似任务,若存在相似任务则直接输出已有决策结果,否则将任务状态输入到内层模型的神经网络中进行计算,求出的结果通过网络冻结来求出损失函数进而更新网络参数。将值函数最大的动作设定为决策结果输入到记忆机制里,同时作为结果输出。
针对传统方法计算量大,面对复杂问题无法求解的问题,本方案采用了智能算法,在强化学习的模型上加入了深度网络,可以针对具有相关性的复杂工作流进行卸载决策。
针对目前已有的智能算法的训练速度慢,可移植性差的缺点,本文引入了元学习的算法,引入了外层模型,观察模型所在环境是否发生变化,若发生变化则调整模型的初始参数,减去了模型初始参数从随机数开始学习的过程。使得模型可以快速适应新的环境,从而增强了模型的适应能力。
针对无人机群环境下任务往往重复或相似的情况,本文引入了记忆功能,模型在收到任务信息后会检查过往任务中是否存在相似任务,若存在则直接输出当时的决策结果而不必进入神经网络,从而使得模型可以针对相似的任务迅速给出决策,减少了系统的计算量,增加了模型的决策速度。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (1)

1.一种边缘计算环境下基于无人机群的任务卸载智能决策方法,其特征在于,包括如下步骤:
(1)采集环境信息,包括采集无人机群的任务信息、无人机群的状态以及云中心的情况;
(2)进行元学习,若发现边缘服务器或云中心的环境发生变化将修改模型的初始参数;所述模型为任务卸载智能决策模型,模型共分为两层,其中,内层是传统的卸载决策模型,负责接收工作流并训练、决策给出最终的卸载决定;外层是元学习部分,负责当决策系统的环境发生变化时,它可以调整内层系统中神经网络的参数,使得系统可以快速适应新环境,用很少的训练量就可以学习的很好;
(3)进行检索机制与强化学习,其中检索机制负责检索之前是否存在相似任务,若存在,直接输出决策结果;若不存在,进行强化学习,强化学习负责训练和判定整个强化学习系统,其中用到的两大模块是网络冻结和经验回放,判定完后取值函数最大的动作为决策结果进行输出;
模型采集任务数据和环境数据,然后外层模型判别环境是否发生变化,若发生环境变化将调整初始参数;之后输入到内层模型中,来检索是否存在相似任务,若存在相似任务则直接输出已有决策结果,否则将任务状态输入到内层模型的神经网络中进行计算,求出的结果通过网络冻结来求出损失函数进而更新网络参数;将值函数最大的动作设定为决策结果输入到记忆机制里,同时作为结果输出。
CN201911299550.7A 2019-12-17 2019-12-17 一种边缘计算环境下基于无人机群的任务卸载智能决策方法 Active CN111160525B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911299550.7A CN111160525B (zh) 2019-12-17 2019-12-17 一种边缘计算环境下基于无人机群的任务卸载智能决策方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911299550.7A CN111160525B (zh) 2019-12-17 2019-12-17 一种边缘计算环境下基于无人机群的任务卸载智能决策方法

Publications (2)

Publication Number Publication Date
CN111160525A CN111160525A (zh) 2020-05-15
CN111160525B true CN111160525B (zh) 2023-06-20

Family

ID=70557441

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911299550.7A Active CN111160525B (zh) 2019-12-17 2019-12-17 一种边缘计算环境下基于无人机群的任务卸载智能决策方法

Country Status (1)

Country Link
CN (1) CN111160525B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112650272B (zh) * 2020-11-24 2022-11-01 太原理工大学 基于5g的煤矿井下无人机巡视信息感知方法及其感知系统
CN112734030B (zh) * 2020-12-31 2022-09-02 中国科学技术大学 用状态相似性进行经验回放采样的无人平台决策学习方法
CN112887272B (zh) * 2021-01-12 2022-06-28 绍兴文理学院 一种传感边缘云任务卸载中挖矿攻击面控制装置及方法
CN112995023B (zh) * 2021-03-02 2022-04-19 北京邮电大学 一种多接入边缘计算网络计算卸载系统及其计算卸载方法
CN113032904B (zh) * 2021-03-22 2021-11-23 北京航空航天大学杭州创新研究院 模型构建方法、任务分配方法、装置、设备及介质
CN113064671A (zh) * 2021-04-27 2021-07-02 清华大学 基于多智能体的边缘云可扩展任务卸载方法
CN113434212B (zh) * 2021-06-24 2023-03-21 北京邮电大学 基于元强化学习的缓存辅助任务协作卸载与资源分配方法
CN113778550B (zh) * 2021-08-17 2022-05-03 南京邮电大学 一种基于移动边缘计算的任务卸载系统和方法
CN114138373B (zh) * 2021-12-07 2023-10-24 吉林大学 一种基于强化学习的边缘计算任务卸载方法
CN115827108B (zh) * 2023-01-10 2023-04-21 天津工业大学 基于多目标深度强化学习的无人机边缘计算卸载方法
CN116112981B (zh) * 2023-04-13 2023-07-25 东南大学 一种基于边缘计算的无人机任务卸载方法
CN117648585B (zh) * 2024-01-29 2024-05-10 中国人民解放军军事科学院国防科技创新研究院 基于任务相似度的智能决策模型泛化方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2005137948A (ru) * 2005-12-07 2007-06-20 Государственное образовательное учреждение высшего профессионального образовани Военный институт радиоэлектроники (RU) Интегрированный механизм "виппер" подготовки и осуществления дистанционного мониторинга и блокирования потенциально опасных объектов, оснащаемый блочно-модульным оборудованием и машиночитаемыми носителями баз данных и библиотек сменных программных модулей
CN109613934A (zh) * 2019-01-09 2019-04-12 天津大学 一种无人机捕捉黑飞无人机的方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110313933A1 (en) * 2010-03-16 2011-12-22 The University Of Washington Through Its Center For Commercialization Decision-Theoretic Control of Crowd-Sourced Workflows
US8504400B2 (en) * 2010-03-24 2013-08-06 International Business Machines Corporation Dynamically optimized distributed cloud computing-based business process management (BPM) system
CN105069010B (zh) * 2015-07-07 2018-04-17 西安电子科技大学 基于多Agent的资源聚合方法
WO2017067586A1 (en) * 2015-10-21 2017-04-27 Deutsche Telekom Ag Method and system for code offloading in mobile computing
CN107066292A (zh) * 2017-03-06 2017-08-18 北京百度网讯科技有限公司 服务器环境部署方法和装置
US10037231B1 (en) * 2017-06-07 2018-07-31 Hong Kong Applied Science and Technology Research Institute Company Limited Method and system for jointly determining computational offloading and content prefetching in a cellular communication system
CN107453900B (zh) * 2017-07-28 2020-09-04 北京富邦智慧物联科技有限公司 一种云解析参数设定管理系统及实现参数设定的方法
CN108920279B (zh) * 2018-07-13 2021-06-08 哈尔滨工业大学 一种多用户场景下的移动边缘计算任务卸载方法
CN109857551B (zh) * 2019-01-09 2023-12-19 平安科技(深圳)有限公司 基于云计算的服务资源的调度方法及装置、电子设备
CN109858134B (zh) * 2019-01-25 2020-09-08 北京理工大学 大数据驱动的辅助多装备系统体系结构模型构建的方法
CN109976909B (zh) * 2019-03-18 2022-11-08 中南大学 边缘计算网络中基于学习的低延时任务调度方法
CN110308740B (zh) * 2019-06-28 2022-02-22 天津大学 一种面向移动目标追踪的无人机群动态任务分配方法
CN110351571B (zh) * 2019-07-05 2020-09-25 清华大学 基于深度强化学习的直播视频云转码资源分配与调度方法
CN110351754B (zh) * 2019-07-15 2022-05-24 北京工业大学 基于Q-learning的工业互联网机器设备用户数据计算卸载决策方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2005137948A (ru) * 2005-12-07 2007-06-20 Государственное образовательное учреждение высшего профессионального образовани Военный институт радиоэлектроники (RU) Интегрированный механизм "виппер" подготовки и осуществления дистанционного мониторинга и блокирования потенциально опасных объектов, оснащаемый блочно-модульным оборудованием и машиночитаемыми носителями баз данных и библиотек сменных программных модулей
CN109613934A (zh) * 2019-01-09 2019-04-12 天津大学 一种无人机捕捉黑飞无人机的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于数据卸载策略的能量优化方法在移动代理路径规划中的应用;史霄波;鲁建宇;王文烨;阮航;朱;;电信科学(第02期);全文 *
面向异构无人机中继网络的负载均衡:一种分层博弈方法;杨婷婷;宋绯;孙有铭;姚凯凌;杨旸;;通信技术(第11期);全文 *

Also Published As

Publication number Publication date
CN111160525A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
CN111160525B (zh) 一种边缘计算环境下基于无人机群的任务卸载智能决策方法
CN110264750B (zh) 一种基于多任务深度q网络的q值迁移的多交叉口信号灯协同控制方法
CN111625361A (zh) 一种基于云端服务器和IoT设备协同的联合学习框架
CN110968426B (zh) 一种基于在线学习的边云协同k均值聚类的模型优化方法
CN110852448A (zh) 一种基于多智能体强化学习的合作型智能体的学习方法
CN115879535A (zh) 一种自动驾驶感知模型的训练方法、装置、设备和介质
CN112367640A (zh) 基于移动边缘计算的v2v模式多任务卸载方法及系统
CN111159063B (zh) 一种面向多层Sketch网络测量的缓存分配方法
CN116080407B (zh) 一种基于无线能量传输的无人机能耗优化方法与系统
Yang et al. Deep reinforcement learning based wireless network optimization: A comparative study
CN116244647A (zh) 一种无人机集群的运行状态估计方法
CN116757249A (zh) 一种基于分布式强化学习的无人机集群策略意图识别方法
CN114298278A (zh) 一种基于预训练模型的电工装备性能预测方法
CN114528972A (zh) 移动边缘计算中深度学习模型训练方法及相应系统
CN117710312A (zh) 基于联邦学习和YOLOv5的输电网异物检测方法
CN117371761A (zh) 一种智慧海洋物联网任务调度方法、装置、设备及介质
Zhang et al. Vulcan: Automatic Query Planning for Live {ML} Analytics
CN114863485A (zh) 基于深度相互学习的跨域行人重识别方法及系统
CN113033653A (zh) 一种边-云协同的深度神经网络模型训练方法
CN114881229B (zh) 一种基于参数渐次冻结的个性化协作学习方法和装置
CN116070714B (zh) 基于联邦学习和神经架构搜索的云边协同训练方法及系统
CN118278544B (zh) 基于多智能体联邦强化学习的时效优化方法
CN115952009B (zh) 基于算网融合特征的数据中心推荐方法及装置
CN113572832B (zh) 一种基于端边云及深度强化学习的无人机械协作方法
Yin et al. FedSCS: Client selection for federated learning under system heterogeneity and client fairness with a Stackelberg game approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant