CN111726826A - 一种基站密集型边缘计算网络中的在线任务卸载方法 - Google Patents
一种基站密集型边缘计算网络中的在线任务卸载方法 Download PDFInfo
- Publication number
- CN111726826A CN111726826A CN202010445667.8A CN202010445667A CN111726826A CN 111726826 A CN111726826 A CN 111726826A CN 202010445667 A CN202010445667 A CN 202010445667A CN 111726826 A CN111726826 A CN 111726826A
- Authority
- CN
- China
- Prior art keywords
- network
- user
- task
- online
- computing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000009471 action Effects 0.000 claims abstract description 48
- 238000005265 energy consumption Methods 0.000 claims abstract description 32
- 230000008569 process Effects 0.000 claims abstract description 18
- 230000005540 biological transmission Effects 0.000 claims abstract description 17
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 230000002787 reinforcement Effects 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 10
- 230000003993 interaction Effects 0.000 claims abstract description 6
- 238000013528 artificial neural network Methods 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims description 16
- 230000007704 transition Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000013508 migration Methods 0.000 claims description 4
- 230000005012 migration Effects 0.000 claims description 4
- 239000013307 optical fiber Substances 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 16
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/06—Testing, supervising or monitoring using simulated traffic
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明涉及一种基站密集型边缘计算网络中的在线任务卸载方法,基于深度强化学习,通过在线学习方式为智能设备用户在一个基站密集网络覆盖区域下移动时,针对不断产生异构的计算任务制定卸载策略,从而使得计算任务的总时延和设备总消耗最小化。本发明算法包含两个交替的阶段,第一个阶段为卸载决策动作的产生,即用户利用深度神经网络选择出最佳卸载决策、CPU频率以及传输功率,再存储下用户和网络的交互过程作为经验。第二阶段为网络训练部分,利用经验回放技术和一个与在线网络结构相同但参数不同的目标网络来训练在线网络的参数。本发明保证在用户无法获取全局和未来信息和设备能耗受限情况下,计算任务的总完成时延和设备能耗开销最小。
Description
技术领域
本发明涉及一种基站密集型边缘计算网络中的在线任务卸载方法,是一种考虑用户在边缘计算网络覆盖的区域移动过程中,使所有产生的计算任务完成时延以及设备能耗最小的方法。考虑到异构计算任务低时延需求、移动设备能耗受限和动态变化的无线网络,需要为移动用户提供合理的卸载策略以及资源规划以保证最小化计算任务的总时延和设备能耗。
背景技术
随着物联网的发展,各种智能移动终端呈爆发式增长,同时通信技术不断更新换代,大量的新型应用出现,其中一些应用有着低时延高消耗的特点,而移动设备的计算资源和能源资源是受限的,由此边缘计算这一在核心网的边缘为移动设备提供计算服务的概念顺势而生。
计算卸载问题是边缘计算中广受重视的研究,一个优质的卸载策略能够提升应用的服务质量和用户体验。如附图1所示,当智能设备用户在一个基站密集型网络覆盖区域下移动时,会不断产生异构的计算任务,用户需要根据当前的网络连接状况、任务的属性以及自身设备的限制去选择一个卸载策略,即在本地以某一CPU频率执行还是以一定的传输功率将任务卸载到一个可连接基站来执行。不同的卸载策略会造成不同的任务完成时延和设备能量损耗,而对于用户来说,一个好的策略应使得总时延和能耗最小。然而制定这样的策略十分困难,首先计算任务具有异构性、随机性,而且无线通信网络环境也是动态变化的,加上用户具有移动性,在不可预知条件下很难采取最优卸载决策;其次,智能设备的能量是受限的,关乎到长期的能量消耗,由此需要合理规划CPU频率和传输功率来节省能耗;最后,当用户进行卸载时,需要根据自己的位置选择基站,不同的选择会带来不同的服务迁移时延,这又成为了制定最优策略的一个难点。因此,如何为用户在无法获取未来信息前提下制定最优的卸载策略是一个复杂的问题。近几年,虽然有大量的研究工作考虑到了计算卸载策略制定的问题,但是它们通常忽视了用户的移动性,而且许多工作是基于系统层面的卸载策略制定,没有以用户为中心制定策略,除此以外,同时考虑优化任务完成时延和设备能耗的策略也很少。
发明内容
本发明的目的是针对已有技术的不足,提供一种基站密集型边缘计算网络中的在线任务卸载方法,为移动智能设备设计了一种基于深度强化学习决策算法,以保证在最小化计算任务的总时延下,同时使得设备的能耗最小。该方法考虑到用户的移动性、计算任务的异构随机性、网络环境的动态性以及设备能耗受限,由此,本发明提出了一种计算卸载决策算法,使得计算任务的总时延和设备能量消耗最小化。
为了达到上述发明目的,本发明采用如下技术方案:
一种基站密集型边缘计算网络中的在线任务卸载方法,其特征在于操作步骤如下:
步骤一,为边缘计算网络进行建模:
一个用户在一个基站密集型边缘计算网络覆盖的区域中移动,该区域中密集地部署了N个基站,所有基站构成集合每一个基站都配备一个边缘服务器,因此基站既可为用户提供无线电接入服务也可提供计算资源。不同边缘服务器拥有不同的计算能力,其最大CPU处理频率表示为fi。基站之间可通过有线电缆或者光纤进行通信。为了更好地表征在线边缘计算系统,将时间离散化为多个等长时间片组成的时间序列,定义为在每个时间片下,用户设备会产生一个计算任务ψt=(st,ct),其中st为输入数据大小,ct为计算该任务所需CPU时钟周期数。在每个时间片下,用户设备只能连接到部分基站且连接到不同基站的信道增益和用户的位置有关。
步骤二,为计算任务执行模式建模。每个计算任务都可通过两种方式被执行,用ot∈{0}∪Kt表示t时刻时用户的卸载决策。
(1)本地执行模型:
(2)边缘执行模型:
当ot=i∈Kt时,任务在边缘服务器i执行。用户首先需从个离散等级中选择一个传输功率来将任务数据以的数据传输率传送至边缘服务器,其中Wi是信道带宽,是边缘服务器i的平均干扰噪声,总传输时延为传输过程产生的能耗为任务到达边缘服务器i后,处理时延为除此以外,若用户卸载时的服务器不同于上一次卸载的选择,会造成一定的服务迁移时延,用来表示用户连接基站的状态,且任意两基站间切换时延记为σi,j,由此切换时延为另外在任何执行模型中,每个时间片下消耗的能耗不能超过当前剩余能量根据上述系统模型,在时间t下,完成任务ψt的总时延可归结为能量消耗为
在线任务卸载的目标是在考虑到用户的移动性、计算任务的异构随机性、网络环境的动态性以及设备能耗受限情况下,最小化计算任务的总时延和设备能量消耗。用户设备需要为每一个时间片下到达的任务决定是否卸载,如果卸载需要根据当前网络状况决定卸载到哪个基站,并根据卸载决策调整CPU频率和传输功率。综上,边缘计算网络中的在线计算卸载问题可形式化为:
这是具有耦合约束的多目标优化规划问题,两个目标需要进行权衡,即在以某一卸载方式下选择更大的CPU频率或者传输功率来减少时延从而牺牲设备能量。
步骤三,卸载决策建模:
根据上述系统模型,卸载决策问题可建模成马尔可夫决策过程其中为状态空间,为动作空间,为转移概率,为奖励函数,γ∈[0,1]为折扣因子。在每个时间片下,状态表示为是所有基站的信道增益,为决策动作,用户获得的奖励为其中ω1和ω2是两个目标的权重,x为当设备能源耗尽时的奖励。转移概率为在状态st采取动作at变化为st+1。根据上述马尔科夫决策模型,原问题可转换为策略决策问题,即选择一个最优策略π最大化累计折扣奖励:
步骤四,确定卸载策略:
根据上述模型,设计了基于深度强化学习的在线计算卸载算法,如附图2所示,算法包含两个交替的阶段,即卸载决策动作的产生和网络训练,其详细细节如下:
4-1、卸载决策动作产生:在每个时间片t下,用户获取当前状态st输入到一个参数记为θ全连接神经网络中,该网络称为在线网络,包含一个输入层、两层隐藏层、一层输出层,此网络用于输出所有动作的价值,再通过筛选操作得到可选择动作,最后采用∈-贪心策略以∈的概率随机选择一个动作,以1-∈的概率选择具有最大值的动作,选择的动作at处理完计算任务得到由环境反馈的奖励rt和下一个状态st+1。这一交互过程会作为一条经验(st,at,rt,st+1)存放到经验池中。
4-2、网络训练:随机从经验池中的采样一批大小为的经验{(sj,aj,rj,sj+1),j∈J}。以一条经验为例,将sj输入到在线网络中,获得动作aj的价值Q(sj,aj;θ),再将sj+1输入到在线网络中并选择一个具有最大价值的动作aj+1=argmaxaQ(sj,aj;θ),再利用一个参数为θ_的目标网络,这个网络和在线网络具有相同的结构。接下来依据贝尔曼方程,根据经验中的奖励rj来获取目标动作价值qj:
qj=rj+γQ(sj+1,aj+1;θ_)
由此,在线网络的参数可更新为:
其中α为学习率。除此以外,目标网络的参数每隔一段时间复制一次在线网络的参数作为自己的网络参数。
本发明的与现有技术相比较,具有如下显而易见的突出实质性特点和显著技术进步:
1.本发明考虑了在基站密集型边缘计算网络中用户移动过程中的计算卸载问题,并将这一问题建模成了马尔可夫决策过程。
2.本发明提出一个基于深度强化学习的制定最优计算卸载策略的算法,使得总的任务计算时延和设备能耗最小化。
3.经大量实验验证,所提算法可在没有未来信息的情况下拥有最优的性能。
附图说明
图1是本发明用户在基站密集型边缘计算网络中移动时进行卸载决策的示意图。
图2是本发明基于深度强化学习的在线任务卸载算法的流程图。
图3是本发明不同方法的基站数量和获得的总奖励的关系图。
图4是本发明不同卸载方法的计算任务数量和获得总奖励的关系图。
图5是本发明不同方法在基站间每一跳的切换时延变换时获得的总奖励的关系图。
具体实施方式
本发明的优选实施例结合附图详述如下:
实施例一:
在本实施例中,参见图1和图2,一种基站密集型边缘计算网络中的在线任务卸载方法,操作步骤如下:
步骤一,为边缘计算网络建模:
不同边缘服务器拥有不同的计算能力,其最大CPU处理频率表示为fi;基站之间可通过有线电缆或者光纤进行通信;
为了更好地表征在线边缘计算系统,将时间离散化为多个等长时间片组成的时间序列,定义为在每个时间片t∈T下,用户设备会产生一个计算任务ψt=(st,ct),其中st为输入数据大小,ct为计算该任务所需CPU时钟周期数;
步骤二,为计算任务执行模式建模:
每个计算任务都可通过两种方式被执行,用ot∈{0∪Kt}表示t时刻时用户的卸载决策;
步骤2-1、本地执行模型:
步骤2-2、边缘执行模型:
当ot=i∈Kt时,任务在边缘服务器i执行;用户首先需从个离散等级中选择一个传输功率来将任务数据以的数据传输率传送至边缘服务器,其中Wi是信道带宽,是边缘服务器i的平均干扰噪声,总传输时延为传输过程产生的能耗为
任务到达边缘服务器i后,处理时延为除此以外,若用户卸载时的服务器不同于上一次卸载的选择,会造成一定的服务迁移时延,用δt∈N来表示用户连接基站的状态,且任意两基站间切换时延记为σi,j,由此切换时延为
步骤三,卸载决策建模:
步骤四:确定卸载策略:
利用基于深度强化学习的方法为计算任务制定卸载策略,使得用户在移动过程中产生的任务所耗费的计算总时延和设备能耗尽可能的小。
实施例二:
本实施例与实施例一基本相同,特别之处在于:
在本实施例中,在所述步骤四中,深度强化学习方法包含两个交替的阶段,即卸载决策动作的产生和网络训练,其具体操作如下:
4-1、卸载决策动作产生:
在每个时间片t下,用户获取当前状态st输入到一个参数记为θ全连接神经网络中,该网络称为在线网络,包含一个输入层、两层隐藏层、一层输出层,此网络用于输出所有动作的价值,再通过筛选操作得到可选择动作,最后采用∈-贪心策略以∈的概率随机选择一个动作,以1-∈的概率选择具有最大值的动作,选择的动作at处理完计算任务得到由环境反馈的奖励rt和下一个状态st+1;这一交互过程作为一条经验(st,at,rt,st+1)存放到经验池中;
4-2、网络训练:随机从经验池中的采样一批大小为的经验以一条经验为例,将sj输入到在线网络中,获得动作aj的价值Q(sj,aj;θ),再将sj+1输入到在线网络中并选择一个具有最大价值的动作aj+1=argmaxaQ(sj,aj;θ),再利用一个参数为θ_的目标网络,这个网络和在线网络具有相同的结构;接下来依据贝尔曼方程,根据经验中的奖励rj来获取目标动作价值qj:
qj=rj+γQ(sj+1,aj+1;θ_)
由此,在线网络的参数可更新为:
其中α为学习率;除此以外,目标网络的参数每隔一段时间复制一次在线网络的参数作为自己的网络参数。
实施例三:
本实施例与前述实施例基本相同,特别之处在于:
在本实施例中,参照图2,一种基站密集型边缘计算网络中的在线任务卸载方法,操作步骤为:
步骤一,为边缘计算网络建模:
考虑一个用户在一个基站密集型边缘计算网络覆盖的区域中移动,该区域中密集地部署了N个基站,所有基站构成集合每一个基站都配备一个边缘服务器,因此基站既可为用户提供无线电接入服务也可提供计算资源。不同边缘服务器拥有不同的计算能力,其最大CPU处理频率表示为fi。基站之间可通过有线电缆或者光纤进行通信。为了更好地表征在线边缘计算系统,将时间离散化为多个等长时间片组成的时间序列,定义为在每个时间片下,用户设备会产生一个计算任务ψt=(st,ct),其中st为输入数据的大小,ct为计算该任务所需CPU时钟周期数。在每个时间片下,用户设备只能连接到部分基站且连接到不同基站的信道增益和用户的位置有关。
步骤二,为计算任务执行模式建模:
每个计算任务都可通过两种方式被执行,分别为本地执行和边缘执行,不同的执行模式会造成不同的任务完成时延和设备能量消耗。在线计算卸载的目标即考虑移动智能设备能耗限制条件下,最小化总的任务完成时延和设备能量消耗。这一问题可通过设计在线的基于学习的算法来解决,使得用户设备可独立进行任务卸载决策。
步骤三,卸载决策建模:
对上述的任务卸载决策问题,可建模成马尔可夫决策过程其中为状态空间,为动作空间,为转移概率,为奖励函数,γ∈[0,1]为折扣因子。在每个时间片下,状态表示为是所有基站的信道增益, 为决策动作,用户获得的奖励为其中ω1和ω2是两个目标的权重,x为当设备能源耗尽时的奖励。转移概率为在状态st采取动作at变化为st+1。由此,问题转换为求解马尔可夫决策过程。
步骤四、确定卸载策略:
利用基于深度强化学习的方法为计算任务制定卸载策略,使得用户在移动过程中产生的任务所耗费的计算总时延和设备能耗尽可能的小。所述的基于深度强化学习方法包含两个交替的阶段,即卸载决策动作的产生和网络训练,其详细细节如下:
4-1.卸载决策动作产生:在每个时间片t下,用户获取当前状态st输入到一个参数记为θ全连接神经网络中,该网络称为在线网络,包含一个输入层、两层隐藏层、一层输出层,此网络用于输出所有动作的价值,再通过筛选操作得到可选择动作,最后采用∈-贪心策略以∈的概率随机选择一个动作,以1-∈的概率选择具有最大值的动作,选择的动作at处理完计算任务得到由环境反馈的奖励rt和下一个状态st+1。这一交互过程会作为一条经验(st,at,rt,st+1)存放到经验池中。
4-2.网络训练:
随机从经验池中的采样一批大小为的经验{(sj,aj,rj,sj+1),j∈J}。以一条经验为例,将sj输入到在线网络中,获得动作aj的价值Q(sj,aj;θ),再将sj+1输入到在线网络中并选择一个具有最大价值的动作aj+1=argmaxaQ(sj,aj;θ),再利用一个参数为θ_的目标网络,这个网络和在线网络具有相同的结构。接下来依据贝尔曼方程,根据经验中的奖励rj来获取目标动作价值qj:
qj=rj+γQ(sj+1。aj+1;θ_)
由此,在线网络的参数可更新为:
其中α为学习率。除此以外,目标网络的参数每隔一段时间复制一次在线网络的参数作为自己的网络参数。
为了更清晰的阐述本发明的目的、技术方案和优点。本实施例通过仿真实验的方式进一步说明本发明实施例的基站密集型边缘计算网络中的在线任务卸载方法的技术效果。本实施例的基于深度强化学习的算法步骤为:
首先在每个时间片下,获取当前用户设备所能观测到的状态信息,再将状态输入到在线网络中,网络输出每一个种动作的价值,根据当前可连接基站情况,对动作进行筛选,得到所有可行动作的价值,以∈-贪心策略选择一个动作执行,接着环境给出这一操作带来的奖励和下一个状态,最后把这一交互过程存储为一条经验,用于对在线网络的训练。本实施例基于深度强化学习的算法使得用户设备可在没有未来信息的情况下独立地决定适宜的卸载方案。
在下面的模拟实验对比过程中,系统参数的默认设置如下。本实施例考虑在一个2km×2km的区域有30个基站且均匀地部署在边缘计算网络中,每个边缘服务器的总计算能力均匀分布在[5,10]GHz,基站服务器间的切换延迟与网络拓扑相关并设定一跳是50ms。用户设备和基站通信的信道增益与用户到基站的距离相关,建模为其中β=4为路径损耗指数。此外,用户设备与不同基站间信道带宽和平均干扰功率相同,分别设置为10MHz和2×10-13W。用户设备可分别进行两种级别的CPU频率和发射功率的选择,这两个级别的CPU频率分别设置为1GHz和2GHz,发射功率的级别分别为2mW或4mW。用户设备的有效转换电容为κ=1×10-3,初始设备电量设置为本实施例默认用户移动过程中产生了150个计算任务,这些任务的输入数据大小st∈{0.3,4}Mbits,所需的CPU周期ct∈[2.5,12]GHz/任务。奖励函数中对于时延和能量的权重分别设置为ω1=1和ω2=0.5,并设置能源耗尽时奖励为x=-5。此外,方法中的经验池大小为10000,采样批大小为256,折扣因子为0.9,学习率为0.01,探索概率为0.05,以及更新目标网络参数的频率为200。
首先简要介绍下作为比较标准的四个对比方法仅本地执行(Local Execution)、仅边缘执行(Edge Execution)和贪婪执行(Greedy Execution)。Local Execution将所有计算任务以一定的CPU频率在本地进行处理,Edge Execution将所有计算任务以一定的传输功率卸载到具有最好的信道质量的边缘服务器上执行。Greedy Execution则在每一个时间片下根据当前可获取的信息选择一个最优的策略。
根据上述方法与具体参数设置,通过改变基站数量、时间片数量和切换时延来评估四种算法的性能。每组实验重复10次并取平均值作为最终结果。下文实验对比图中将本发明实施例的基站密集型边缘计算网络中的在线任务卸载方法简称为:Our Approach。
如图3所示,展示了当基站数量变化时每种方法获得的总奖励。从图中可见无论部署了多少个基站,本实施例采用的算法总是比其他方法获得的回报更多,由此可看出本实施例方法的扩展性。具体而言,本实施例采用算法所获得的总奖励分别比GreedyExecution、Edge Execution和Local Execution高14.13%,10.55%和30.75%。
图4对比了当计算任务数量从80逐渐到200时不同卸载方法获得的总奖励,能很容易地发现,计算任务越多,每种方法获得的奖励越小。这是因为随计算任务越多,完成所有任务的总时延就越大,并且设备能耗也增大,尤其当能耗耗尽时,用户会得到一个较大的负奖励。不过,与其他三个方法对比可看出,无论有多少计算任务,本实施例方法都能获得更好的性能。尤其是在有200个时间片时,本实施例算法获得的总奖励分别比GreedyExecution、Edge Execution和Local Execution高3.06%,22.76%和33.56%。
在图5中,对比了每种方法在基站间每一跳的切换时延变换时获得的总奖励。随着每一跳切换时延增加,除Local Execution方法外,其他方法获得的总奖励都变小了。因为增加每一跳的切换时延不会影响本地执行方法,除此外,更大的切换时延导致了任务完成时延变长,从而导致了每种方法获得的奖励变少。但是本实施例方法可制定合理的策略来减少切换时延的产生,从而最大程度地提高总回报,因此是优于其他方法的。当切换时延为250ms时,本实施例算法获得的总奖励分别比Greedy Execution、Edge Execution和LocalExecution高5.12%,12.94%和19.78%。
综上所述,本发明提供的一种基站密集型边缘计算网络中的在线任务卸载方法,通过考虑用户移动性、网络环境动态行和任务异构性,解决了基站密集型边缘计算网络中的在线任务卸载问题,用户通过一个在线网络独立地进行任务卸载决策,大大减少完成设备产生的计算任务的总时延,同时也降低了移动设备完成任务所消耗的能量,使其在有限的能耗限制下完成更多计算任务。
所属领域的普通技术人员应当理解:以上所述实施例仅作为本发明的示例性讨论,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.一种基站密集型边缘计算网络中的在线任务卸载方法,其特征在于,操作步骤如下:
步骤一,为边缘计算网络建模:
不同边缘服务器拥有不同的计算能力,其最大CPU处理频率表示为fi;基站之间可通过有线电缆或者光纤进行通信;
为了更好地表征在线边缘计算系统,将时间离散化为多个等长时间片组成的时间序列,定义为在每个时间片下,用户设备会产生一个计算任务ψt=(st,ct),其中st为输入数据大小,ct为计算该任务所需CPU时钟周期数;
步骤二,为计算任务执行模式建模:
每个计算任务都可通过两种方式被执行,用ot∈{0∪Kt}表示t时刻时用户的卸载决策;
步骤2-1、本地执行模型:
步骤2-2、边缘执行模型:
当ot=i∈Kt时,任务在边缘服务器i执行;用户首先需从个离散等级中选择一个传输功率来将任务数据以的数据传输率传送至边缘服务器,其中Wi是信道带宽,是边缘服务器i的平均干扰噪声,总传输时延为传输过程产生的能耗为
步骤三,卸载决策建模:
步骤四,确定卸载策略:
利用基于深度强化学习的方法为计算任务制定卸载策略,使得用户在移动过程中产生的任务所耗费的计算总时延和设备能耗尽可能的小。
2.根据权利要求1所述的移动边缘计算网络中的在线任务卸载方法,其特征在于,在所述步骤四中,深度强化学习方法包含两个交替的阶段,即卸载决策动作的产生和网络训练,其具体操作如下:
4-1、卸载决策动作产生:
在每个时间片t下,用户获取当前状态st输入到一个参数记为θ全连接神经网络中,该网络称为在线网络,包含一个输入层、两层隐藏层、一层输出层,此网络用于输出所有动作的价值,再通过筛选操作得到可选择动作,最后采用∈-贪心策略以∈的概率随机选择一个动作,以1-∈的概率选择具有最大值的动作,选择的动作at处理完计算任务得到由环境反馈的奖励rt和下一个状态st+1;这一交互过程作为一条经验(st,at,rt,st+1)存放到经验池中;
4-2、网络训练:随机从经验池中的采样一批大小为的经验以一条经验为例,将sj输入到在线网络中,获得动作aj的价值Q(sj,aj;θ),再将sj+1输入到在线网络中并选择一个具有最大价值的动作aj+1=argmaxaQ(sj,aj;θ),再利用一个参数为θ_的目标网络,这个网络和在线网络具有相同的结构;接下来依据贝尔曼方程,根据经验中的奖励rj来获取目标动作价值qj:
qj=rj+γQ(sj+1,aj+1;θ_)
由此,在线网络的参数可更新为:
其中α为学习率;除此以外,目标网络的参数每隔一段时间复制一次在线网络的参数作为自己的网络参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010445667.8A CN111726826B (zh) | 2020-05-25 | 2020-05-25 | 一种基站密集型边缘计算网络中的在线任务卸载方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010445667.8A CN111726826B (zh) | 2020-05-25 | 2020-05-25 | 一种基站密集型边缘计算网络中的在线任务卸载方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111726826A true CN111726826A (zh) | 2020-09-29 |
CN111726826B CN111726826B (zh) | 2024-03-19 |
Family
ID=72565021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010445667.8A Active CN111726826B (zh) | 2020-05-25 | 2020-05-25 | 一种基站密集型边缘计算网络中的在线任务卸载方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111726826B (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112148464A (zh) * | 2020-10-30 | 2020-12-29 | 深圳供电局有限公司 | 一种移动边缘计算任务的卸载方法及系统 |
CN112241295A (zh) * | 2020-10-28 | 2021-01-19 | 深圳供电局有限公司 | 一种基于深度强化学习的云边端协同计算卸载方法及系统 |
CN112383931A (zh) * | 2020-11-12 | 2021-02-19 | 东华大学 | 一种多用户移动边缘计算系统中最优化成本和时延方法 |
CN112445617A (zh) * | 2020-11-25 | 2021-03-05 | 中国石油大学(华东) | 一种基于移动边缘计算的负载策略选择方法及系统 |
CN112511336A (zh) * | 2020-11-05 | 2021-03-16 | 上海大学 | 一种边缘计算系统中的在线服务放置方法 |
CN112600869A (zh) * | 2020-11-11 | 2021-04-02 | 南京邮电大学 | 基于td3算法的计算卸载分配方法和装置 |
CN112911647A (zh) * | 2021-01-20 | 2021-06-04 | 长春工程学院 | 一种基于深度强化学习的计算卸载和资源分配方法 |
CN113051003A (zh) * | 2021-03-22 | 2021-06-29 | 中国科学院上海微系统与信息技术研究所 | 卫星通信网络的计算任务卸载处理方法、系统及存储介质 |
CN113067873A (zh) * | 2021-03-19 | 2021-07-02 | 北京邮电大学 | 基于深度强化学习的边云协同优化方法 |
CN113163409A (zh) * | 2021-03-16 | 2021-07-23 | 重庆邮电大学 | 基于人工智能的移动边缘计算服务放置策略 |
CN113342529A (zh) * | 2021-06-18 | 2021-09-03 | 哈尔滨工业大学 | 基于强化学习的无小区大规模多天线架构下移动边缘计算卸载方法 |
CN113391824A (zh) * | 2021-06-29 | 2021-09-14 | 中国农业银行股份有限公司 | 计算卸载方法、电子设备、存储介质以及计算机程序产品 |
CN113434206A (zh) * | 2021-05-26 | 2021-09-24 | 国网河南省电力公司信息通信公司 | 智能电网计算卸载的方法及装置 |
CN113568675A (zh) * | 2021-07-08 | 2021-10-29 | 广东利通科技投资有限公司 | 一种基于分层强化学习的车联网边缘计算任务卸载方法 |
CN113572804A (zh) * | 2021-04-29 | 2021-10-29 | 重庆工程职业技术学院 | 一种基于边缘协作的任务卸载系统、方法及装置 |
CN113590229A (zh) * | 2021-08-12 | 2021-11-02 | 中山大学 | 一种基于深度强化学习的工业物联网图任务卸载方法及系统 |
CN113645637A (zh) * | 2021-07-12 | 2021-11-12 | 中山大学 | 超密集网络任务卸载方法、装置、计算机设备和存储介质 |
CN113778691A (zh) * | 2021-11-10 | 2021-12-10 | 清华大学 | 一种任务迁移决策的方法、装置及系统 |
CN114189877A (zh) * | 2021-12-06 | 2022-03-15 | 天津大学 | 一种面向5g基站的复合式能耗优化控制方法 |
CN114385272A (zh) * | 2022-03-24 | 2022-04-22 | 山东省计算中心(国家超级计算济南中心) | 面向海洋任务的在线自适应计算卸载方法及系统 |
CN114423044A (zh) * | 2022-01-17 | 2022-04-29 | 南京航空航天大学 | 无人机和基站辅助地面用户设备卸载任务数据的空地协同方法 |
CN114727336A (zh) * | 2022-04-21 | 2022-07-08 | 中国联合网络通信集团有限公司 | 一种卸载策略确定方法、装置、电子设备及存储介质 |
CN115016858A (zh) * | 2022-05-24 | 2022-09-06 | 武汉大学 | 一种基于后决策状态深度强化学习的任务卸载方法 |
CN115499441A (zh) * | 2022-09-15 | 2022-12-20 | 中原工学院 | 超密集网络中基于深度强化学习的边缘计算任务卸载方法 |
CN115499876A (zh) * | 2022-09-19 | 2022-12-20 | 南京航空航天大学 | Msde场景下基于dqn算法的计算卸载策略 |
CN115623540A (zh) * | 2022-11-11 | 2023-01-17 | 南京邮电大学 | 一种移动设备的边缘优化卸载方法 |
WO2024037560A1 (zh) * | 2022-08-16 | 2024-02-22 | 天津大学 | 基于边缘计算和有向无环图的多用户协作平台及其方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10037231B1 (en) * | 2017-06-07 | 2018-07-31 | Hong Kong Applied Science and Technology Research Institute Company Limited | Method and system for jointly determining computational offloading and content prefetching in a cellular communication system |
CN109257429A (zh) * | 2018-09-25 | 2019-01-22 | 南京大学 | 一种基于深度强化学习的计算卸载调度方法 |
CN109951897A (zh) * | 2019-03-08 | 2019-06-28 | 东华大学 | 一种能耗与延迟约束下的mec卸载方法 |
CN110798849A (zh) * | 2019-10-10 | 2020-02-14 | 西北工业大学 | 一种超密网边缘计算的计算资源分配与任务卸载方法 |
CN110928654A (zh) * | 2019-11-02 | 2020-03-27 | 上海大学 | 一种边缘计算系统中分布式的在线任务卸载调度方法 |
CN110971706A (zh) * | 2019-12-17 | 2020-04-07 | 大连理工大学 | Mec中近似最优化与基于强化学习的任务卸载方法 |
-
2020
- 2020-05-25 CN CN202010445667.8A patent/CN111726826B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10037231B1 (en) * | 2017-06-07 | 2018-07-31 | Hong Kong Applied Science and Technology Research Institute Company Limited | Method and system for jointly determining computational offloading and content prefetching in a cellular communication system |
CN109257429A (zh) * | 2018-09-25 | 2019-01-22 | 南京大学 | 一种基于深度强化学习的计算卸载调度方法 |
CN109951897A (zh) * | 2019-03-08 | 2019-06-28 | 东华大学 | 一种能耗与延迟约束下的mec卸载方法 |
CN110798849A (zh) * | 2019-10-10 | 2020-02-14 | 西北工业大学 | 一种超密网边缘计算的计算资源分配与任务卸载方法 |
CN110928654A (zh) * | 2019-11-02 | 2020-03-27 | 上海大学 | 一种边缘计算系统中分布式的在线任务卸载调度方法 |
CN110971706A (zh) * | 2019-12-17 | 2020-04-07 | 大连理工大学 | Mec中近似最优化与基于强化学习的任务卸载方法 |
Non-Patent Citations (1)
Title |
---|
郑冰原;孙彦赞;吴雅婷;王涛;: "基于深度强化学习的超密集网络资源分配", 电子测量技术, no. 09 * |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112241295A (zh) * | 2020-10-28 | 2021-01-19 | 深圳供电局有限公司 | 一种基于深度强化学习的云边端协同计算卸载方法及系统 |
CN112148464A (zh) * | 2020-10-30 | 2020-12-29 | 深圳供电局有限公司 | 一种移动边缘计算任务的卸载方法及系统 |
CN112148464B (zh) * | 2020-10-30 | 2023-07-07 | 深圳供电局有限公司 | 一种移动边缘计算任务的卸载方法及系统 |
CN112511336A (zh) * | 2020-11-05 | 2021-03-16 | 上海大学 | 一种边缘计算系统中的在线服务放置方法 |
CN112600869A (zh) * | 2020-11-11 | 2021-04-02 | 南京邮电大学 | 基于td3算法的计算卸载分配方法和装置 |
CN112383931A (zh) * | 2020-11-12 | 2021-02-19 | 东华大学 | 一种多用户移动边缘计算系统中最优化成本和时延方法 |
CN112445617A (zh) * | 2020-11-25 | 2021-03-05 | 中国石油大学(华东) | 一种基于移动边缘计算的负载策略选择方法及系统 |
CN112911647A (zh) * | 2021-01-20 | 2021-06-04 | 长春工程学院 | 一种基于深度强化学习的计算卸载和资源分配方法 |
CN113163409A (zh) * | 2021-03-16 | 2021-07-23 | 重庆邮电大学 | 基于人工智能的移动边缘计算服务放置策略 |
CN113163409B (zh) * | 2021-03-16 | 2022-09-20 | 重庆邮电大学 | 一种基于人工智能的移动边缘计算服务放置方法 |
CN113067873A (zh) * | 2021-03-19 | 2021-07-02 | 北京邮电大学 | 基于深度强化学习的边云协同优化方法 |
CN113051003A (zh) * | 2021-03-22 | 2021-06-29 | 中国科学院上海微系统与信息技术研究所 | 卫星通信网络的计算任务卸载处理方法、系统及存储介质 |
CN113572804B (zh) * | 2021-04-29 | 2023-06-30 | 重庆工程职业技术学院 | 一种基于边缘协作的任务卸载系统、方法及装置 |
CN113572804A (zh) * | 2021-04-29 | 2021-10-29 | 重庆工程职业技术学院 | 一种基于边缘协作的任务卸载系统、方法及装置 |
CN113434206A (zh) * | 2021-05-26 | 2021-09-24 | 国网河南省电力公司信息通信公司 | 智能电网计算卸载的方法及装置 |
CN113342529B (zh) * | 2021-06-18 | 2024-03-29 | 哈尔滨工业大学 | 基于强化学习的无小区大规模多天线架构下移动边缘计算卸载方法 |
CN113342529A (zh) * | 2021-06-18 | 2021-09-03 | 哈尔滨工业大学 | 基于强化学习的无小区大规模多天线架构下移动边缘计算卸载方法 |
CN113391824A (zh) * | 2021-06-29 | 2021-09-14 | 中国农业银行股份有限公司 | 计算卸载方法、电子设备、存储介质以及计算机程序产品 |
CN113568675B (zh) * | 2021-07-08 | 2024-04-12 | 广东利通科技投资有限公司 | 一种基于分层强化学习的车联网边缘计算任务卸载方法 |
CN113568675A (zh) * | 2021-07-08 | 2021-10-29 | 广东利通科技投资有限公司 | 一种基于分层强化学习的车联网边缘计算任务卸载方法 |
CN113645637A (zh) * | 2021-07-12 | 2021-11-12 | 中山大学 | 超密集网络任务卸载方法、装置、计算机设备和存储介质 |
CN113590229A (zh) * | 2021-08-12 | 2021-11-02 | 中山大学 | 一种基于深度强化学习的工业物联网图任务卸载方法及系统 |
CN113590229B (zh) * | 2021-08-12 | 2023-11-10 | 中山大学 | 一种基于深度强化学习的工业物联网图任务卸载方法及系统 |
CN113778691A (zh) * | 2021-11-10 | 2021-12-10 | 清华大学 | 一种任务迁移决策的方法、装置及系统 |
CN114189877A (zh) * | 2021-12-06 | 2022-03-15 | 天津大学 | 一种面向5g基站的复合式能耗优化控制方法 |
CN114189877B (zh) * | 2021-12-06 | 2023-09-15 | 天津大学 | 一种面向5g基站的复合式能耗优化控制方法 |
CN114423044A (zh) * | 2022-01-17 | 2022-04-29 | 南京航空航天大学 | 无人机和基站辅助地面用户设备卸载任务数据的空地协同方法 |
CN114385272B (zh) * | 2022-03-24 | 2022-07-05 | 山东省计算中心(国家超级计算济南中心) | 面向海洋任务的在线自适应计算卸载方法及系统 |
CN114385272A (zh) * | 2022-03-24 | 2022-04-22 | 山东省计算中心(国家超级计算济南中心) | 面向海洋任务的在线自适应计算卸载方法及系统 |
CN114727336B (zh) * | 2022-04-21 | 2024-04-12 | 中国联合网络通信集团有限公司 | 一种卸载策略确定方法、装置、电子设备及存储介质 |
CN114727336A (zh) * | 2022-04-21 | 2022-07-08 | 中国联合网络通信集团有限公司 | 一种卸载策略确定方法、装置、电子设备及存储介质 |
CN115016858A (zh) * | 2022-05-24 | 2022-09-06 | 武汉大学 | 一种基于后决策状态深度强化学习的任务卸载方法 |
CN115016858B (zh) * | 2022-05-24 | 2024-03-29 | 武汉大学 | 一种基于后决策状态深度强化学习的任务卸载方法 |
WO2024037560A1 (zh) * | 2022-08-16 | 2024-02-22 | 天津大学 | 基于边缘计算和有向无环图的多用户协作平台及其方法 |
CN115499441A (zh) * | 2022-09-15 | 2022-12-20 | 中原工学院 | 超密集网络中基于深度强化学习的边缘计算任务卸载方法 |
CN115499876A (zh) * | 2022-09-19 | 2022-12-20 | 南京航空航天大学 | Msde场景下基于dqn算法的计算卸载策略 |
CN115623540B (zh) * | 2022-11-11 | 2023-10-03 | 南京邮电大学 | 一种移动设备的边缘优化卸载方法 |
CN115623540A (zh) * | 2022-11-11 | 2023-01-17 | 南京邮电大学 | 一种移动设备的边缘优化卸载方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111726826B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111726826A (zh) | 一种基站密集型边缘计算网络中的在线任务卸载方法 | |
CN112118601B (zh) | 一种减少6g数字孪生边缘计算网络任务卸载延迟的方法 | |
Chen et al. | Energy-efficient task offloading and resource allocation via deep reinforcement learning for augmented reality in mobile edge networks | |
Tang et al. | Computational intelligence and deep learning for next-generation edge-enabled industrial IoT | |
Wu et al. | Deep reinforcement learning-based computation offloading for 5G vehicle-aware multi-access edge computing network | |
CN112105062B (zh) | 时敏条件下移动边缘计算网络能耗最小化策略方法 | |
Tang et al. | Energy efficient power allocation in cognitive radio network using coevolution chaotic particle swarm optimization | |
Chen et al. | Dynamic computation offloading with energy harvesting devices: A graph-based deep reinforcement learning approach | |
Qin et al. | Collaborative edge computing and caching in vehicular networks | |
CN113543342B (zh) | 基于noma-mec强化学习资源分配与任务卸载方法 | |
Khoramnejad et al. | On joint offloading and resource allocation: A double deep q-network approach | |
Zhang et al. | Joint offloading and resource allocation using deep reinforcement learning in mobile edge computing | |
Zhang et al. | A deep reinforcement learning approach for online computation offloading in mobile edge computing | |
Zhang et al. | Two time-scale caching placement and user association in dynamic cellular networks | |
CN116634500A (zh) | 基于超图匹配计算与通信容量增强的d2d计算卸载方法 | |
CN114090108B (zh) | 算力任务执行方法、装置、电子设备及存储介质 | |
Zhao et al. | Adaptive resource allocation for mobile edge computing in internet of vehicles: A deep reinforcement learning approach | |
Zhang et al. | An efficient computation offloading and resource allocation algorithm in RIS empowered MEC | |
Li et al. | Joint access point selection and resource allocation in MEC-assisted network: A reinforcement learning based approach | |
Jiang et al. | A collaborative optimization strategy for computing offloading and resource allocation based on multi-agent deep reinforcement learning | |
Yang et al. | Training efficiency of federated learning: A wireless communication perspective | |
Ho et al. | A DDPG-based energy efficient federated learning algorithm with SWIPT and MC-NOMA | |
CN116828534B (zh) | 基于强化学习的密集网络大规模终端接入与资源分配方法 | |
Yan et al. | Energy-efficient content fetching strategies in cache-enabled D2D networks via an Actor-Critic reinforcement learning structure | |
Du et al. | An apprenticeship learning scheme based on expert demonstrations for cross-layer routing design in cognitive radio networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |